网站大量收购独家精品文档,联系QQ:2885784924

DeepSeek银行部署加速,AI金融应用迎来跃迁.pdf

DeepSeek银行部署加速,AI金融应用迎来跃迁.pdf

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

核心观点

◼DeepSeek开源使金融机构能够轻松获得前沿模型能力,且大幅降低部署成本。其通过对训练方式、算法架构和推理方

法的工程化优化大幅降低了部署成本。近期采用大规模RL训练方法的阿里QwQ-32B等模型也在缩小规模的同时达到了

DeepSeekR1671B的应用效果,有望进一步催生银行落地应用。

◼我们认为金融行业人工智能的应用价值大体可以分为三个层次:降本增效,价值创造与决策赋能。在实际银行落地应用

中,可能包括:1)降本增效:智能客服、信贷审批、合同质检;2)价值创造:AI编程、智能风控、智能营销等;3)决

策赋能:深度分析和决策辅助。

◼从实际落地应用情况看,大行发力更早,中小银行正在快速追赶。如工商银行、建设银行、招商银行等大行布局更早,

邮储银行、浦发银行、江苏银行等也有较为领先布局应用。AI一体机的出现为机构提供了全新的解决方案,凭借其开箱

即用、软硬件一体化设计等优势,正在成为很多中小银行智能化转型的重要选择。

◼建议关注:宇信科技、京北方、天阳科技、长亮科技、百融云等。

◼风险提示:AI技术落地不及预期、竞争加剧、信息更新不及时等。

2

目录

DeepSeek开源、低成本、强推理

CCONTE

1助推银行业应用

CONTENTS

3

性能:后训练阶段大规模应用强化学习,表现推理能力扩展

◼DeepSeek模型在Post-Train阶段大规模应用了强化学习方法。R1使用了冷启动+大规模强化学习方法,R1-Zero版本模

型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和long-CoT能力涌现等)。

图表:随步数提升R1-Zero的AIME任务准确度图表:深度思考能力提升

DeepSeek-R1-Zero的能力随步数提升DeepSeek-R1-Zero自然涌现long-CoT能力

资料来源:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsvia资料来源:DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsvia

ReinforcementLearning,ReinforcementLearning,

4

性能:DeepSeek推理架构优化,可适配银行高并行、高响应的业务场景

◼DeepSeek通过优化训练方法显著降低了算力消耗,使其在大规模数据处理中的成本更具优势。它在MoE架构的基础上,

通过多头潜注意力机制(Multi-HeadLatentAttention,MLA)进行优化;在后训练阶段采用冷启动+大规模强化学习方

式,不再使用传统SFT做大规模监督微调,甚至绕过了一些CUDA,采用PTX汇编来提升能力;在推理场景下通过大规模

跨节点专家并行(ExpertParallelism,EP)来优化通信开销,尽可能实现负载均衡。

图表:DeepSeekR1架构图图表:DeepSeekR1训练方法

资料来源:DeepSeek,资料来源:木尧,

5

开源易获得:DeepSeek使私有化部署

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档