- 1、本文档共75页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
0
2
3
1.1大语言模型技术发展概述
语言建模(LanguageModel)可分为四个发展阶段,分别为统计语言模型、神经语言
模型、预训练语言模型、大模型语言模型。
其中最早的统计语言模型基于统计学习来预测单词,而后演进成为神经语言模型基于
神经网络方法预测单词。在神经网络语言模型中,通过使用神经网络,将单词映射为
向量作为网络模型的输入来估计单词序列的概率。随着注意力机制被引入,注意力层
(AttentionLayers)在文本中建立了词之间的相关性,使得模型在生成下一个单词
时,考虑到整体语句的意思,从而建立了Transformer架构,提升了模型理解和生成
语言的能力。
但随着参数的增加,需要大量人力来标注数据,因此OpenAI提出了预训练语言模型
(GenerativePre-TrainedTransformer),通过无监督学习在大规模无标签语料库
上进行预训练任务,在预训练中模型学会了基于前一个单词预测后一个单词。除此之
外,模型还可以针对特定的任务基于更小的数据集进行微调,提升在特定领域的性能。
基于此,通过不断叠加数据增加模型参数规模以及优化模型的提示工程,不仅可以解
决更复杂的任务,同时也拥有了更强大的文本涌现能力,从而演进成为大模型语言模
1
型(以下简称“大模型”)。
大模型浪潮爆发后,国内各企业纷纷推出自研大模型,大模型应用迎来了蓬勃发展的
阶段。据测算,我国2030年基于大模型的生成式人工智能市场规模有望突破千亿元
人民币。
与此同时,国内垂直行业领域的大模型也成为各个行业头部企业未来的发展趋势之一,
其中前沿的垂类大模型涉及领域包括媒体影视、电商、广告营销、游戏、医疗、教育
1
Zhaoetal,《ASurveyofLargeLanguageModels》
4
及金融行业。比如在金融领域,大型科技企业如华为推出了盘古金融大模型,而蚂蚁
集团则在外滩大会发布了金融大模型“AntFinGLM”并应用于蚂蚁集团内部产品“支
小宝”和“支小助”。
金融行业大模型在所有行业垂直大模型中落地速度相对较快。金融领域拥有天然的大
量数据积淀,从而为大模型应用提供了良好的数据基础。同时金融领域大模型的应用
场景较多,基于这些不同的场景,大模型有助于从不同角度提升原有从业人员及机构
的工作效率。比如大模型情绪分析的功能可帮助从业者基于投资者情绪状态预测股票
的价格;大模型精确度的提升可帮助从业者预测市场走势,大模型可基于过去大量的
金融数据学习预测未来市场趋势帮助投资者和金融机构做出更合理的决策;而复杂任
务的处理可协助从业者将大模型用于交易策略上,通过分析大量交易信息,大模型或
可识别交易中的风险参数并给出风险防控策略。
1.2大模型引领中国金融领域科技的国际化发展
因此,通过提升金融服务的效率和质量,大模型可提升我国金融机构的核心竞争力。
首先大模型的自然语言理解与内容生成能力可以与用户进行多轮问答对话,提升金融
客服的服务效率。其次,通过大模型进行智能数据挖掘处理,金融机构能够更快速准
确地获取市场趋势的洞察,做出更明智的决策。同时,大模型可以迅速了解各国的法
律、监管规定和市场动态,为金融机构提供国际化的业务洞察和决策支持,帮助中国
从业者更好地理解和适应国际市场的业务需求和规则。
海外金融科技公司已经在积极探索和持续深化大模型在金融服务领域的应用。
Bloomberg已推出BloombergGPT,一个基于500亿参数训练的应用于金融领域自然语
言处理的大模型。据研究,当前此大模型在金融任务包括金融资讯分类任务(FPB),
预测特定领域的金融新闻及话题(FiQASA),股指推理(ConFinQA)等特定任务上的
表现大幅领先于现有的近似规模的开放模型
您可能关注的文档
- 2023年中国车路协同发展研究报告.pdf
- 2024中国餐饮品牌出海东南亚研究报告(新加坡篇).pdf
- 环保行业:欧盟净零工业法案&欧洲氢能银行要点梳理(202303).pdf
- 人形机器人行业深度报告:人形机器人从0到1,国产化&软件赋能带来行业变革(202404).pdf
- 信息技术-计算机行业智能仓储行业报告:仓安四海,智拓八方(202303).pdf
- 医药健康行业深度报告:助眠需求日益增长,睡眠经济市场广阔.pdf
- 中国智能仓储市场调研报告(2023版).pdf
- 公路工程档案验收自检报告(模版).docx
- 2021-2026年中国集装箱船工业行业市场全景调研及投资规划建议报告.docx
- 测绘安全生产检查报告.docx
最近下载
- 《基于学科核心素养的初中英语文本解读教学的研究》开题报告文献综述10000字.doc
- fagor发格CNC 8055_M_操作手册_1110.pdf
- 实用俄语会话智慧树知到期末考试答案2024年.docx
- 四川轻化工大学2019-2020学年《实验心理学》期末考试试卷(A卷)含参考答案.docx
- 江苏师范大学2020-2021学年第1学期《高等数学(上)》期末考试试卷(A卷)及标准答案.pdf
- 《中国现代诗歌精选》.ppt
- 四川轻化工大学2021-2022学年《实验心理学》期末考试试卷(A卷)含参考答案.docx
- 2023-2024学年湖南省长沙市望城县数学六上期末经典试题含答案.doc
- 食品工用具色标管理制度.doc VIP
- 垃圾收集、清运服务以及安全保障措施.docx VIP
文档评论(0)