- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大模型在辅助编程及运维方面的探索
产险信息技术部李岩峰、王赫、徐建超、舒勇、黄达洋
一、大模型介绍
大模型通常指具有庞大参数量(通常以数亿或数十亿计),经过大量数据进行预训练的深度学习模型。这些模型能够捕捉和理解人类语言的复杂,具有强大的生成与理解能力。以Transformer架构为基础,增强了模型在处理长序列任务时的效率和效果。极大地体现了自然语言处理(NLP)领域的显著进步。
大模型通过无监督学习进行大规模的语言建模预训练,使其具备强大的语言生成(LanguageGeneration)和理解
(LanguageComprehension)能力。在预训练阶段,模型利用海量文本数据学习语言的语法、语义和世界知识,形成丰富的词向量表示(WordEmbeddings)和上下文关系映射。随后,在微调阶段(Fine-Tuning),通过监督学习,模型能够在特定任务数据的指导下进一步优化性能,达到在多个下游任务中表现卓越的能力。
此外,大模型还引入了一系列安全和伦理措施,包括偏差校正、对抗性示例训练等,以减少潜在的滥用风险,确保模型在实际应用中的可靠性和安全性。大模型的推出和不断迭代,无疑为自然语言处理技术的发展注入了新的动力,为
各行各业的智能应用和创新拓展了更为广阔的前景。
二、辅助编程
1、辅助编程介绍
辅助编程(AI-assistedcoding)是一种通过生成式预训练Transformer模型辅助软件开发的新兴技术。该技术利用预训练模型在自然语言处理(NLP)中的强大能力,通过理解和生成代码,为开发者提供高效的编码支持。
2、阳光保险在辅助编程应用现状
目前阳光保险已发布最新GPT辅助编程工具常青藤版本V1.5,目前已在产、寿、集团、数科等公司推广,用户数达500人以上,目前正在全科技条线全面推广。
“常青藤”是阳光数科完全自研的产品,在产品核心能力和功能方面,与目前国内外主流的商业产品相近,但用户体验方面还在持续优化,对比结果如下:
表1:与国外主流商业产品对比表
能力
Copilot
阿里通义灵码
常青藤辅助编程
交互方式
支持实时补全和智能问答框两种方式:
实时补全:直接在编辑区生成代码;智能问答:以问
答框的方式展示生成结果。
内容输出形式:
流式输出
代码生成以实时补全方式或问答框交互;
其他功能如代码解释、生成单元测试等以问答框方式展示。
内容输出形式:流式输出。
同阿里和copilot类似,所有功能都可以以问答框的方式展示,不同模型不同问答框,同一模型也可以分多个会话展示,生成结果可以一键自动插入到光标位置。
同时对于代码生成,也可以通过快捷键在编辑区直接生成。
内容输出形式:一次性输出。
多模型切换
不支持
不支持
支持,可对接各种模型,使用中用户可灵活切换模型
代码生成代码补全
行级和函数级代码生成
行级和函数级生成,也可以生成spring后台的类和配置文件
行级和函数级生成,也可以生成spring后台的类和配置文件
代码注释代码解释单元测试Bug查找
支持
支持
支持
安全监测
性能优化
支持
支持
支持
功能扩展
不支持
不支持
用户可根据个性需求自定义功
能
token数量限制
不确定
32k
16k,使用的模型的是gpt-35-turbo-16
代码上下文自动分析
支持
支持
支持
从使用效果来看,当前“常青藤”同市场上主流的商业GPT辅助编程工具一样,在代码注释生成、代码解释、智能问答等方面生成质量高、应用效果好,是开发人员使用最多的场景。但在保险业务代码生成方面,普遍存在生成质量不高、采纳率低的问题,其核心原因是当前大模型对保险专业领域知识的理解和推理能力较弱。因此GPT辅助编程可以辅助开发人员提升效率,但是对于保险业务代码生成效果还远达不到替代人的程度。
3、大模型代码能力未来发展方向
第一,提高代码语料质量,扩充代码相关多模态数据集。全面提升大模型训练集中代码语料的质量,使语料覆盖高质
量的代码仓库,设置合理的过滤规则,确保语料具有合理的文件长度、代码行长度、字母数字比,从而获得完整、安全、正确、干净和通用的代码语料库。大模型的代码任务通常是多模态的任务,需要同时理解自然语言、数学公式和代码语言的信息,通过构造多模态对齐数据集,提升大模型对代码相关跨模态任务的解决能力。
第二,加强代码安全对齐算法。自然语言需要伦理道德对齐,代码也亟需安全对齐。在设计RLHF阶段需要代码安全专家的介入,训练模型生成安全无漏洞代码的倾向,同时可以设计相关程序的测试流程,完成语法语义正确性的自动对齐。
第三,拓展大模型上下文窗口。不同于自然语言任务,代码相关的各项任务对上下文窗口的长度都极为敏感,提升大模型的上下
您可能关注的文档
- 【DeepSeek市场报告】全球大类资产观察:DeepSeek的扰动与关税再敲门-东吴证券-2502.pptx
- 【DeepSeek市场报告】计算机行业人工智能系列深度:DeepSeek十大关键问题解读-25021.pptx
- 【DeepSeek市场报告】AI行业跟踪报告第55期:DeepSeek投资机会梳理-250210-光.docx
- 【DeepSeek市场报告】DeepSeek本地部署与全球资产配置组合跟踪——全球大类资产配置和A股.pptx
- 【DeepSeek市场报告】计算机行业:DeepSeek激活创新竞争,AI应用迎来“安卓时刻”-25.pptx
- 【DeepSeek市场报告】传媒行业2月投资策略:春节档票房创新高,DeepSeek加速AI应用安卓.pptx
- 【DeepSeek市场报告】计算机行业25W6:多家教育公司拥抱DeepSeek,有望加速AI教育产.pptx
- 【DeepSeek市场报告】Tencent Corporate Overview_EN【互联网】【公.pptx
- 【DeepSeek运用手册】职场必备AI工具分享【AI工具合集】.pptx
- 【DeepSeek市场报告】计算机行业:DeepSeek+R1深度解析及算力影响几何-250203-.pptx
最近下载
- 2025年(完整版)社区网格员考试复习资料.pdf VIP
- 医院感染控制的交叉感染防护.pptx VIP
- 冰雪经济-时政押题-2025年统编版高考政治必备知识与时政热点.pdf VIP
- 2024年同等学力申硕公共管理综合真题.docx
- 完整《进一步加强和改进流动党员管理工作的意见》.ppt VIP
- 世界防治结核病日结核病防治常识PPT.pptx VIP
- 个人防护与交叉感染的防控.pptx VIP
- 高教版 职业道德与法治 第三课增强职业道德意识.pptx VIP
- 2025年无锡工艺职业技术学院单招职业适应性测试题库及一套参考答案.docx VIP
- 标准图集 - 16J916-1 住宅排气道(一).pdf
市场分析:提供详细的市场规模、市场趋势、市场需求以及竞争格局的分析,帮助客户了解行业的现状和发展前景。 竞争对手研究:深入分析主要竞争对手的市场份额、业务模式、优势劣势等,提供差异化竞争策略建议。 行业动态:跟踪行业最新的政策法规、技术创新和市场动向,帮助客户及时掌握行业变化。 客户需求分析:研究目标客户的偏好、消费习惯和需求变化,为产品定位和市场营销提供支持。 投融资分析:分析行业内的投融资活动和资本流向,帮助客户评估投资机会和风险。
文档评论(0)