- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
在办公方向的实践与思考分享人:阿里巴巴钉钉李祎嵩钉钉文档DINGTALKDOCS
02钉钉AI助理架构03大模型训练的实践和思考04展望与思考01大模型在钉钉办公场景案例
大模型在钉钉办公场景案例
AI助理生成周报
文档翻译
文档LUI
文档LUI
白板涂鸦作画
白板图片风格迁移
白板智能海报
IM文件速读
IM视频速读
IM图片速读
钉钉AI助理架构
大模型训练的实践和思考
01大模型训练概述大模型训练的起手式
02大模型训练核心流程大模型训练的起手式SFT在业务上的思考核心流程标注数据,用于SFT根据人类反馈,训练奖励模型通过强化学习优化模型产品设计生成多张图片让用户选择点赞和点踩回流用户反馈数据
03SFT与RLHF大模型训练的起手式微调是指在已经预训练好的大模型基础上,使用特定数据集进行进一步的训练,使模型适应特定任务或领域。SFT可以激发模型解决问题的能力,让模型能够准确地理解用户指令,给出合理的输出结果。简单来说,微调主要目的是完成知识注入和指令对齐SFTSFT、训练奖励模型(RewardModel,RM)、强化学习(ReinforcementLearning,RL)。RLHFDPODPO的目的和RLHF一样都是可以让模型的输出更偏向于人类喜好,但是相比RLHF,DPO不依赖于明确的奖励建模或强化学习,性能和计算成本更加轻量级。
04SFT常用方法大模型训练的起手式LoRA在原模型旁边增加一个旁路,通过低秩分解(先降维再升维)来模拟参数的更新,在训练时只训练矩阵A和B。FullParameterFineTuning通过更新所有参数来最大程度地优化模型对新任务的理解和表现。FFT训练成本比较高,因为参数量和预训练的相同。Adapter-basedTuning一种以串行形式加入到原模型中的模块,使模型在推理时的速度降低了4%-6%,这使得在实际部署中往往不会考虑Adapter方法。PrefixTuningPrefixTuning在每个Attention层都加入PrefixEmbedding来增加额外的参数。
05数据更加重要大模型训练的起手式ChatmodelORbasemodel预训练模型选择数据过于领域的数据会灾难性遗忘,但也某些实际业务场景,可以通过意图识别+业务专属模型解决。数据过多可能导致过拟合文本数据中,短文本多用户交互,更多长文本均使用“文件”形式表达,“文档理解”尤为重要。参数LR、warmup、Epoch的目是让Loss更快收敛
文档格式转换钉钉文档转换为各种类型文档,长图、PDF、word、ppt..各类型文件的相互转换场景分析一:文档生成长图文档格式引擎
文档格式解析文档与大模型交互,文档还原度决定模型效果。超大文档、超长文档如何解决。场景分析二:文档速读场景文档格式引擎
场景分析三:文档问答场景RAG:文档理解、分片、向量化Query优化、召回策略排序策略架构/产品:先学习,在检索文档格式引擎
OOXML文档格式引擎
MarkuplanguagesOOXML核心OPC文档格式引擎
WordprocessingMLDocx是什么内存结构文档格式引擎
docx举个例子内存结构文档格式引擎文档格式引擎
PDF举个例子协议数据文档格式引擎文档格式引擎
大模型训练实践-AIPPT产品形态生成一个PPT训练模型生成PPT核心问题
大模型训练实践-AIPPTPPT内存结构训练目标
复杂场景的推理与训练基于分治推理方案,整体任务使用树描述遍历推理。推理具备拆解任务的dataset具备叶子结点独立计算的dataset具备任务回溯父节点的dataset训练
展望与思考
安全更加重要模型训练的数据安全模型应用的数据安全
大模型效果持续提升多模态迅速发展大模型成本持续降低
Thanks!钉钉文档DINGTALKDOCS
钉钉?证中国企业数字化升级之路
钉钉文档DINGTALKDOCS钉钉数字人开通体验文档格式转换、AI合作文档私有化部署技术交流钉钉微信
您可能关注的文档
最近下载
- 阿法拉伐分油机中文说明Instruction book1.pdf VIP
- 《Java程序设计》教案(思政版).docx VIP
- 四年级上册数学《三位数乘两位数的笔算乘法》(共18张PPT).pptx VIP
- AWS B4.0-2016 焊缝机械测试的标准方法(中文版).pdf
- 《绩效与薪酬管理》课程教学大纲(中文).docx VIP
- 国开电大学习网网络安全技术形考任务答案.pdf VIP
- 成长赛道飞机机电设备维修专业1500字.pptx VIP
- 从业人员食品安全知识培训计划及培训考核记录.docx VIP
- GB50641-2010 有色金属矿山井巷安装工程施工规范.docx VIP
- 胃癌根治术的手术护理查房2讲课文档.ppt VIP
文档评论(0)