- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
XX云TI平台的
大模型精调解决方案
大模型落地痛点
行业知识、模型训练稳定性、资源利用率、国产化适配
TI
案
大模型精调解决方
大模型精调全生命周期的方法论与全流程陪跑
TI精调的核心优势
自研大模型、大规模预训练、自研加速、国产化适配
案例分享
大模型摘要;
大模型问答
大模型在业务场景落地的痛点
大模型落地业务场景的痛点
模型欠缺行业知识通用领域大模型百花齐放,但都不具备特定行业的独有知识,
模型欠缺行业知识
通用领域大模型百花齐放,但都不具备特定行业的独有知识,欠缺行业属性导致无法落地实际业务
需提高资源利用率
分布式训练需要高效的资源调度管理系统,减少节点资源碎片提高调度成功率;支持虚拟GPU调度提高容器资源利用率
需国产化适配
响应国家政策,摆脱国外资源限制,需要从硬件服务器芯片、操作系统、模型等多个层面完成国产化适配
大模型训练需耗费大量GPU资源且训练周期长,对训练平台的稳定性、故障隔离性、自动容错性等底座能力,以及断点续训能力考验极大
TI的大模型精调解决方案
TI的一站式大模型精调解决方案
MaaS
TI平台
技术底座
客户专属大模型
传媒行业大模型精调解决方案
平台工具
TI-DataTruth
TI-DataTruth数据标注平台
TI-Matrix应用平台
TI-ONE训练平台
传媒大模型政务大模型……文旅大模型金融大模型高性能计算集群HCC高性能网络:自研星脉计算网络架构行业大模型教育大模型
传媒大模型政务大模型
……
文旅大模型金融大模型
高性能计算集群HCC
高性能网络:自研星脉计算网络架构
行业大模型
教育大模型
基础设施
向量数据库
太极Angel加速组件
TI对大模型开发全生命周期的一体化方法论
模型选型
模型选型训练共建部署应用
性能评测效果评测模型注册模型发布脱敏合规模型评测训练数据准备应用场景知识挖掘+增强数据清洗+
性能评测效果评测
模型注册模型发布
脱敏合规
模型评测
训练数据准备
应用场景
知识挖掘+增强数据清洗+切块向量库建设+维护
模型管理
数据评估
资源评估
服务发布训练平台搭建推理框架加速推理服务部署
服务发布
训练平台搭建
环境搭建服务开通交付方案项目排期资源采购
环境搭建服务开通
交付方案项目排期
资源采购
有监督训练
模型训练内容安全
模型训练
人工反馈
业务形态强化学习
业务形态
应用联调
训练框架加速
需要客户深度参与
TI精调的核心优势
核心优势1—自研模型:混元大模型
多轮对话知识增强逻辑推理内容创作预训练超2万亿token语料优化预训练算法及策略
多轮对话
知识增强
逻辑推理
内容创作
预训练
超2万亿token语料优化预训练算法及策略
精调及强化学习
改进注意力机制开发思维链
新算法
AngelPTM训练框
架
相比业界主流框架提升
1倍训练速度
AngelHCF推理框
架
推理速度相比业界主流框架提升1.3倍
四大
核心能力
创新
大模型训练
自研机器学习框架
超千亿参数规模(蒸馏出百亿级模型),全链路自主研发,从零训练自主创新
超千亿参数规模
核心优势1—自研模型:混元大模型
代码子项STEM子项混元混元GPT-3.5GPT-3.5GPT-4GPT-4010203040
原创力文档


文档评论(0)