ChatGPT，深度拆解AI算力模型.pdfVIP

下载本文档

17
0
约1.71万字
约 12页
2023-05-01 发布于北京
举报
版权申诉

ChatGPT，深度拆解AI算力模型.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

证券研究报告|行业动态报告 1.ChatGPT，深度拆解AI 算力模型 1.1．ChatGPT 算法的核心壁垒 A I 的完整算法生成分为五部分分别是数据收集、数据清洗、模型训练、模型测试、模型部署和反馈。图表 1 A I算法的全流程核心壁垒一，庞大的数据训练数据。数据是所有人工智能(或大数据)的“燃料”，根据 appen 的数据，ChatGPT 的前身 GPT-3 就使用了 3,000 亿单词、超过 40T 的大规模、高质量数据进行训练。ChatGPT 在其基础上，加入了人工打标的监督学习，即对话式模型给出结果后，由训练师对结果做出评价并修改结果以更贴切对话内容。原因，往往愈发庞大的“燃料”意味着模型的精准度的提升，数据量的大小跟深度学习(大数据)的准确度庞大的正相关。此外，数据量的大小对于运算计算机算力的要求往往呈现指数级别的关系，这也是强大算法的核心需求。原因是数据清洗和数据标注的核心意义就是将人们理解的非结构化数据转变成计算机可以理解的结构化数据。可以将人工智能的本质理解成矩阵的运算，矩阵的维度往往代表着数据特征的维度，这也是训练神经网络参数的基础，一般情况下，数据维度越多，模型参数量越多，模型越复杂，模型的准确度越高，对算力的指数需求越高。本质是数据维度与算力指数呈现正相关。(不考虑参数堆积、模型过拟合的情况) 4 证券研究报告|行业动态报告图表2 模型的准确度和数据数量呈现正相关图表 3 A I 需求呈现指数级别的增长第二，模型训练方面，ChatGPT 强大的底层技术是Transformer 算法，该算法正逐步取代 RNN(循环神经网络) 。Transformer 算法在神经网络中具备跨时代的意义: RNN和CNN 已经广泛应用于序列模型、语言建模、机器翻译并取得不错效果，然而在算法上仍有一定限制和不足。Transformer 具备跨时代的意义的原因是算法上添加了注意力机制，这种机制具备突破性的原因在于1、突破了RNN 模型不能并