中美科技巨头的AI大模型竞赛：GPT裂变时刻.docxVIP

下载本文档

12
0
约2.93万字
约 42页
2023-05-21 发布于北京
举报
版权申诉

中美科技巨头的AI大模型竞赛：GPT裂变时刻.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

AI 技术发展历程 1.1. 早期 AI 时期（1943 – 1960s）神经元模型神经元模型的诞生为 AI 研究领域的出现奠定了理论基础。1943 年，心理学家沃伦﹒麦卡洛克（Warren McCulloch）和沃尔特﹒皮茨（Walter Pitts）首次提出了被称为神经元计算的数学模型（Neural Model），该模型将生物神经元的工作原理简化为二进制阈值逻辑，这也成为了后续 AI 学科最重要的基础之一。图灵测试图灵测试印发机器人是否能具备人类的智能思考。1950 年，英国计算机科学家艾伦﹒麦席森﹒图灵在其论文《Computing Machinery and Intelligence》中提出了著名的图灵测试实验（Turing Test），其目的是通过自然语言对话来判断计算机是否能产生与人无法区分的智能，这一实验也引发了大规模的思考：机器人能够否过编程语言从而具有人智。图 1：艾伦﹒麦席森﹒图灵进行图灵测试实验 PHYS.ORG 达特茅斯会议达特茅斯会议确立 AI 成为一个研究领域。1956 年，John McCarthy 在达特茅斯会议（Dartmouth Conference）上首次提出 AI 概念，标志着 AI 从此作为了一个独立的研究领域的诞生。图 2：达特茅斯会议主要参加成员 CSDN 符号主义早期 AI 主要学派符号主义是一种基于逻辑推理的智能模拟方法。符号主义（Symbolic）也被称为是逻辑主义，是早期 AI 的主要学派，其认为人类认知的基本单位是具有意义的表示符号，而智能则体现在符号的表示和运算过程中。1955 年，艾伦﹒纽厄尔（Allen Newell）和哈伯特﹒西蒙（HerBert A. Simon）首次提出了逻辑理论机（Logic Theorist）的概念，这是第一个依赖符号操作的 AI 程序。 1959 年，他们进一步开发了通用问题求解器（General Problem Solver）程序，该程序能通过递归分解方式解决复杂问题。受到符号主义研究的启发，约瑟夫﹒维森鲍姆（Joseph Weizenbaum）于 1966 年开发了 ELIZA，这是一个能模拟心理治疗师并根据用户描述提供诊疗意见的程序。图 3：Eliza 系统对话效果 Thought Catalog 感知机与神经网络感知机是 AI 经典理论神经网络的早期代表模型。1958 年，美国心理学家弗兰克﹒罗森布拉特首次引入了感知机模型（Perceptron），作为早期神经网络理论（Neural Network）的典型模型，它尝试模拟生物神经元的功能来进行实验。然而，感知机仅具有单层神经元结构，并进行线性分类，但难以处理复杂的非线性问题。在感知机的基础上，后续神经网络研究发展出多层结构和更强的表达能力，能应对更复杂的非线性问题。通过优化训练算法和权重调整，神经网络实现了更有效的数据拟合和分类。图 4：感知机与神经网络模型知乎 1.2. 专家系统时期（1970s – 1980s）专家系统专家系统尝试利用过往经验来把计算机程序训练成某一个领域的专家。专家系统（Expert System）作为 AI 研究起步阶段的重要代表，是一种模拟人类具体领域专家的知识和经验的智能计算机程序，通过推理模型，解决那些需要人类专家才能处理的复杂问题，其核心是知识库（领域专家的知识和经验）和推理机（根据知识库内容对问题进行求解）。 1970 年代初，斯坦福大学 AI 研究团队开发了 DENDRAL 系统，利用质谱数据预测分子结构，成为历史上第一个专家系统。它证明了计算机程序在解决实际问题上具有专业知识吸收能力。在长时间研发后，斯坦福大学的另一个研究团队于 1972-1978 年间开发了 MYCIN 系统，它根据病人症状和实验室检查结果提供专家级别的诊断和治疗建议，成功率达到 69?，与当时美国临床医生平均水平相当。1980 年代，麻省理工学院开发了 XCON 系统，主要应用于计算机领域，实现高效计算机系统配置。随后，众多科技公司也开始开发自己的专家系统，如 IBM 的 Watson 知识图谱回答系统，Cyc 大型知识库，以及西门子的 PSS SINCAL 电力系统规划分析系统。图 5：专家系统原理 Google Site 反向传播法反向传播法是目前用于训练多层感知机的最优算法，为近代深度学习的发展奠定了基础。反向传播法（Backpropagation）是目前用于训练多层感知机（MLP）的最常用且最有效的优化算法，它的工作原理是通过计算损失函数相对于每个权重的梯度来调整神经网络的权重与配置，从而提高模型预测的准确性。基于 Bryson 的“最速下降法”和 Werbos初步提出的“反向传播”概念