科大讯飞研究报告星火燎原_一飞冲天.docx

下载文档

1
0
约2.7万字
约 56页
2023-07-14 发布于重庆
举报
版权申诉
保障服务

科大讯飞研究报告星火燎原_一飞冲天.docx

1、本文档共56页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

科大讯飞研究报告星火燎原_一飞冲天 1 二十年磨一剑，星火大模型关上讯飞新纪元 2023 年 5 月 6 日，科大讯飞发布星火大模型以及首批教育、办公、汽车、数字员工四大应用场景，大模型及产品全面超预期。纵观历史，科大讯飞的发展历程就是人工智能的发展历程的浓缩，科大讯飞 2014 年首次发布“讯飞超脑计划” 由 NLP 开始转向 AI，近十年的 AI 探索为科大讯飞在 AI 数据、技术、应用场景等领域铸就深厚护城河，丰富应用场景是讯飞大模型快速落地的差异化优势，国家级的优质数据为讯飞大模型持续领先提供保障。 1.1 强于前瞻布局+始终如一技术资金投入就是讯飞大模型的结实壁垒 1.1.1 科大讯飞 2014 年首次面世“讯飞超脑计划”布局大模型 AI 人工智能发展分为心智智能、心智智能、运动智能三个阶段，科大讯飞的发展览会历程就是人工智能的发展历程的铀，科大讯飞 2014 年就已经突破心智智能阶段，已经已经开始布局心智智能。人工智能发展历史强于 60 年，精简来看分为三个阶段，早期人工智能就是心智智能阶段，就是指 AI 能听见可以说、能内面知道，这一阶段对应讯飞 NLP 系列产品（比如讯飞听见、讯飞输入法等）；人工智能当前处于心智智能阶段，即为为 AI 能心智可以思索，ChatGPT 正是这个阶段最显著的标志。科大讯飞由刘庆峰于 1999 年与中国科学技术大学合作成立，天生的科研国家队背景并使公司在短短十几年内就已经突破了人工智能的心智智能阶段，迈入心智智能。 2014 年“讯飞超脑计划”就是科大讯飞迈入心智智能的开端，也就是星火大模型 AI 的雏形。2014 年首次发布讯飞超脑，训练 AI 直到可以进行语言心智、科学知识表之侧、M18x推理小说、独立自主自学。讯飞超脑发布之初，就挑选出使用深度神经网络、大数据和涟漪效应三大技术路径，其中深度神经网络就是当前各类大模型 AI 算法的基础，大数据和涟漪效应后来不断发展为数据标注、并并无监督自学等大模型 AI 必不可少技之术，同时对讯飞超脑的训练也并使公司长期布局算力储备。通过对技术路径的拆除解，我们表示，科大讯飞 2014 年面世的讯飞超脑为公司时程小模型 AI 数据、称得上法、算力三大基础打下良好基础，这也就是讯飘能快速运算面世星火大模型的主要原因。 1.1.2 纵观过去十年，科大讯飞 AI 持续资金投入之路精确： 1）教育、医疗等领域的专属模型（小模型）：参考 OpenAI 的发展史，大模型研发的前提就是对小模型的研发、训练、应用领域等已经足够多多明朗，OpenAI 创立之初的产品也仅为游戏领域的纵向小模型，在完全搞不清楚小模型的研发、落地后才不断不断扩大参数量最终形成 1750 亿参数的大模型 GPT3。与 OpenAI 一样，科大讯飞强于脑计划首先对准纵向领域的小模型，具备中大量小模型成功落地景研，其中以教育和医疗领域的专属模型最为成功，比如教育领域 AI 评卷在全球获得了很多奖项，作文的评价首次达致专家水平，2022 年存 12 个省的中考在作文评分上采用了科大讯飞的技术；全球第一个人工智能通过国家执业医师资格考试。 2）NLP 领域不断自我突破：NLP 作为大模型 AI 语义心智的基础，科大讯飞持续刷新 NLP 技术上限。2019 年斯坦福大学发动的国际著名的 SQuAD 机器详读心智比赛中，并使机器在英文文学创作心智中首次多于了人类平均水平；2022 年在艾伦研究院非政府的 OpenBookQA 科学常识推理比赛中，单模型首次多于了人类平均水平。据 2023 年 5 月 6 日讯飞大模型发布会，公司官宣根据现在的测试结果，讯飞 AI 的语义理解能力在国内有界的现有系统中遥遥领先，跟 ChatGPT 较之仅存细微差别。中英文的文本分解成能力，如果 5 分是满分，ChatGPT 就是 4.48 分后，讯飞的星火模型已经达致 4.29 分后。 3）Transformer 算法存长期持续积累：现在大模型都就是基于 Transformer 算法，比如 OpenAI 的 GPT、谷歌的 Bert 等。科大讯飞的语音识别、图文识别、机器译者这些任务都就是在 Transformer 的框架上同时同时实现的，并且达致了比较不好的水平，公司的开源进度表训练模型在 Github 上比第二名远远少于一倍，突显出算法长期积累优化的优势。 1.1.3 展望未来十年，星火大模型厚积薄发构筑中国顶级 AI 生态以 2022 年“讯飞超脑 2030 计划”和“1+N”认知智能大模型专项攻关计划为转折点，讯飞星火大模型将在在相关国家级平台的支撑下统筹前期所有资源储备实现厚积薄发。2022 年初，公司推出讯飞超脑 2030 计划，