- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2024年深度行业分析研究报告
目录
1.OpenAI发布o1系列大模型,AI大模型进入新纪元 4
2.o1-mini同期发布,低价高速背景下细分领域性能优异 11
3.全新的推理范式:思维链条+自我对弈强化学习 16
4.OpenAIo1,能给AI带来什么? 24
5.建议关注与风险提示 27
图目录
图1OpenAIo1-preview已经正式投入使用 4
图2o1在具有挑战性的推理基准测试中相较于GPT-4o有显著提升 5
图3o1在广泛的基准测试中相较于GPT-4o取得了显著提升 6
图4o1及其改进型模型在编程领域表现优异 7
图5按领域的人类偏好评估:o1-previewvsGPT-4o 7
图6o1模型在多个领域的多个测试集中表现优异 8
图7OpenAIo1安全评分表 9
图8o1-preview和GPT-4o安全性对比 10
图9不同模型数学表现与推理成本对比 11
图10o1-mini模型推理速度远超o1-preview 11
图11o1-mini在数学和编程方面表现出色 12
图12o1-mini在需要推理的学术基准测试上表现优于GPT-4o 13
图13按领域的人类偏好评估:o1-minivsGPT-4o 14
图14o1-mini和GPT-4o安全性对比 14
图15o1模型的性能随着训练时间和测试时间的计算量平稳提升 16
图16手工CoT方法可以让LLM在推理任务上大幅提升 17
图17自动化CoT方法简介 17
图18CoT越长,能解决的问题越复杂 18
图19Self-TaughtReasoner自学推理方法介绍 18
图20Quiet-STaR方法原理介绍 19
图21未来大模型推理阶段的计算量或大大增加 19
图22利用两种方法测试优化LLM计算是否比扩大模型参数规模更高效 20
图23PRM运作原理介绍 21
图24LLM与PRM进行对弈的流程示意图 21
图25OpenAI“推理模型”的运作模式 22
图26不同的PRM方法介绍 22
图27OpenAI对AI的划分了五个发展阶段 24
图28o1在IQ测试中达到120分的水平 25
1.OpenAI发布o1系列大模型,AI大模型进入新纪元
9月12日,OpenAI宣布开发了一系列全新AI模型,旨在在回应前投入更多时间思考。与之前的模型相比,这些模型能够更好地进行推理,并在科学、编程和数学等领域解决更为复杂的问题。
作为早期模型,它还没有许多ChatGPT上的实用功能,例如浏览网络信息或上传文件和图片。然而,对于复杂的推理任务而言,这是一项重大进展,代表了AI能力的新高度。因此,OpenAI将计数器重臵为1,并将该系列命名为OpenAIo1。
OpenAI训练这些模型在做出响应前花更多时间思考问题,类似于人类的思维方式。通过训练,它们学会了优化思维过程、尝试不同策略并识别错误。
在OpenAI的测试中,OpenAIo1在物理、化学和生物学等困难的基准任务中表现与博士生相似。此外,OpenAIo1在数学和编程领域也表现优异。在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o仅正确解答了13%的问题,而OpenAIo1的正确率达到了83%。在Codeforces编程比赛中,OpenAIo1的表现达到了第89个百分位。在O
文档评论(0)