- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
目 录
TOC\o1-2\h\z\u1、OpenAIo1开启复杂推理模型新时代 4
相比GPT-4o,o1在代码和理科能力上提升明显 4
o1具备全局思维能力,复杂推理补足长尾需求,开拓学术教育垂类场景 6
o1在编程上展现出自主规划和主动思考能力,AI+低代码/网络安全领域有望最早受益 8
2、AIAgent是打破AI应用发展瓶颈的关键,o1能否开启通往Agent之路? 11
新的ScalingLaw,RL+CoT对于实现能自主规划的AIAgent至关重要 12
RL范式下推理算力需求大幅上升,但不代表训练算力需求会停止增长 13
3、投资建议 15
4、风险分析 16
图目录
图1:GPT-4o、o1-preview、o1和人类专家在复杂推理任务中的得分差异 4
图2:o1相比于GPT-4o在各项测试集中的得分提升 5
图3:o1-mini、o1等模型AIME得分和推理成本对比 6
图4:o1-mini的Codeforces得分显著优于o1-preview 6
图5:针对复杂数学问题,o1-preview在思维链中不断进行纠错、追问和反思,最终得到完整的解题框架 6
图6:针对规则复杂的纵横填字游戏,GPT-4o因无法理解规则而出错,o1-preview首先理解规则再进行解答.7图7:针对解码问题,o1-preview的思维链采用了类似穷举法的方式寻找答案,思维链较为僵化 7
图8:将o1-preview与GithubCopilot优化编码器运行速度 8
图9:o1-preview与CursorComposer结合,快速开发App 8
图10:o1-preview找到DockerHostAPI并启动了损坏容器的新实例 9
图11:2023年交互式入侵主要针对北美洲地区 9
图12:2021-2023年针对云的入侵案例显著增加 9
图13:o1-preview和o1-mini在越狱学术基准StrongReject上明显领先GPT-4o 10
图14:构建AI应用的五层基石理论 11
图15:AlphaZero随机初始化、self-play、MCTS、策略更新 11
图16:o1在AIEM测试中的准确率与“训练时间计算”和“测试时间计算”呈正比 12
图17:在PaLM2-S*模型修正场景中,计算优化缩放(ComputeOptimal)相比传统的Best-of-N方法效率显著提高 13
图18:主流模型输出速度和输出质量的对比,o1-preview为输出质量牺牲了输出速度 14
图19:主流模型输入和输出的价格对比 14
图20:OpenAI各模型输出和推理tokens消耗对比 14
图21:科技公司资本支出占营运现金流的比例变化趋势 15
图22:科技公司资本支出占GAAP净利润的比例变化趋势 15
表目录
表1:不同测试集和子分类下GPT-4o、o1-preview、o1的得分对比 5
表2:23年以来部分网络安全公司推出的生成式AI产品和功能 10
1、OpenAIo1开启复杂推理模型新时代
美国东部时间2024年9月12日,OpenAI发布最新AI模型o1,o代表Orion(猎户座),开启了OpenAI的下一代复杂推理模型。
同时,OpenAI发布了即日可用的预览版o1-preview和性价比更高的轻量级版本o1-mini,可用范围如下:
ChatGPTplus和Teams用户可以直接使用,但存在次数限制。刚发布时o1-preview每周可进行30次问答,o1-mini每周可进行50次问答,9月17日开始,o1-preview和o1-mini的次数限制分别提升至每周50次和每日50次;作为o1的早期版本,o1-preview和o1-mini暂不具备实时浏览网页、上
传文件和图像等功能,计划于后续版本中陆续开放。
APITier5用户可以开始使用o1-preview和o1-mini的API,但速率限制为20RPM,暂不支持函数调用、流式处理、系统消息等功能。
3)9月16日开始,ChatGPTEnterprise和Edu用户可访问这两种模型。4)未来o1-mini计划免费向所有ChatGPT用户开放。
相比GPT-4o,o1在代码和理科能力上提升明显
在编程、理科竞赛等推理密集型任务中,o1的性能明显优于GPT-4o。根据OpenAI官方博客,
您可能关注的文档
- 火箭军成功发射洲际弹道导弹,关注军工板块景气回升.docx
- 汇顶科技首次覆盖:多元布局汇通四海,指纹/触控顶立新峰.docx
- 黄金行业深度:商品的供需属性将有效决定价格韧性.docx
- 环保行业深度跟踪:SAF试点启动,重申看好固废、水务.docx
- 环保行业高股息系列(六):如何看待水务、垃圾焚烧公司的应收账款?.docx
- 淮北矿业华东优质焦煤生产商,成长可期.docx
- 化工行业深度报告-轮胎出海2.0:是产能过剩还是新机遇?.docx
- 化工行业纯碱深度复盘:云卷云舒,新章待启.docx
- 华阳集团汽车电子多点开花,把握智能化发展机遇.docx
- 华夏中证人工智能ETF投资价值分析:驱动AGI时代算力提升的核心引擎.docx
- 2021-2022学年湖南省常德市安乡县四年级上学期期中语文真题及答案.pdf
- 2023-2024学年河南省南阳市社旗县四年级上学期期中数学真题及答案.pdf
- 2022-2023学年云南省曲靖市四年级下学期期末数学真题及答案.pdf
- 2021-2022学年河南省周口市鹿邑县二年级下册月考语文真题及答案.pdf
- 2018年河南焦作解放区教师招聘考试真题及答案.pdf
- 2019年江西公务员行测考试真题及答案-乡镇.pdf
- 2019中国石油报社应届高校毕业生招聘试题及答案解析.pdf
- 光大银行招聘应届毕业生能力素质测试笔试真题及答案.pdf
- 2024年广西百色教师招聘考试模拟题及答案.pdf
- 2021-2022学年浙江绍兴诸暨市五年级上册语文期末试卷及答案.pdf
文档评论(0)