- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
张俊林
新浪微博首席科学家、新技术研发负责人
中国中文信息学会理事,中科院软件所博士。目前担任新浪微博技术研发负责人,
在此之前在阿里巴巴担任资深技术专家,负责新技术团队。《这就是搜索引擎:核
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
心技术详解》、《大数据日知录:架构与算法》的作者,目前主要研发兴趣集中在
推荐系统及自然语言处理
演讲主题:
OpenAIo1技术原理解析
OpenAIo1技术原理解析
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
张俊林
新浪微博
OpenAIo1模型的意义
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
o1的可能训练过程
强化学习与LLM融合构造o1模型
大模型的“思考快与慢”
人类大脑擅长快思考的系统1和擅长慢思考的系统2,GPT4类似于大脑中的系统1,OpenAIo1类似于大脑中的系统2。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
人类大脑的两套系统
o1大幅提升了大模型的复杂逻辑推理能力
O1相对GPT4o在数学竞赛、高难度编程竞赛、博士级专业能力方面成绩获得大幅提升
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
复杂逻辑推理能力的极大提升
强化学习ScalingLaw(1/2)
ScalingLaw是驱动最近几年大模型发展的主要因素,目前面临因数据短缺而曲线开始平缓的阶段,不可持续。
您可能关注的文档
- 去哪儿旅行机票主流程AIGC探索实践-2024年全球软件研发技术大会.pdf
- 人机协同趋势和效果优化实践-2024年全球软件研发技术大会.pdf
- 软件开发智能化范式思考与探索-2024年全球软件研发技术大会.pdf
- 软件设计的要素——概念驱动的软件设计-2024年全球软件研发技术大会.pdf
- 深度学习作业GPU利用率分析与提升-2024年全球软件研发技术大会.pdf
- 实现快速流动的架构:通过架构支持DevOps和团队拓扑-2024年全球软件研发技术大会.pdf
- 数据、模型和应用-2024年全球软件研发技术大会.pdf
- 小红书云原生架构的演进-2024年全球软件研发技术大会.pdf
- 小红书云原生可观测演进与AIOps实践-2024年全球软件研发技术大会.pdf
- 新能源汽车制造业API管理最佳实践-2024年全球软件研发技术大会.pdf
- 矛盾普遍性和特殊性教学设计.doc
- 六下第二单元百分数教案2021.2.doc
- 宁教云操作文档.docx
- 氓里对女子的忠告.docx
- 深圳租赁房屋合同Word模板下载-(两篇) .pdf
- 004上海市建筑幕墙工程技术标准(DG/TJ08-56-2019).pdf
- 装配式部分包覆钢-混凝土组合结构技术标准.pdf
- 物流信息技术与应用 课件 项目八 智能分析与计算技术;项目九 数据交换与共享技术 上.pptx
- 《机器人基础与数字孪生系统》 课件 第3--5章 机器人运动学、 机器人动力学、 机器人系统的传感与控制.pptx
- 机电产品数字孪生技术及应用(NX MCD) 课件全套 0绪论—内容介绍 ---9工业机器人集成系统.pptx
文档评论(0)