大模型机理分析-2024全球机器学习技术大会.pdf

大模型机理分析-2024全球机器学习技术大会.pdf

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

刘勇

中国人民大学高瓴人工智能学院副教授、博士生导师

博士生导师,从事机器学习研究,特别关注大规模机器学习、统计机器学习理论等。共

发表高水平期刊和会议论文40余篇,包括IEEETPAMI、ICML、NeurIPS、ICLR、

AAAI、IJCAI等,其中第一作者/唯一通讯作者在中国计算机学会推荐A类上发表学术论

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

文20余篇。曾获2014年亚太知识发现和数据挖掘会议(PAKDD)博士生论坛最佳论文,

并指导学生获2021年环太平洋国际人工智能会议(PRICAI)最佳学生论文。作为项目负

责人主持了国家自然科学基金面上项目和青年项目、北京市自然科学基金面上项目、中

国科学院基础前沿科学研究计划等。曾获2020年中国人民大学“杰出学者”、2019年中

国科学院“青年创新促进会”、2016年中国科学院信息工程研究所“引进优秀青年”、

2012年“博士研究生学术新人奖”等称号。

演讲主题:

大模型机理分析

大模型机理分析

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

刘勇

中国人民大学高瓴人工智能学院

研究背景

大模型ICL隐式更新机理分析

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

RAG增强是否能提升大模型推理能力?

合成数据机理分析在大模型后训练中是否有用?

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。

研究背景介绍

•大模型技术飞速发展

•ChatGPT、ChatGPT4、Sora、O1

2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大

文档评论(0)

优选文档 + 关注
实名认证
内容提供者

专注于发布优质文档,喜欢的可以关注一下哦~

1亿VIP精品文档

相关文档