- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
刘松伟
字节跳动ByteNN团队高级工程师
硕士毕业于浙江大学,研究领域聚焦深度学习算法的全栈优化,涵盖模型优化和N
卡推理优化。在字节跳动ByteNN团队先后负责服务端稀疏加速/LLM推理优化能力
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
建设,支持豆包视觉多模态大模型项目的推理优化。目前在ByteNN团队负责模型
优化,致力于通过推理引擎和模型层面的协同优化,降低LLM/SD模型的云端推理
成本,进一步推动AIGC模型的端侧落地。
演讲主题:
AIGC模型的量化和稀疏优化
AIGC端侧落地实践
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
稀疏和量化优化
刘松伟字节跳动ByteNN高性能计算专家
团队介绍
AIGC优化介绍
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
稀疏和量化优化
未来展望
ByteNN业务
落地产品
业务应用特效视觉直播企业办公广告音乐游戏
2024全球机器学习技术大会(北京站)主题涵盖大语言模型技术演进、多模态大模型前沿、大模型工程与架构、大模型应用开发实践、AI智能代理、代码大模型等12个热门专题,力求为全球开发者、研究人员、行业技术人员提供全方位、多角度的技术交流平台。
算法方向计算机视觉语音自然语言处理多模态广告推荐
操作系统
您可能关注的文档
- 京东的AIGC革新之旅:通过JoyCoder实现研发提效-2024年全球软件研发技术大会.pdf
- 跨平台高性能边端AI推理部署框架的应用与实践-2024年全球软件研发技术大会.pdf
- 去哪儿旅行机票主流程AIGC探索实践-2024年全球软件研发技术大会.pdf
- 人机协同趋势和效果优化实践-2024年全球软件研发技术大会.pdf
- 软件开发智能化范式思考与探索-2024年全球软件研发技术大会.pdf
- 软件设计的要素——概念驱动的软件设计-2024年全球软件研发技术大会.pdf
- 深度学习作业GPU利用率分析与提升-2024年全球软件研发技术大会.pdf
- 实现快速流动的架构:通过架构支持DevOps和团队拓扑-2024年全球软件研发技术大会.pdf
- 数据、模型和应用-2024年全球软件研发技术大会.pdf
- 小红书云原生架构的演进-2024年全球软件研发技术大会.pdf
文档评论(0)