- 1、本文档共71页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
6个月过去了,重新认识大语言模型徐文浩2023-10-18
我是谁??AIGC再创业中?专栏「AI?模型之美」的作者?2010年开始做基于?数据和机器学习的?告算法?2016年创业做智能聊天机器??「深?浅出计算机组成原理」的作者?「?数据经典论?解读」的作者
有问题,咱弹幕?分享后回答?家的问题
?OpenAI最新的产品更新与体验?AdvancedDataAnalysis?GPT4-VDALL-E3?FunctionCall和全新的Fine-Tune界面?基于Llama-2的开源大模型的进展与差距?蒸馏GPT-4的Orca数据集和模型微调的进步?VLLM这样方便运用的推理框架
OpenAI最新的产品体验
OpenAI最新的产品体验ADA-从AdvancedDataAnalysis开始
?AdvanceDataAnalysis本质上,只是多了pandas库的Agent?从“智能”的角度来看,仍然只能作为我们的助手?但是,Chat这个“持续对话”的界面极大地提升了产品的可用性
DALL-E3
?模型可控性有进步(对比DALL-E2)?NSFW过于严格,非常不可用?视觉美观上,主观感觉仍然落后于Midjourney和StableDiffusion?Chat这个“持续对话”的界面极大地提升了产品的可用性
GPT4-V
?容易产生的一些想法:?就是多了些描述图片的功能,没啥用?实际上??让我们来看一看
让GPT4-V帮我画页面
?进一步提升了生产力!?多轮聊天的交互体验,仍然是GPT4-V能有好的体验的重要环节?有机会通过端到端的方案解决更复杂的问题(比如,自动驾驶)?接下来的最大挑战是成本和性能问题?多去尝试,可以试试和ChatGPT的App对话,语音合成的效果也令人震惊
OpenAIPlatform的功能变更体验functioncall
提示语:这是?户的问题:{{question}}这是通过Wolfram拿到的答案:?户的问题计算过程和答案提示语:{{answer}}这是?户的问题:{{question}}请看?下是否回到了问题,并且输出问题的答案我们有以下这些?具:1.WebBrowser:可以访问?络进?搜索的浏览器2.Wolfram:可以进?各种计算、数学,并且能够精选知识选择了Wolfram输?:flighttimefromShanghaitoBeijing给到?户的最终答案我们应该选?哪个?具?以及给予这个?具什么输??
FunctionCall也是一样的
OpenAIPlatform的功能变更体验无需编程的fine-tune
开源模型和社区的进展
?围绕Llama-2的生态迅速繁荣?Qlora,Vicuna,OpenOrca?修改几行代码就能进行模型微调,模型微调的技术门槛接近于0?SizeMatters,简单微调的70B也比精心训练的7B好?DataMatters,训练数据的质量非常重要
?指令微调,请ChatGPT当老师?不光要给答案,还要给解释?先学习简单的问题(GPT-3.5生成的指令),再学习复杂的问题(GPT-4生成的指令)?大力出奇迹!?Vicuna7万条数据?Orca500万条数据(400万条GPT3.5,100万条GPT-4)
厉害的开源模型
不只是微调
?开源的数据与数据工具–OpenOrcaairoboros?开源的基座模型–LlaMa2,Falcon180B,Mistral7B?开源的微调代码–Vicuna,LM-Flow?开源的数据评估–lm-evaluation-harness?开源的高性能部署–VLLM
以及更多
LLM即压缩理论视觉多模态LLaVaAgent应用AutoGen
选择一个你感兴趣的主题深入下去动手才是追赶时代的最佳方案
答疑环节请发弹幕提问
感谢观看徐文浩2023-10-18
您可能关注的文档
- BloombergGPT:一个用于金融的大型语言模型.pdf
- ChatGPT 和语言模型 : 保卫业简介 ( 德文 )】.pdf
- 大模型时代的可信自然语言处理(演讲PPT).pdf
- 大型语言模型综述(英).pdf
- 大语言模型提示注入攻击安全风险分析报告(2023.7).pdf
- 大语言模型应用程序十大风险V1.0.pdf
- 基于大型语言模型的智能体的兴起与发展.pdf
- 您需要了解的有关多语言 LLM 的一切 : 为世界语言建立公平 , 高效和可靠的模型.pdf
- 人工智能周报(24年第3周):微软推出独立AI工具“阅读教练”,商汤“书生・浦语”2.0大语言模型开源.pdf
- 申万:TMT-首发讯飞金山商汤等七大语言模型:十方面能力综合评测-20230420.pdf
- 红韵--行业分析与方案 + 关注
-
实名认证服务提供商
红韵提供全面的行业分析与方案服务范围包括: 1. 行业分析报告:涵盖市场趋势、竞争对手分析、消费者行为等方面的深入研究。 2. 定制化方案:根据客户需求,提供针对性的业务发展和市场进入策略。 3. 行业标准解读:帮助企业理解并适应行业规范,确保合规经营。 4. 白皮书撰写:提供行业洞察,为企业决策提供数据支持和战略建议。 5. 说明文档编制:为客户的产品或服务编制清晰的用户指南和操作手册。 红韵致力于为客户提供精准、高效的行业信息服务,助力企业把握市场脉搏,实现战略目标。
文档评论(0)