- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Long-ContextvsRAG
谁将主导未来?
AICon全球人工智能开发与应用大会主要面向各行业对人工智能和大模型感兴趣的资深工程师、产品经理、数据分析师,会议聚焦大模型训练与推理、AIagent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、互动展区等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。
唐飞虎@MoonshotAI
大纲
•RAG
○什么是RAG?
○RAG相关的技术与框架
•Long-Context
○Long-Context的发展历程
AICon全球人工智能开发与应用大会主要面向各行业对人工智能和大模型感兴趣的资深工程师、产品经理、数据分析师,会议聚焦大模型训练与推理、AIagent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、互动展区等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。
○Long-Context摩尔定律?
○Long-Context的评测:长文本和长文本亦有差距
•能力边界与优势区间
•更多案例
•突破限制:如何提升RAG和Long-Context的边界
RAG
AICon全球人工智能开发与应用大会主要面向各行业对人工智能和大模型感兴趣的资深工程师、产品经理、数据分析师,会议聚焦大模型训练与推理、AIagent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、互动展区等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。
什么是RAG?
•RAG全称Retrieval-AugmentedGeneration,即检索增强生成,它
结合了检索和生成的能力,为文本序列生成任务引入外部知识。
•目前,大部分公司倾向于使用RAG方法进行信息检索,因为相比长
文本的使用成本,使用向量数据库的成本更低。
•而在RAG应用过程中,一些公司会使用微调的EmbeddingModel,
AICon全球人工智能开发与应用大会主要面向各行业对人工智能和大模型感兴趣的资深工程师、产品经理、数据分析师,会议聚焦大模型训练与推理、AIagent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、互动展区等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。
以增强RAG的检索能力;另一些些公司会选择使用知识图谱或者
ES等非向量数据库的RAG方法。
•大多数第三方个人和企业开发者会使用集成好的RAG框架(例如
llamaindex、langchain、etcs)
•或者直接使用LLMOps里内建的RAG工具。
例子
AICon全球人工智能开发与应用大会主要面向各行业对人工智能和大模型感兴趣的资深工程师、产品经理、数据分析师,会议聚焦大模型训练与推理、AIagent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、互动展区等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。
AICon全球人工智能开发与应用大会主要面向各行业对人工智能和大模型感兴趣的资深工程师、产品经理、数据分析师,会议聚焦大模型训练与推理、AIagent、RAG、多模态大模型等热门方向,会议不仅安排了精彩的演讲,还策划了包括闭门会议、圆桌交流、互动展区等多种社交活动,一方面为参会人员提供宝贵的交流学习、拓展人脉的机会,另一方面也为相关企业和机构提供一个展示自身实力和成果的舞台。
AICon全球人工智能开发与应用大会主要
您可能关注的文档
- AI Agent 在企业生产中的技术实践-2024年全球人工智能与大模型开发与应用.pdf
- AI for Science 新范式赋能电池研发-2024年全球人工智能与大模型开发与应用.pdf
- Database Copilot 在数据库领域的落地-2024年全球人工智能与大模型开发与应用.pdf
- Glake:效透明的大模型显存管理和优化-2024年全球人工智能与大模型开发与应用.pdf
- LLM 在 BI 场景的应用思路探索-2024年全球人工智能与大模型开发与应用.pdf
- OpenSearch RAG 应用实践-2024年全球人工智能与大模型开发与应用.pdf
- PPIO 模型平台出海实战,跨地域业务扩展中的技术优化之道-2024年全球人工智能与大模型开发与应用.pdf
- RAG 系统中的关键技术:从 Embedding 到 Reranker-2024年全球人工智能与大模型开发与应用.pdf
- The Next Wave:Explore the Strategy on Generative AI-2024年全球人工智能与大模型开发与应用.pdf
- 从互联网到 AI:云产业的重构和演进-2024年全球人工智能与大模型开发与应用.pdf
文档评论(0)