- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
内容目录
端侧Agent 3
Anthropic:Claude3.5Sonnet带来ComputerUse时刻 3
智谱:AutoGLM革新端侧交互,PhoneUse成为现实 4
广告 放技术 7
Applovin(APP.O): 荐引擎Axon助力广告精准 放 7
汇量科技(1860.HK):程序化广告平 Mintegral升级出价模式 8
企业方案决策 10
Palantir(PLTR.O):大模型加持AIP平 能力,商业客户加 展 10
第么范式(6682.HK):先知AIOS驱动AI落地千行百业 11
客户关系管理CRM 13
Salesforce(CRM.N):Agentforce赋能智能交互与自动化 13
微盟集 (2013.HK):全面拥抱AgenticAI时代 14
实时互动 16
Agora,Inc(API.O):RTE-PaaS领导者,借力OpenAI扩大AI优势 16
表目录
表1:Claude3.5Sonnet的计 机使用能力:示例1 3
表2:Claude3.5Sonnet的计 机使用能力:示例2 3
表3:Claude3.5Sonnet的计 机使用能力评估位居行业首位 4
表4:智谱AutoGLM演示自动从 宝购买历史订单中的产品 4
表5:AutoGLM在PhoneUse的性能评估 5
表6:AutoGLM在WebBrowerUse的性能评估 5
表7:AutoGLM在常见简单任务中的成功率(%) 6
表8:第么范式业务板块 11
表9:先知AIOS进化历程 12
表10:微盟集 15个AIAgent产品矩阵 15
表11:Agora,inc.的主要产品 16
表12:Agora,Inc.客户基数 17
表13:Agora,Inc.客户净留存率 17
表14:Agora宣布与OpenAI的合作 17
表15:声网发布RTE+AI能力全景 18
端侧Agent
Anthropic:Claude3.5Sonnet带来ComputerUse时刻
2024年10月22日,Anthropic公司发布了全新的大模型——Claude3.5Sonnet,被Anthropic的产品经理MichaelGerstenhaber誉为迄今为止最智能的模型;并推出了一款新模型Claude3.5Haiku。
Claude3.5Sonnet最引人注目的功能是其计算机使用能力——通过相应API,电脑可以模拟人类操作,完成读屏、移动光标、点击按键、输入文本等等任务动作。
图表1:Claude3.5Sonnet的计算机使用能力:示例1 图表2:Claude3.5Sonnet的计算机使用能力:示例2
资料来源:Anthropic官网, 资料来源:Anthropic官网,
根据公司官网介绍,这一能力的实现主要依靠如下步骤:
屏幕识别:读屏能力依然是重要前提。
逻辑推理:针对所识别出的屏幕内容,推理出何时、如何进行相应的操作。
定位执行:准确计算像素定位非常重要:为了正确点击相应的位置、需要垂直或水平移动多少像素。
快速泛化并持续迭代:研究团队观察到模型泛化非常迅速,在遇到困难的时候还会自我修正后重新尝试任务。
在OSWorld这一评估计算机使用能力的基准测试中,Claude3.5Sonnet的准确度达到
14.9%,在给予更多步骤的情况下达到22.0%,位列行业首位。
图表3:Claude3.5Sonnet的计算机使用能力评估位居行业首位
资料来源:Github,
1.2智谱:AutoGLM革新端侧交互,PhoneUse成为现实
AutoGLM是智谱近期推出的一款创新Agent工具,它能够接收简单的文字或语音指令,模拟人类操作手机,完成一系列复杂的任务。比如,在淘宝上购买历史订单中的商品、在美团点外卖、在12306购买火车票等等任务,AutoGLM都能轻松完成。
图表4:智谱AutoGLM演示自动从淘宝购买历史订单中的产品
资料来源:Github,
根据智谱AutoGLM团队的论文解释,这一强大功能的实现依托如下核心步骤:
多模态读屏:传统的RPA(机人人流程自动化)中通过OCR进行GUI(图用用户面)的识别,但难以被泛化。而大型多模态模型则可以进行模糊匹配和长任务规划,因此对GUI理解很有帮助。
模拟操作:BehaviorCloning(行为克、、
您可能关注的文档
- 汽车行业2024年三季报总结:以旧换新推动需求回暖,行业整体经营维持稳定.docx
- 汽车行业2025年走出“通缩”.docx
- 汽车行业分价格级别跟踪报告:3季度20万元以上占比环比继续提升至25.docx
- 玲珑轮胎配套与零售业务并举,稳步推进“7与5”全球布局战略.docx
- 汽车行业深度研究报告:电动重卡风再起,与两年前有何不同?.docx
- 汽车行业新车跟踪报告:12月重点关注吉利银河星舰7、蔚来ET9.docx
- 汽车行业月度点评:以旧换新政策持续发力,10月乘用车销量同比增长10.7.docx
- 抢跑效应支撑债市持续走强.docx
- 轻工造纸行业2024年三季报回顾总结:内需Q3触底,期待边际改善;出口演绎Alpha逻辑.docx
- 轻工制造行业深度研究报告:布鲁可招股书梳理,方寸之间,IP起舞.docx
最近下载
- 2023款 kawasaki 川崎Ninja 1000S 用户使用手册 说明书 摩托车.pdf VIP
- 二年级上册综合实践活动全册教案.pdf VIP
- 提升水处理技术与工程的效率与可持续性.pptx
- 中国工商银行财务风险分析.doc VIP
- 第16课 会说话的手(一)(导学案)苏少版美术四年级上册.docx VIP
- 人教版2024年新教材七年级上册英语Unit 5学情评估测试卷(含答案).docx
- 14.+推进绿色发展(精品课件)-【中职专用】高一思想政治《中国特色社会主义》同步课堂精品课件(高教版2023·基础模块).pptx VIP
- 杭州师范大学2023-2024学年第1学期《高等数学(上)》期末考试试卷(A卷)附参考答案.pdf
- 新教科版五年级上册科学全册复习计划.doc
- 《酶联免疫分析法》课件.pptx VIP
文档评论(0)