计算机行业重大事项点评:AI洞察,字节与OpenAI等Agent多点更新.docx

计算机行业重大事项点评:AI洞察,字节与OpenAI等Agent多点更新.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目 录

一、AI洞察:字节与OpenAI等Agent多点更新 4

二、国内 5

(一)红杉中国发布XBench:AI学术评估体系更新 5

1、XBench的主要功能 5

2、评估机制介绍 5

3、Xbench追踪Agent产品市场变化 7

(二)豆包上线视频通话功能:AI进入实时视觉交互时代 9

1、核心技术突破与架构升级 9

2、生活场景智能化视频体验 10

3、AI智能行业变革引领 10

(三)QQ浏览器推出行业首个高考Agent“AI高考通” 11

1、依托混元技术,打造高考智能服务新标杆 11

2、全周期精准护航 11

(四)昆仑天工超级智能体(SkyworkSuperAgents)移动App正式上线 11

1、开创移动办公新范式,引领AI办公智能转型 11

三、国外 12

(一)OpenAI升级Operator智能体:推理能力跃升新台阶 12

1、主要模块更新 12

四、投资建议与相关标的 13

五、风险提示 14

图表目录

图表1 Xbench-双轨框架图 6

图表2 AGITracking框架介绍 6

图表3 ProfessionAligned下专家思维模式构建任务流程 7

图表4 OpenCompass原始评估IRT能力估计结果 8

图表5 Agent行业三个TMF阶段 8

图表6 豆包更新视频功能展示 9

图表7 豆包更新视频功能展示 10

图表8 AI高考通界面介绍 11

图表9 OpenAI更新推文 13

一、AI洞察:字节与OpenAI等Agent多点更新

5月26日AI领域动态:国内方面:

红杉中国推出AI基准测试工具XBench,采用双轨评估体系,同时评估AI理论能力上限与实际落地价值,首期发布两大测评集;其标志着AI评估体系从传统的单一性能指标迈向全面能力评估的新阶段。以往的评估往往侧重于AI的计算速度、准确率等单一维度,而XBench工具的出现,能够综合考量AI在多种场景下的表现,包括但不限于理解能力、交互能力、知识整合能力等多个方面。这不仅为国内AI企业提供了更科学的自我评估手段,也促使企业更加注重AI产品的综合性能提升。

豆包App上线实时视频通话功能,支持视频问答,模型多模态逐步进化;其将AI的交互方式从传统的文字拓展到实时视频场景,为用户带来了全新的视听交互体验。视频功能的出现推动了AI服务向专业化、场景化迈进。AI不再局限于简单的文字问答,而是能够结合具体的场景,如商务会议、家庭娱乐等,提供更加精准、高效的服务。进化提升了AI的应用价值,我们认为此次升级标志着AI交互的重大突破,随着模型与硬件技术的持续发展,未来有望催生更多创新交互方式与应用场景。

QQ浏览器推出高考Agent“AI高考通”,助力高考生志愿填报与备考内容,助力教育Agent的演进:相关Agent平台技术的应用为未来教育改革与事业提供了强大动力。它为教育领域提供了一种新的智能化服务模式,未来可以进一步拓展到课程推荐、学习进度跟踪、职业规划等多个教育环节。教育机构可以利用Agent技术为学生提供更加个性化的教育服务,提高教育质量和效率,推动教育行业的数字化转型。

昆仑天工超级智能体(SkyworkSuperAgents)移动App正式上线,它标志着Agent智能体突破了设备限制,实现了办公碎片化时间的高效利用。在快节奏的现代生活中,人们的时间被各种事务分割得支离破碎。天工超级智能体移动应用版本的出现,使得用户可以在移动设备上随时随地利用碎片化时间进行办公、学习等操作,为Agent的使用场景打开了想象空间。

国外方面:

OpenAI升级Operator智能体,模型从4o升级到o3,推理和浏览器交互能力提升;通过深度调整神经网络架构与训练策略,引入动态上下文理解机制,Operator智能体能够更精准地捕捉用户指令需求。O3版本的升级极有可能激发其他企业加快Agent产品迭代。微软、苹果等科技巨头凭借其在办公、移动场景等方面的优势,有望进一步强化自身智能体的性能,提升用户体验。从技术角度来看,未来Agent技术可能会在多模态融合、深度学习算法优化、自然语言处理等方面取得更大的突破,为AI行业的发展注入新的活力。

我们认为AI细分领域产品的不断推出,有望加速AI在日常生活中的渗透。

二、国内

(一)红杉中国发布XBench:AI学术评估体系更新

5月26日投资公司红杉中国正式推出全新AI基准测试工具XBenc

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档