- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
目 录
一、AI洞察:字节与OpenAI等Agent多点更新 4
二、国内 5
(一)红杉中国发布XBench:AI学术评估体系更新 5
1、XBench的主要功能 5
2、评估机制介绍 5
3、Xbench追踪Agent产品市场变化 7
(二)豆包上线视频通话功能:AI进入实时视觉交互时代 9
1、核心技术突破与架构升级 9
2、生活场景智能化视频体验 10
3、AI智能行业变革引领 10
(三)QQ浏览器推出行业首个高考Agent“AI高考通” 11
1、依托混元技术,打造高考智能服务新标杆 11
2、全周期精准护航 11
(四)昆仑天工超级智能体(SkyworkSuperAgents)移动App正式上线 11
1、开创移动办公新范式,引领AI办公智能转型 11
三、国外 12
(一)OpenAI升级Operator智能体:推理能力跃升新台阶 12
1、主要模块更新 12
四、投资建议与相关标的 13
五、风险提示 14
图表目录
图表1 Xbench-双轨框架图 6
图表2 AGITracking框架介绍 6
图表3 ProfessionAligned下专家思维模式构建任务流程 7
图表4 OpenCompass原始评估IRT能力估计结果 8
图表5 Agent行业三个TMF阶段 8
图表6 豆包更新视频功能展示 9
图表7 豆包更新视频功能展示 10
图表8 AI高考通界面介绍 11
图表9 OpenAI更新推文 13
一、AI洞察:字节与OpenAI等Agent多点更新
5月26日AI领域动态:国内方面:
红杉中国推出AI基准测试工具XBench,采用双轨评估体系,同时评估AI理论能力上限与实际落地价值,首期发布两大测评集;其标志着AI评估体系从传统的单一性能指标迈向全面能力评估的新阶段。以往的评估往往侧重于AI的计算速度、准确率等单一维度,而XBench工具的出现,能够综合考量AI在多种场景下的表现,包括但不限于理解能力、交互能力、知识整合能力等多个方面。这不仅为国内AI企业提供了更科学的自我评估手段,也促使企业更加注重AI产品的综合性能提升。
豆包App上线实时视频通话功能,支持视频问答,模型多模态逐步进化;其将AI的交互方式从传统的文字拓展到实时视频场景,为用户带来了全新的视听交互体验。视频功能的出现推动了AI服务向专业化、场景化迈进。AI不再局限于简单的文字问答,而是能够结合具体的场景,如商务会议、家庭娱乐等,提供更加精准、高效的服务。进化提升了AI的应用价值,我们认为此次升级标志着AI交互的重大突破,随着模型与硬件技术的持续发展,未来有望催生更多创新交互方式与应用场景。
QQ浏览器推出高考Agent“AI高考通”,助力高考生志愿填报与备考内容,助力教育Agent的演进:相关Agent平台技术的应用为未来教育改革与事业提供了强大动力。它为教育领域提供了一种新的智能化服务模式,未来可以进一步拓展到课程推荐、学习进度跟踪、职业规划等多个教育环节。教育机构可以利用Agent技术为学生提供更加个性化的教育服务,提高教育质量和效率,推动教育行业的数字化转型。
昆仑天工超级智能体(SkyworkSuperAgents)移动App正式上线,它标志着Agent智能体突破了设备限制,实现了办公碎片化时间的高效利用。在快节奏的现代生活中,人们的时间被各种事务分割得支离破碎。天工超级智能体移动应用版本的出现,使得用户可以在移动设备上随时随地利用碎片化时间进行办公、学习等操作,为Agent的使用场景打开了想象空间。
国外方面:
OpenAI升级Operator智能体,模型从4o升级到o3,推理和浏览器交互能力提升;通过深度调整神经网络架构与训练策略,引入动态上下文理解机制,Operator智能体能够更精准地捕捉用户指令需求。O3版本的升级极有可能激发其他企业加快Agent产品迭代。微软、苹果等科技巨头凭借其在办公、移动场景等方面的优势,有望进一步强化自身智能体的性能,提升用户体验。从技术角度来看,未来Agent技术可能会在多模态融合、深度学习算法优化、自然语言处理等方面取得更大的突破,为AI行业的发展注入新的活力。
我们认为AI细分领域产品的不断推出,有望加速AI在日常生活中的渗透。
二、国内
(一)红杉中国发布XBench:AI学术评估体系更新
5月26日投资公司红杉中国正式推出全新AI基准测试工具XBenc
您可能关注的文档
- 通信行业全球运营商月报12:新时代企业制度纲领文件出台,DOU高增带动电信收入回暖.docx
- 金融工程定期-港股量化:5月南下资金净流入有所放缓,6月增配价值.docx
- 金工定期报告:预期高股息组合跟踪.docx
- 重估“安全资产”系列报告:并购重组,起风了.docx
- 轻工制造行业定期报告:618大促看好个护国牌崛起,关注智能眼镜新品催化.docx
- 证券行业中期策略:筑底蓄势,头部集聚.docx
- 软件与服务行业美股科技股观察|FY26Q1业绩跟踪:英伟达,业绩延续强劲,强需求对冲H20损失.docx
- 轻工制造&纺织服饰行业6月投资策略展望:国补拉动需求、关税仍有扰动,关注电子烟、AI眼镜投资机会.docx
- 诺邦股份个护家清行业机遇期,高端水刺无纺布打开成长空间.docx
- 资产配置月报:六月配置视点,今年业绩领先的基金有何特征?.docx
文档评论(0)