计算机行业点评:边缘侧AI产业进展.docx

计算机行业点评:边缘侧AI产业进展.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

内容目录

OpenAI发布GPT-4o,大模型人机交互能力获重大 破 3

AIPC产业进展加,苹果、微软等巨相继下场 5

AI手机及各类可穿戴终端创新不断 8

建议关注 10

风险示 10

表目录

表1:GPT-4o一边聊能一边解答手写数学问 3

表2:GPT-4o实时阅读代码并语音指导编程 3

表3:Astra项目演示 4

表4:Astra还可以将AI 加到智能眼镜中 4

表5:M4拥有超快的神经网络引擎,可以轻 将拍摄对象与其背景隔离开来 5

表6:Copilot+PC的Recall功能展示 6

表7:使用Copilot+PC的Cocreator进行艺术创作 6

表8:Canalys预测2027年60%的PC将具备AI功能 7

表9:Ferret-UI能处理从基础到高级的多种任务,从定位按钮到复杂的理功能 8

表10:谷歌FitBit智能手表 9

表11:高 骁龙8Gen3宣传 10

OpenAI发布GPT-4o,大模型人机交互能力获重大突破

2024年5月13日,OpenAI召开春季更新发布会,推出GPT-4o。

GPT-4o(“o”代表“omni全能”)是OpenAI的新旗舰型号模型,可以实时推理音频、视觉和文本。GPT-4o可以在短短232毫秒内响应音频输入,平均为320毫秒,这类似于人工响应时间。发布会上OpenAI演示了GPT-4o一边语音聊天一边实时解答手写数学问题,以及实时阅读代码并语音指导编程等能力。

图表1:GPT-4o一边聊天一边解答手写数学问题

资料来源:OpenAI官网,

图表2:GPT-4o实时阅读代码并语音指导编程

资料来源:OpenAI官网,

2024年5月14日,紧随OpenAI的GPT-4o发布后,谷歌IO大会上展示了其最新的Astra项目,Astra是基于谷歌的Gemini大模型对AI助手未来的探索。谷歌IO大会

演示了Astra在谷歌Pixel手机以及智能眼镜设备上运行的效果,终端Agent可以接收源源不断的音频和视频输入,实时推理环境,并在对话中与测试人员就其所看到的内容进行交互。

图表3:Astra项目演示

资料来源:谷歌官网,

图表4:Astra还可以将AI添加到智能眼镜中

资料来源:谷歌官网,

我们认为,GPT-4o是大模型迈向更自然的人机交互的重大进步,带来了崭新的多模态交互能力,实现了用户体验上的新突破,利好各种智能终端个人助理、机器人等方向。谷歌紧随其后的Astra项目也进一步验证了大模型赋能终端智能化的产业趋势。

AIPC产业进展加速,苹果、微软等巨头相继下场

2023年10月19日,英特尔宣布启动AIPC加速计划,以加速AI在客户端计算产业的发展速度。“AIPC加速计划”将在2025年前为超过1亿台PC带来AI特性,通过与超过100家ISV合作伙伴深度合作,并集合300余项AI加速功能,英特尔将在音频

效果、内容创建、游戏、安全、直播、视频协作等方面继续强化PC的体验。

PC端算力不断强化,助力提升智能化:

2023年12月,英特尔将召开“AIEverywhere”发布会,并推出MeteorLake处理器。MeteorLake处理器采用英特尔首款集成神经处理单元(NPU),可在PC上实现高能效的AI加速和本地推理。

2023年10月,高通在2023骁龙峰会上推出PC芯片骁龙XElite,能在设备上运行具有超过130亿个参数的生成式AI模型,并有比竞争对手快4.5倍的AI处理能力。

2024年5月7日,苹果发布M4芯片。M4芯片的极高速神经网络引擎专门用于加速AI任务,运算速度最高可达每秒38万亿次,相比A11仿生芯片中的初代神经网络引擎,提速最高可达惊人的60倍,使之成为处理AI任务的理想芯片,赋能iPadOS中的各种

AI功能:例如用于实时音频字幕的实时字幕,以及用于识别视频和照片中对象的视觉查找,新款iPadPro允许用户在设备上快速完成惊人的AI任务。搭载M4芯片的iPadPro只需轻点一下,即可在FinalCutPro的4K视频中轻松将拍摄对象与背景隔离开来,并且只需听别人弹钢琴,即可在StaffPad中实时自动创建乐谱。

图表5:M4拥有超快的神经网络引擎,可以轻松将拍摄对象与其背景隔离开来

资料来源:苹果官网,

2024年5月20

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档