计算机行业点评:从关键论文看边缘AI.pdf

计算机行业点评:从关键论文看边缘AI.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

年年0077月月0011日日

内容目录

苹果发布AppleIntelligence,自研端+云模型能力优秀3

解决边缘侧性能问题,苹果技术储备充分6

科技巨头纷纷布局,加速边缘侧智能助理产业变革12

建议关注14

风险提示14

图表目录

图表1:针对总结、校对、邮件回复等不同任务的适配器3

图表2:苹果端侧模型和云端模型与其他模型的人类评估结果4

图表3:苹果端侧模型和云端模型与其他模型对比针对有害内容、敏感话题和事实的违规回复比例4

图表4:苹果端侧模型和云端模型与其他模型对比针对有害内容、敏感话题和事实的违规回复比例5

图表5:与DRAM和CPU/GPU缓存和寄存器相比,闪存提供了显著更高的容量,但带宽低很多。6

图表6:一个小的lowrankpredictor可以找出哪些中间神经元将被激活7

图表7:滑动窗口示意图:不删除引入DRAM的神经元,而是保留过去5个令牌的活动神经元:当新token被处理时,只

需要更改少量数据。7

图表8:闪存中随机读取的吞吐量随着序列块的大小和线程数的增加而增加。8

图表9:行列绑定示意图9

图表10:内存管理示意图,首先将最后的元素复制到删除的神经元中,以保持连续的内存块,然后将所需的元素堆叠到最

后,这可以防止多次复制整个数据9

图表11:Talaria可以用于优化机器学习模型的交互式可视化10

图表12:得益于M4芯片的极高速神经网络引擎,在FinalCutPro中能轻松将4K视频中的主体从背景中分离。11

图表13:GPT-4o一边聊天一边解答手写数学问题12

图表14:Astra项目演示13

图表15:Astra还可以将AI添加到智能眼镜中13

P.2请仔细阅读本报告末页声明

年年0077月月0011日日

苹果发布AppleIntelligence,自研端+云模型能力优秀

2024年6月10日,苹果在全球开发者大会上推出了AppleIntelligence,这是一款

深度集成到iOS18、iPadOS18和macOSSequoia中的个人智能系统。Apple

Intelligence由多个功能强大的生成模型组成,这些模型专门用于用户的日常任务,并可

即时适应用户当前的活动。AppleIntelligence内置的基础模型针对用户体验进行了微调,

例如编写和优化文本、确定通知的优先级和摘要、为与家人和朋友的对话创建有趣的图

像,以及执行App内操作以简化跨App的交互。

苹果官方介绍了AppleIntelligence中用到的两个模型:一个30亿参数的设备端语

言模型,以及一个更大的在服务器上运行的语言模型。

为了保证模型的能力,苹果在基础模型上增加了许多Adapters(适配器)对具体任务

进行了优化。适配器是叠加在公共基础模型上的模型权重的小型集合,它们可以动态加

载和交换,使基础模型能够即时专注于手头的任务。AppleIntelligence包含一组广泛的

适配器,每个适配器都针对特定功能进行了微调,这是扩展基础模型功能的有效方法。

AppleIntelligence的适配器,针对总结、校对、邮件回复、音调调整、查询处理、友好

性、紧急情况等不同具体任务都进行了优化。

图表1:针对总结、校对、邮件回复等不同任务的适配器

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档