用于人工智能设备的核心计算单元处理器及加速处理方法.pdf

用于人工智能设备的核心计算单元处理器及加速处理方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 110796244 A (43)申请公布日 2020.02.14 (21)申请号 201810863952.4 (22)申请日 2018.08.01 (71)申请人 南京天数智芯科技有限公司 地址 210012 江苏省南京市雨花台区软件 大道180号5栋4层 (72)发明人 李云鹏 倪岭 邹云晓 邵平平  郑金山  (74)专利代理机构 南京钟山专利代理有限公司 32252 代理人 戴朝荣 (51)Int.Cl. G06N 3/063(2006.01) 权利要求书2页 说明书5页 附图6页 (54)发明名称 用于人工智能设备的核心计算单元处理器 及加速处理方法 (57)摘要 本发明公开了一种用于人工智能设备的核 心计算单元处理器及处理方法,所述处理器设有 多个神经元,其特征在于,所述神经元由多个乘 加器组组成,所述乘加器组包括多个乘加器单 元,所述乘加器单元具有累加、最大值和最小值 的操作功能,各神经元内的乘加器组数量相同, 各乘加器组内的乘加器单元数量相同,一个神经 元内的乘加器组共享相同的输入激活数据,一个 神经元内的乘加器组处理不同的内核权重数据, 但不同神经元内相同位序的乘加器组处理同一 内核权重数据,各个乘加器组之间没有数据转 A 换。本发明以重复使用权重和激活的方式来安排 4 内核,可快速地从缓存中获取数据并将它们广播 4 2 6 到多个乘加器MAC中,以获得的更高的处理效率, 9 7 0 降低功耗。 1 1 N C CN 110796244 A 权 利 要 求 书 1/2页 1.一种用于人工智能设备的核心计算单元处理器,设有多个神经元,其特征在于,所述 神经元由多个乘加器组组成,所述乘加器组包括多个乘加器单元,所述乘加器单元具有累 加、最大值和最小值的操作功能,各神经元内的乘加器组数量相同,各乘加器组内的乘加器 单元数量相同,一个神经元内的乘加器组共享相同的输入激活数据,一个神经元内的乘加 器组处理不同的内核权重数据,但不同神经元内相同位序的乘加器组处理同一内核权重数 据,各个乘加器组之间没有数据转换。 2.根据权利要求1所述的一种用于人工智能设备的核心计算单元处理器,其特征在于, 包括4个神经元,所述神经元由8个乘加器组组成,所述乘加器组包括4个乘加器单元。 3.根据权利要求1或2所述的一种用于人工智能设备的核心计算单元处理器,其特征在 于,所述乘加器单元的输入端与权重寄存器、输入激活寄存器分别连接,乘加器单元内设有 乘加器MAC、多个目标寄存器和与多个导出寄存器;所述目标寄存器与乘加器MAC连接,用于 存储权重与输入激活数据的计算结果;所述导出寄存器与目标寄存器连接,且与目标寄存 器一一对应,用于计算结果的导出。 4.根据权利要求3所述的一种用于人工智能设备的核心计算单元处理器,其特征在于, 所述乘加器单元内设有4个导出寄存器和4个目标寄存器。 5.根据权利要求3所述的一种用于人工智能设备的核心计算单元处理器,其特征在于, 所述处理器包括一缓存器L1,所述缓存器L1用于存储外部模块派发的输入激活数据和权重 数据,所述输入激活寄存器、权重寄存器从所述缓存器L1中调用数据。 6.根据权利要求5所述的一种用于人工智能设备的核心计算单元处理器,其特征在于, 所述外部模块为波张量分派器。 7.一种基于如权利要求1所述处理器的人工智能设备核心计算单元加速处理方法,其 特征在于,包括以下步骤: 所述乘加器单元处理的数

文档评论(0)

153****0046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档