寒武纪神经网络计算机.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
寒武纪神经网络计算机

寒武纪神经网络计算机寒武纪神经网络计算机 中国科学院计算技术中国科学院计算技术研究所究所 计算机体系结构国家重点实验室 陈天石 体系系结构与构与机器学学习的交叉  体系结构的角度体系结构的角度  内部结构复杂的系统  AIAI方法辅助设计方法辅助设计  机器学习的角度  支撑支撑机器学习的手段是计算机器学习的手段是计算  计算系统的能力是潜在瓶颈 2 提纲  基于机器学习方法的处理器研发基于机器学习方法的处理器研发  优化处理器结构参数  优化处理器片上网络优化处理器片上网络  处理器功能验证  寒武纪神经网络计算机  寒武纪1号(DianNao )  寒武纪2号(DaDianNao )  未来展望 优化处理器结构参构参数  处理器研发初期的最关键步骤  选择最合选择最合适的处理器参参数以最最大化处理器的性能能/ 效能能  待定参数很多:发射宽度、功能部件数量、各级缓存大小… 22  设计约束不少设计约束不少:““功耗功耗50 瓦瓦””、 ““面积面积10mm ””… 4 优化处理器结构参构参数  处理器可选参数组合极多  处理器结构空间规模随参数数量指数增长处理器结构空间规模随参数数量指数增长  数千万甚至上亿可能的参数组合  处理器模拟速度极为缓慢处理器模拟速度极为缓慢  芯片还没制造出来,只以软件形式模拟执行  模拟速度比真实处理器运算速度差了模拟速度比真实处理器运算速度差了33~55 个数量级个数量级!!  蛮力遍历整个参数空间?  总耗时总耗时 == 模拟单个处理器参数组合的时间模拟单个处理器参数组合的时间 xx 可能的参数组合总数可能的参数组合总数  演化算法+ 代理模型 5 优化处理器结构参构参数  处理器性能的回归建模(IJCAI’11; TIST’13)  采样采样:模拟少量处理器参数组合模拟少量处理器参数组合  处理器结构优化的主要时间开销  建模建模::通过样本训练回归模型通过样本训练回归模型  半监督学习(co-training)、主动学习  预测预测::通过模型预测处理器参数组合对应的通过模型预测处理器参数组合对应的绝对绝对 性能/功耗 1 两棵回归树互相为对方标记样本 1.两棵回归树互相为对方标记样本 2.每次仅标记使最小均方误差降低最大的(未标记)样本 优化处理器结构参构参数  处理器性能的排序建模(ISCA’14)  预测处理器配置的预测处理器配置的相对好坏相对好坏  排序学习  处理器参数选择处理器参数选择加速加速33-1010倍倍 高 性 能 预测性能相对好坏即可, 不用花大力气去准确花大力气去准确预测测 绝对性能。 低 低

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8010045112000002

1亿VIP精品文档

相关文档