嵌入式现场可编程门阵列在人工智能领域的应用.docxVIP

嵌入式现场可编程门阵列在人工智能领域的应用.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
嵌入式现场可编程门阵列在人工智能领域的应用   摘要:人工智能是研究、开发用于模拟、延伸和扩展人类智能理论、方法及应用的一门新技术,特别是机器学习正在改变这人们的生产和生活方式,也为工业和商业带来了更多机会,但目前支持神经网络迭代、多样性、训练和推理的最佳硬件體系架构还未确定,本文针对这一领域,就嵌入式现场可编程门阵列efpga芯片的应用做一些探讨。   关键词:嵌入式现场可编程门阵列;人工智能;efpga;ai   中图分类号:tn791文献标识码:a文章编号:1007-9416(2019)01-0075-01   目前,人工智能技术在正不同的领域逐步得到越来越广泛的应用,如:自动驾驶、医疗诊断、家用电器、工业自动化、自适应网站、财务分析和网络基础设施。这些应用对电路的性能和功耗有严格的要求,以适应实时的学习和处理过程,这些将对传统的硬件体系构架提出新的挑战。嵌入式现场可编程门阵列作为一种新技术在ai解决方案中具有较高的灵活性,可以实现吞吐量和可重编程性之间的最佳平衡,并提供现实世界机器学习系统所需的性能,本文有针对性地做一些探讨。   1常用机器学习的硬件构架   许多通用中央处理器cpu构架可用于支持高性能机器学习,但是对于实时嵌入式系统来说,由于功耗和性能的限制,这些方案在电路设计开发的早期不得不放弃。   在2010至2015年期间,通用图形处理单元gpgpu能提供数以百计的片上浮点处理单元,且能够并行处理多个神经元的输入,其运算性能要远超出通用cpu集群,从而成为了工程师进行训练和推理算法设计的热门硬件平台。   然而,将gpgpu应用于深度学习架构也存在一些缺点,gpcpu主要用于加速2d和3d图形应用程序,这些应用程序使用均匀且可预测的内存访问模式,其电路结构支持算术运算密集型算法,并可以在存储器中紧密地组合在一起,从而高效合理地处理卷积神经网络层。然而,在其他强调神经元之间数据传输的其他类型网络层时就存在问题,使得本地存储器架构效率降低,也就降低了整体的性能和能效。   为了克服gpgpu在实施深度学习系统时存在的挑战和瓶颈,人们开发出了具有定制逻辑和内存管理单元的专用集成电路asic,其内存管理单元可以针对神经网络代码中遇到的不同访问模式进行调整,从而大幅提高整体传输速度。但与基于软件的通用处理器结构相比,asic也存在灵活性较差的问题。   现场可编程门阵列fpga具有实现定制处理器和内存管理技术方面的诸多优势,其架构内已经集成了可定制逻辑阵列和硬核数字信号处理器dsp单元,支持固定和浮点运算。在许多情况下,dsp引擎采常采用8位或16位单元模块组件方式,可以组合起来使用以实现更高精度的数据运算。硬件结构的可重构性使fpga很容易调整并行处理器和其之间的互联结构,以满足多种场合应用的特定需求。然而,可编程逻辑阵列相对低的效率也意味着,当应用程序需要网络的某些高吞吐量专用功能时,用户必须在神经网络内不同层之间的性能共享功能上妥协。而一种折中的方案是使用小型asic来扩展fpga,从而为常用功能(如卷积内核等)提供加速。   2嵌入式fpga技术介绍   将fpga构架嵌入到片上系统soc可以克服独立fpga和asic的缺点,以及互相之间的数据传输问题。嵌入到asic中的一个或多个fpga提供了动态调整神经网络性能的能力,提供了充分利用定制引擎所需的高数据传输带宽。而这种方案就是嵌入式efpga的设构架。   2014年,efpga概念首次进入业界视野,chengc.wang等在isscc发表文章指出,通过创造性地设计互联单元,解决了fpga的功耗、性能和成本受到布线资源限制的问题,从而使得efpga集成到soc中真正变为可能,作者依据论文成果成立了flexlogix,致力于推广efpga的概念和应用并力争商用化。   目前,efpga的概念已经获得了业界的广泛认可,而该领域的公司和产品线也逐渐丰富,主要产品供应商有:flexlogix、achronix、menta、quicklogic、nanoxplore、efinix、adicsys等。以上所列公司大都采用三种商业模式和技术开发途径:achronix同时提供fpga和efpga,menta、nanoxplore和adicsys提供软核ipefpga,flexlogix提供硬核efpga,quicklogic采用了gloablfoundry工艺的硬核ip,efinix采用硬核ip技术。   与传统实现方案相比,efpga是一种高效灵活的解决方案,可以实现吞吐量和可重编程性之间的最佳平衡,并提供现实世界机器学习系统所需的性能,为设计人员提供

文档评论(0)

180****8756 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体盛世风云(深圳)网络科技有限公司
IP属地陕西
统一社会信用代码/组织机构代码
91440300069269024M

1亿VIP精品文档

相关文档