一种人工智能应用的部署方法及相关装置.pdf

一种人工智能应用的部署方法及相关装置.pdf

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111045687 A (43)申请公布日 2020.04.21 (21)申请号 201911243205.1 (22)申请日 2019.12.06 (71)申请人 浪潮(北京)电子信息产业有限公司 地址 100085 北京市海淀区上地信息路2号 2-1号C栋1层 (72)发明人 林建伟  (74)专利代理机构 北京集佳知识产权代理有限 公司 11227 代理人 丁曼曼 (51)Int.Cl. G06F 8/60(2018.01) 权利要求书2页 说明书7页 附图1页 (54)发明名称 一种人工智能应用的部署方法及相关装置 (57)摘要 本申请公开了一种人工智能应用的部署方 法,包括:根据待部署硬件环境的硬件信息对应 的算力信息和数据带宽信息进行计算强度计算, 得到硬件计算强度值;根据获取到的待部署人工 智能应用的计算量和访存量进行计算强度计算, 得到应用计算强度值;根据所述硬件计算强度值 和所述应用计算强度值之间的比较关系执行性 能调整操作,以便完成所述待部署人工智能应用 的部署操作。通过计算得到硬件计算强度值和应 用计算强度值,经过相互比较的结果执行性能调 整操作,以便完成部署操作,更加符合人工智能 应用的特点。本申请还公开了一种人工智能应用 A 的部署装置、服务器以及计算机可读存储介质, 7 具有以上有益效果。 8 6 5 4 0 1 1 1 N C CN 111045687 A 权 利 要 求 书 1/2页 1.一种人工智能应用的部署方法,其特征在于,包括: 根据待部署硬件环境的硬件信息对应的算力信息和数据带宽信息进行计算强度计算, 得到硬件计算强度值; 根据获取到的待部署人工智能应用的计算量和访存量进行计算强度计算,得到应用计 算强度值; 根据所述硬件计算强度值和所述应用计算强度值之间的比较关系执行性能调整操作, 以便完成所述待部署人工智能应用的部署操作。 2.根据权利要求1所述的部署方法,其特征在于,根据待部署硬件环境的硬件信息对应 的算力信息和数据带宽信息进行计算强度计算,得到硬件计算强度值,包括: 获取所述待部署硬件环境的硬件信息; 根据所述硬件信息获取到对应的所述算力信息和所述数据带宽信息; 计算所述算力信息和所述数据带宽信息的比值,得到所述硬件计算强度值。 3.根据权利要求1所述的部署方法,其特征在于,根据获取到的待部署人工智能应用的 计算量和访存量进行计算强度计算,得到应用计算强度值,包括: 通过预设路径运行所述待部署人工智能应用,提取所述待部署人工智能应用的所述计 算量和所述访存量; 将所述计算量和所述访存量之间进行比值计算,得到所述应用计算强度值。 4.根据权利要求1所述的部署方法,其特征在于,根据所述硬件计算强度值和所述应用 计算强度值之间的比较关系执行性能调整操作,以便完成所述待部署人工智能应用的部署 操作,包括: 当所述硬件计算强度值大于所述应用计算强度值时,将所述待部署人工智能应用的批 处理数据的数量设置为所述待部署硬件环境的最大处理数量; 当所述硬件计算强度值小于所述应用计算强度值时,将所述待部署硬件环境的CPU工 作模式设置为性能模式;同时调整设置GPU频率为最高频率; 当所述硬件计算强度值等于所述应用计算强度值时,发送计算强度匹配成功消息。 5.根据权利要求1所述的部署方法,其特征在于,还包括: 进行日志记录,得到优化日志信息。

文档评论(0)

1亿VIP精品文档

相关文档