- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第54卷第9期Vol.54No.9
2023年9月Sep.2023
DOI:10.13347/ki.mkaq.2023.09.027
王学立,赵辰燃,李青,等.基于多模态的输送带撕裂大模型算法设计[J].煤矿安全,2023,
54(9):202−207.
WANGXueli,ZHAOChenran,LIQing,etal.Algorithmdesignoflargemodelofbelttearingbasedonmulti-
modality[J].SafetyinCoalMines,2023,54(9):202−207.
基于多模态的输送带撕裂大模型算法设计
12133
王学立,赵辰燃,李青,何显能,甘梅
(1.西安博深安全科技股份有限公司,陕西西安710304;2.西安交通大学软件学院,陕西西安710000;
3.中煤科工集团重庆研究院有限公司,重庆401325)
摘要:AI矿山大模型是一种基于人工智能的矿山智能化解决方案,利用大数据、深度学习、机
器学习等技术,可以帮助矿山企业提高生产效率和安全性。在输送带撕裂检测方面,基于AI矿
山大模型设计了基于Transformer处理多模态数据的一种网络结构,提出了DETR-Audio模型,
将视频和音频的多模态数据拼接、融合,采用DERT模型对视频进行编码,利用短时傅里叶变换
对音频信号进行时频谱分析,再对两者的特征向量进行拼接、融合,最后传入解码器进行融合解
码。该模型经过3000张煤矿矿井下输送带的图片以及相应的音频数据训练和测试后,表现良
好,比单独使用视频或音频信息的模型具有更高的检测准确度和鲁棒性。
关键词:输送带撕裂检测;Transformer;AI矿山大模型;DETR-Audio;多模态数据;算法设计
中图分类号:TD679文献标志码:B文章编号:1003−496X(2023)09−0202−06
Algorithmdesignoflargemodelofbelttearingbasedonmulti-modality
12133
WANGXueli,ZHAOChenran,LIQing,HEXianneng,GANMei
(1.Xi’anBoshenSecurityTechnologyCo.,Ltd.,Xi’an710304,China;2.SchoolofSoftwareEngineering,Xi’anJiaotongUniversity,
Xi’an710000,China;3.ChinaCoalTechnologyandEngineeringGroupChongqingResearchInstituteCo.,Ltd.,
文档评论(0)