- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN119557630B(45)授权公告日2025.07.08
(21)申请号202510121495.1
(22)申请日2025.01.26
(65)同一申请的已公布的文献号申请公布号CN119557630A
(43)申请公布日2025.03.04
(73)专利权人山东浪潮科学研究院有限公司地址250000山东省济南市高新区浪潮路
1036号SO2号楼
(72)发明人张晨魏子重
GO6N3/0455(2023.01)
GO6N3/0475(2023.01)GO6N3/094(2023.01)
GO6N3/0442(2023.01)GO6F18/25(2023.01)
GO6F18/10(2023.01)
(56)对比文件
CN119130268A,2024.12.13CN118606715A,2024.09.06审查员张罗
(74)专利代理机构济南信达专利事务所有限公
司37100专利代理师陈婷婷
(51)Int.CI.
GO6F18/213(2023.01)
GO6N3/0464(2023.01)权利要求书3页说明书10页附图2页
(54)发明名称
一种基于AI训练平台的多模态数据增强方法和系统
(57)摘要
CN119557630B本发明公开了一种基于AI训练平台的多模态数据增强方法和系统,属于多模态数据处理技术领域,该方法的实现包括:首先,在AI训练平台上开发多模态数据融合管道,通过数据采集模块收集不同模态的数据进行预处理;在预处理阶段,利用多模态数据融合管道对来自不同模态的数据进行特征提取,并在特定层次进行联合建模;然后,采用数据增强管道自动生成高质量的合成数据;最后,开发多模态深度学习管道,以充分学习和理解不同模态数据的深层次特征。本发明解决现有技术中因单一模态数据导致模型学习偏向性的问题,提高了模型的泛化能力和数据处理效率,同时为AI
CN119557630B
CN119557630B权利要求书1/3页
2
1.一种基于AI训练平台的多模态数据增强方法,其特征在于,该方法的实现包括:
首先,在AI训练平台上开发多模态数据融合管道,通过数据采集模块收集不同模态的数据,并进行预处理;在预处理阶段,利用多模态数据融合管道对来自不同模态的数据进行特征提取,并在特定层次进行联合建模;
然后,采用数据增强管道自动生成高质量的合成数据;
最后,开发多模态深度学习管道,以充分学习和理解不同模态数据的深层次特征;
所述多模态数据融合管道,对从不同数据源中采集的多模态数据进行标准化处理,包
括:
对图像数据:进行缩放和归一化,支持两种归一化方式:第一是将图像像素值从0-255的范围调整为0-1;第二是按特定均值和标准差进行归一化,使用ImageNet数据集的标准化值:均值[0.485,0.456,0.406],标准差[0.229,0.224,0.225];
对文本数据:进行分词和编码,使用自然语言处理工具库进行分词,使用BERT、Word2Vec模型将分词后的文本转换为词嵌入向量;
对时间序列数据:进行插值、对齐处理,保证所有数据能够在同一时间轴或同一维度下进行分析;
时序同步与对齐,具体实现如下:
将整个时间序列切片成多个时间段,每个时间段包含多个模态的数据,且可通过插值填补缺失的时刻点;
数据特征提取,具体包括:
图像数据特征提取:使用预训练的卷积神经网络ResNet模型从图像中提取高级特征;在卷积层后,使用全局平均池化,将特征图转换为固定长度的特征向量,进一步用于多模态
融合;
文本数据特征提取:使用预训练的语言模型Transformer对文本数据进行编码,提取文本的语义特征向量;然后,将每个分词后的单词或子词转换为固定长度的向量,输出的特征向量可表示文本中的上下文关系和语义信息;
传感器数据特征提取:使用循环神经网络提取传感器数据中的时间序列特征;
所述数据增强管道,通过生成对抗网络生成模型,利用现有的多模态数据生成新的样本:
训练GAN模型,采用现有的多模态数据作为输入;生成器生成新的样本,而判别器评估生成样本的真实性;通过不
您可能关注的文档
- CN119006165B 一种基于大数据的数据资产评估方法及系统 (中国标准化研究院).docx
- CN119016792B 钢管圆盘锯切割床及其控制方法 (浙江晨龙控股股份有限公司).docx
- CN119044085B 一种基于Mn-CDs纳米酶比色传感技术检测谷胱甘肽的方法 (兰州大学第一医院).docx
- CN119047147B 实现火星探测发射窗口任意时刻起飞诸元设计方法及系统 (深空探测实验室(天都实验室)).docx
- CN119068539B 一种兼容虹膜识别的眼动追踪方法与系统 (深圳市华弘智谷科技有限公司).docx
- CN119087392B 激光雷达数据处理方法及系统 (重庆科技大学).docx
- CN119090588B 一种基于遗传模糊聚类的电商个性化推荐服务方法 (广州航海学院).docx
- CN119094531B 一种边缘云计算负载均衡方法 (江西功博网络科技有限公司).docx
- CN119125727B 变压器的异常监测方法、装置、设备及存储介质 (广东华井科技有限公司).docx
- CN119131621B 一种输电线路无人机巡检图片缺陷识别方法及系统 (南京悠阔电气科技有限公司).docx
最近下载
- 《吞咽困难诊断与治疗》课件.ppt VIP
- 海水的性质——温度、密度和盐度 高中地理湘教版(2019)必修一.ppt VIP
- 实施指南(2025)《HGT 5738-2020 工业过一硫酸氢钾复合盐》.pptx VIP
- 新能源数字孪生智慧运维.docx
- 自体输血血液配型管理.docx VIP
- 海水的盐度和密度 课件高中地理鲁教版(2019版)必修一.pptx VIP
- 考研数学146分学员数学笔记完整版.pdf VIP
- 电网监控与调度自动化交流数据采集与处理课件.ppt VIP
- 2025北京丰台高一(上)期末数学(含答案).pdf VIP
- 循证护理与预见性护理在上消化道出血急救中的应用.docx VIP
原创力文档


文档评论(0)