CN119557630B 一种基于ai训练平台的多模态数据增强方法和系统 (山东浪潮科学研究院有限公司).docxVIP

CN119557630B 一种基于ai训练平台的多模态数据增强方法和系统 (山东浪潮科学研究院有限公司).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN119557630B(45)授权公告日2025.07.08

(21)申请号202510121495.1

(22)申请日2025.01.26

(65)同一申请的已公布的文献号申请公布号CN119557630A

(43)申请公布日2025.03.04

(73)专利权人山东浪潮科学研究院有限公司地址250000山东省济南市高新区浪潮路

1036号SO2号楼

(72)发明人张晨魏子重

GO6N3/0455(2023.01)

GO6N3/0475(2023.01)GO6N3/094(2023.01)

GO6N3/0442(2023.01)GO6F18/25(2023.01)

GO6F18/10(2023.01)

(56)对比文件

CN119130268A,2024.12.13CN118606715A,2024.09.06审查员张罗

(74)专利代理机构济南信达专利事务所有限公

司37100专利代理师陈婷婷

(51)Int.CI.

GO6F18/213(2023.01)

GO6N3/0464(2023.01)权利要求书3页说明书10页附图2页

(54)发明名称

一种基于AI训练平台的多模态数据增强方法和系统

(57)摘要

CN119557630B本发明公开了一种基于AI训练平台的多模态数据增强方法和系统,属于多模态数据处理技术领域,该方法的实现包括:首先,在AI训练平台上开发多模态数据融合管道,通过数据采集模块收集不同模态的数据进行预处理;在预处理阶段,利用多模态数据融合管道对来自不同模态的数据进行特征提取,并在特定层次进行联合建模;然后,采用数据增强管道自动生成高质量的合成数据;最后,开发多模态深度学习管道,以充分学习和理解不同模态数据的深层次特征。本发明解决现有技术中因单一模态数据导致模型学习偏向性的问题,提高了模型的泛化能力和数据处理效率,同时为AI

CN119557630B

CN119557630B权利要求书1/3页

2

1.一种基于AI训练平台的多模态数据增强方法,其特征在于,该方法的实现包括:

首先,在AI训练平台上开发多模态数据融合管道,通过数据采集模块收集不同模态的数据,并进行预处理;在预处理阶段,利用多模态数据融合管道对来自不同模态的数据进行特征提取,并在特定层次进行联合建模;

然后,采用数据增强管道自动生成高质量的合成数据;

最后,开发多模态深度学习管道,以充分学习和理解不同模态数据的深层次特征;

所述多模态数据融合管道,对从不同数据源中采集的多模态数据进行标准化处理,包

括:

对图像数据:进行缩放和归一化,支持两种归一化方式:第一是将图像像素值从0-255的范围调整为0-1;第二是按特定均值和标准差进行归一化,使用ImageNet数据集的标准化值:均值[0.485,0.456,0.406],标准差[0.229,0.224,0.225];

对文本数据:进行分词和编码,使用自然语言处理工具库进行分词,使用BERT、Word2Vec模型将分词后的文本转换为词嵌入向量;

对时间序列数据:进行插值、对齐处理,保证所有数据能够在同一时间轴或同一维度下进行分析;

时序同步与对齐,具体实现如下:

将整个时间序列切片成多个时间段,每个时间段包含多个模态的数据,且可通过插值填补缺失的时刻点;

数据特征提取,具体包括:

图像数据特征提取:使用预训练的卷积神经网络ResNet模型从图像中提取高级特征;在卷积层后,使用全局平均池化,将特征图转换为固定长度的特征向量,进一步用于多模态

融合;

文本数据特征提取:使用预训练的语言模型Transformer对文本数据进行编码,提取文本的语义特征向量;然后,将每个分词后的单词或子词转换为固定长度的向量,输出的特征向量可表示文本中的上下文关系和语义信息;

传感器数据特征提取:使用循环神经网络提取传感器数据中的时间序列特征;

所述数据增强管道,通过生成对抗网络生成模型,利用现有的多模态数据生成新的样本:

训练GAN模型,采用现有的多模态数据作为输入;生成器生成新的样本,而判别器评估生成样本的真实性;通过不

您可能关注的文档

文档评论(0)

xm + 关注
实名认证
文档贡献者

专业学习资料,专业文档

1亿VIP精品文档

相关文档