- 0
- 0
- 约2.07万字
- 约 34页
- 2026-01-20 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN119622559B(45)授权公告日2025.07.11
(21)申请号202510167640.X
(22)申请日2025.02.17
(65)同一申请的已公布的文献号申请公布号CN119622559A
(43)申请公布日2025.03.14
(73)专利权人山东交通学院
地址250000山东省济南市天桥区交校路5
号
(72)发明人朱振方任钰郅裴洪丽卢强李萌孙晓雯孟静张广渊
柴建勇赵大伟吕蕾陈竹敏
(74)专利代理机构济南圣达知识产权代理有限公司37221
专利代理师董雪
(51)Int.CI.
GO6F
GO6F
GO6F
GO6N
GO6N
GO6N
GO6V
18/2431(2023.01)
18/241(2023.01)
18/25(2023.01)
3/0455(2023.01)
3/042(2023.01)
3/0464(2023.01)
40/70(2022.01)
(56)对比文件
CN118364427A,2024.07.19CN117764086A,2024.03.26CN119248924A,2025.01.03CN119025885A,2024.11.26审查员刘璇
权利要求书5页说明书11页附图2页
(54)发明名称
基于注意力和图增强文本的多模态情感分析方法及系统
(57)摘要
CN119622559B本发明提出了基于注意力和图增强文本的多模态情感分析方法及系统,属于多模态情感分析技术领域;方法包括:获取视频数据中的文本特征、图像特征和语音特征并进行预处理;采用自适应跨模态交互模块计算文本特征与图像特征和语音特征之间的注意力权重,获取增强后的文本特征;将增强后的文本特征输入到分层多模态图融合网络中,利用自注意力机制构建邻接矩阵;将邻接矩阵和增强后的文本特征输入到跳跃连接图卷积网络中,获取最终特征矩阵;将所述特征矩阵和邻接矩阵进行结合,利用编码器和分类器获取情感分析的预测结果。解决不同模态之
CN119622559B
预测
预测
分类头
HMGFN
预训练语言桶型
ACIM
嵌入层
根健特征斑C
NLP方法Tokeatzer
语音
预训练语吉模型
语音特征网C
嵌入层
ACIM
CN119622559B权利要求书1/5页
2
1.基于注意力和图增强文本的多模态情感分析方法,其特征在于,包括:
获取视频数据中的文本特征、图像特征和语音特征并进行预处理;其中,对于视频片段X,其由文本序列t、声学序列a和视觉序列v组成;
将预处理后的文本特征、图像特征和语音特征输入到训练好的多模态情感分析模型中,获取情感分析的预测结果;
其中训练好的多模态情感分析模型采用自适应跨模态交互模块计算文本特征与图像特征和语音特征之间的注意力权重,获取增强后的文本特征,包括:
采用自适应跨模态交互模块将所述图像特征和语音特征映射成统一的索引序列;其中,采用自适应跨模态交互模块将所述图像特征和语音特征映射成统一的索引序列的过程包括:
获取视频数据中的图像帧和语音帧,并构建特征集;
采用k-means方法对图像帧和语音帧进行聚类,通过聚类中心,构建视觉词汇和听觉词汇,将图像特征和语音特征通过聚类中心进行词汇化,使得索引序列与文本序列的离散词汇形式相匹配;
将特征序列转化为索引,具体的,给定一个特征序列需要将其转换为对应的索引序列In∈RLn;对于第i帧的,其索引通过以下方式计算:
找到距离最近的聚类中
的索引j;|I-2为计算特征与聚类中心之间的欧氏距离;最终得到索引序列
作为模态n的表示;
利用跨模态注意力机制对索引向量进行处理,计算文本特征与图像特征和语音特征之间的注意力权重,获取增强后的文本特征;
其中,利用跨模态注意力机制对索引向量进行处理,计算文本特征与图像特征和语音特征之间的注意力权重,获取增强后的文本特征,包括:
通过嵌入层将离散的索引序列映射为连续的高维向量表示;
En=Embedding(In)∈RLn×dn
其中En为嵌入层的输出,dn为嵌入维度;Embedding为嵌入层函数;Ln表示模态的序列长度;
将文本特征作为查询向量,图像特征和语音特
您可能关注的文档
- CN115240578B 命令模式与视频模式间无缝切换的方法和装置及显示装置 (美格纳智芯混合信号有限公司).docx
- CN115271161B 一种多能负荷短期预测方法 (华南理工大学).docx
- CN115309195B 一种光伏跟踪轴的控制方法、装置及光伏跟踪系统 (仁卓智能科技有限公司).docx
- CN115309814B 基于结构化低秩张量补全的物联网数据重建方法 (河北工业大学).docx
- CN115310378B 一种极端台风灾害下电网韧性评估及差异化规划方法 (武汉大学).docx
- CN115330663B 眼前节oct图像中巩膜镜和泪液镜边界分割方法 (温州医科大学).docx
- CN115344041B 一种自移动装置的控制方法、自移动装置及自移动设备 (科沃斯机器人股份有限公司).docx
- CN115346463B 一种图像显示方法及装置 (北京奕斯伟计算技术股份有限公司).docx
- CN115408860B 一种风电场风速-功率数据的异常值监测及修正方法 (河北工业大学).docx
- CN115455382B 一种二进制函数代码的语义比对方法及装置 (武汉大学).docx
- 25-26学年政治(部编版)选择性必修第二册课件:第1单元 周清1 民法中的人身权及财产权.pptx
- 25-26学年政治(部编版)选择性必修第二册课件:1.4.1 权利保障 于法有据.pptx
- 2025北京丰台区高二(上)期中地理(A卷)含答案.docx
- 2025北京三帆中学初三(上)开学考英语试题含答案.docx
- 2025北京一零一中初三9月月考语文试题含答案.docx
- 2025北京海淀区初三(上)期中道法试题含答案.docx
- 2025北京丰台区高一(上)期中政治(A卷)含答案.docx
- 25-26学年政治统编版必修4课件:3.3 唯物辩证法的实质与核心.pptx
- 25-26学年政治统编版必修4课件:7.2 正确认识中华传统文化.pptx
- 湖北省部分高中2026届高三上学期二模联考 历史试卷.docx
最近下载
- 部编版道德与法治一年级下册第8课《大家来合作》精美课件.pptx VIP
- 银行国际业务基础知识.pdf VIP
- 《恒压频比控制下交流异步电机调速系统仿真》.docx VIP
- 矿山生态保护修复验收规范.pdf VIP
- 浙江省杭州市西湖区2024-2025学年九年级上学期数学期末试卷(含答案).docx VIP
- 山东省济南市历城区2023-2024学年五年级上学期期末数学试卷(含答案).docx VIP
- 城市景观规划设计外文文献翻译 .pdf VIP
- PEP人教版小学英语三年级上册期末测试卷(一)(答案+听力材料).doc VIP
- 小升初英语试卷及答案.pdf VIP
- 安全知识 培训.docx VIP
原创力文档

文档评论(0)