- 1
- 0
- 约1.08万字
- 约 10页
- 2023-06-08 发布于四川
- 举报
本发明公开了一种基于人脸和声音的情绪预测方法和系统,其方法的步骤包括:首先采集人脸图像和语音录音样本,接着将人脸图像输入到卷积神经网络中以特定形式提取图像中的空间特征信息,同时将人脸图像输入到局部二进制卷积网络中提取图像的纹理特征信息,将人脸图像的空间特征信息和纹理特征信息进行融合输出增强的人脸特征,然后将语音录音输入到预处理模型计算每个窗口的梅尔频谱图将梅尔频谱图输入到声音编码模型对各个范围的短期梅尔频谱图的相关性进行建模,再通过语音片段嵌入融合器模型输出语音特征,最后将人脸特征和语音特征进行
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112861949 A
(43)申请公布日 2021.05.28
(21)申请号 202110127170.6 G10L 25/30 (2013.01)
(22)申请日 2
原创力文档

文档评论(0)