- 16
- 0
- 约3.85万字
- 约 8页
- 2018-11-18 发布于天津
- 举报
离散标签与维度空间结合的语音数据库设计
第 37 卷第 4 期 声 学 技 术 Vol.37, No.4
2018 年 8 月 Technical Acoustics Aug., 2018
离散标签与维度空间结合的语音数据库设计
陈 颖,肖仲喆
(苏州大学光电信息科学与工程学院,江苏苏州215006)
摘要 :建立了一个将离散情感标签与维度情感空间结合起来的汉语情感语音数据库。该数据库由 16 名母语为汉语
说话人对情感语音进行表演型录制。语音样本是根据中性、愉悦、高兴、沮丧、愤怒、哀伤,以及悲伤等七种离散
的情感标签采集而得,每名说话人有 336 条语音样本。随后由三名标注人在维度空间上对每条语音样本进行标注。
最后,根据标注所得的数据来研究这七种情感在维度空间的分布情况,并分析了情感在一致性、集中性和差异性方
面的性能。除此以外,还计算了这七种情感的情感识别率。结果显示,三名标注人对该数据库标注的一致性都达到
了 80%以上,情感之间的可区分度较高,并且七种情感的情感识别率均高于基线水平。因此,该数据库具有较好
情感质量,能够为离散情感标签到维度情感空间的转化提供重要的研究依据。
关键字:离散情感标签;维度情感空间;汉语;情感识别
中图分类号:TP392 文献标识码 :A 文章编号 :1000-3630(2018)-04-0380-08
DOI 编码 :10.16300/ki.1000-3630.2018.04.015
Design of discrete tags and dimensional space combined
emotional speech database
CHEN Ying, XIAO Zhong-zhe
(School of Optoelectronic Information Science and Engineering , Soochow University, Suzhou 215006, Jiangsu, China)
Abstract: This paper establishes a Mandarin emotional speech database that combines discrete emotion tags with di-
mensional emotion space. The database is recorded for 16 Chinese native speakers in performing Chinese emotional
speech. The speech samples are acquired from seven discrete emotion tags, such as neutrality, pleasure, happyness,
frustration, anger, sorrow, and sadness. Each speaker receives 336 utterances. Then, each of the speech samples is an-
notated by three annotators in dimensional space. Finally, according t
原创力文档

文档评论(0)