新闻广播自动切分与聚类李梅茵1,2,王向东1,2,钱跃良1,刘群1(1.doc

新闻广播自动切分与聚类李梅茵1,2,王向东1,2,钱跃良1,刘群1(1.doc

新闻广播自动切分与聚类李梅茵1,2,王向东1,2,钱跃良1,刘群1(1

新闻广播自动切分与聚类 李梅茵1,2, 王向东1,2, 钱跃良1, 刘群1 (1.中国科学院 计算技术研究所,北京 100080; 2.中国科学院研究生院,北京 100080) 摘要:本文提出了一种实现新闻广播自动切分与聚类的方法,将整个任务分成特征提取、分类、分段、聚类四个步骤进行。分类利用支持向量机(SVM)将音频流分成非语音/男声语音/女声语音三大类,非语音段直接丢弃;分段采用基于GLR距离和BIC相结合的方法;聚类仍采用GLR作为距离测度。将分类放在分段和聚类之前,大大提高了后续步骤的准确度;分段算法在保证高准确度的同时算法时间复杂度较低;分类和分段步骤后的边界调整,使得系统性能进一步提高。 关键词:广播语音;音频分类;自动切分;声学特征转换点检测;说话人聚类 中图法分类号:TP39 文献标识码:A Automatic Segmentation and Clustering of Broadcasting News LI Mei-yin1,2, WANG Xiang-dong1,2, QIAN Yue-liang1, LIU Qun1 (1.Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100080, China; 2. Graduate

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档