- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机研究与发展 ISSN N 111777TP
Journal of Computer Research and Development 43 (3) : 470~475 , 2006
基于动态贝叶斯网络的音视频双模态说话人识别
吴志勇 蔡莲红
(清华大学计算机科学与技术系普适计算教育部重点实验室 北京 100084)
(wuzy99 @mailstsinghuaeducn)
AudioVisual Bimodal Speaker Identif ication Using Dynamic Bayesian Net works
Wu Zhiyong and Cai Lianhong
( Key L aboratory of Pervasive Computin g , Minist ry of Education , Depart ment of Computer Science and Technology , Tsinghua
)
U niversity , Beijin g 100084
Abstract Studied in this paper is the use of dynamic Bayesian networks (DBNs) for the task of text
prompt audiovisual bimodal speaker identification The task is to determine the identity of a speaker from
a temporal sequence of audio and visual observations obtained from the acoustic speech and the shape of the
mouth respectively According to the hierarchical structure of audiovisual bimodal modeling , a new DBN is
constructed to describe the natural audio and visual state asynchrony as well as their conditional dependency
over time The experimental results show that the dynamic Bayesian network is a powerful and flexible
methodology for representing and modeling the audiovisual correlations and the proposed DBN can improve
the accuracy of audioonly speaker identification at all levels of acoustic signaltonoise ratio ( SNR) from 0
to 30dB
Key words biometrics ; speaker identification ; audiovisual bimodal modeling ; fusion ; dynamic Bayesian
network (DBN)
摘 要 动态贝叶斯网络在描述具有多个通道的复杂随机过程方面具有优异的性能 基于动态贝叶斯
网络进行音视频双模态说话人识别的工作 分析了音视频联合建模的层级结构 ,利用动态贝叶斯网络
对不同层级的音视频关联关系建立模型 ,并基于该模型进行音视频说话人识别的实验 通过对不同层
级的建模过程及说话人识别实验的结果进行分析 ,结果表明 ,动态贝叶斯网络为描述音视频间的时序相
关性和特征相关性提供了有效的建模方法 ,在不同语音信噪比的情况下均能提高说话人识别的性能
关键词 生物识别 ;说话人识别 ;音视频联合建模 ;融合 ;动态贝叶斯网络
中图法分类号 TP
您可能关注的文档
- 固定化二氧化钛对染料溶液的光催化降解.pdf
- 重点研究基地心理健康教育研究项目-四川社会科学在线.doc
- 国家开发银行2017年第二季度绿色金融债券募集资金披露报告.pdf
- 金徽酒股份有限公司2017年第一次临时股东大会会议资料.pdf
- 国内外低碳农业发展经验及对天津的启示-江苏农业科学.pdf
- 国家核电工作策划书.pdf
- 国内本周要情-陕西科技大学.pdf
- 国内英语课程设计研究现状分析-浙江传媒学院学报.pdf
- 国内高端铝材领军者.pdf
- 金融工程定期报告.pdf
- 陕西高等教育mooc中心转化课程清单-教务处-西安医学院.pdf
- 基于可见/近红外光谱的土壤有机质快速测定方法的研究-aii-ir-主页.pdf
- 基本医疗卫生-山西残疾人联合会.doc
- 基本建设与后勤保障-湖南博物馆.pdf
- 基于可视化类库的植株三维形态配准方法及点云-ingentaconnect.pdf
- 基于可视化的超级玉米生长模拟系统-中国农业科学.pdf
- 基本框架下的香港政党制度-港澳基本法研究中心专题数据库.pdf
- 基本公共服务均等化制度中残疾人福祉设计研究-中国残疾人联合会.pdf
- 基于可靠性理论的被腐蚀钢筋混凝土结构维修次数优化.pdf
- 基本公共卫生服务均等化指标体系研究-中国卫生政策研究.pdf
文档评论(0)