- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
有混响条件下的内语音定向研究
有混响条件下的室内语音定向研究
摘 要
一f语音定向技术是一个具有广阔应用前景的研究课题,它是智能机器人人工
耳的重要组成部分,并可以应用于智能控制的会议电视,法庭录像,游戏娱乐
等各仑方面。目前语音定向技术中关键难题是有混响条件下的室内语音定向研
究:了
本文对室内有混响条件下的语音定向问题进行了系统的研究,从听觉仿
真、室内声学、信号处理、语音特征等各个角度较为全面深入地分析研究了影
响语音定向及其定位精度的各种问题。
本论文主要作了以下有特色的研究工作:
1)通过试验证实了混晌情况下采用高频分量比采用低频分量的定向识别率要
高,进而根据人类听觉对高频分量主要依靠强度信息来定位这一特征,优选了
数字波束合成法来完成联合算法中的时延傍讳√这同时也证明了将听觉定位研
究的结果运用到语音定向系统的重要性。) \
2)初步设计和完成了一个用于语音定向系统研究的硬件系统。该系统配有程控
可3维自由转向的摄像头以及和PC进行通讯的USB接口。从而为听觉、视觉
联合研究提供了一个理想的硬件平台。、输入部分具有四通道,各通道具有
1MHz实时采样率和12Bits采样分辨率。、核心器件是11公司的DSPC5416,具
出了一种新的语音定向方法即联合算法,该算法利用由室内脉冲响应模型得到
的回波强度因子,检出受混晌影响较小的信号片段,再利用语音处理技术中基
于短时能量分析的端点检测、清浊音判别等技术将检出片段中无声片段进行剔
除,以获得有效语音片段,最后根据人耳定向基于强度和时间差的特点,选择
了数字波束合成时延估计法对有效语音片段进行方位角估计,并利用先截尾后
加权算术平均的方法对输出结果进行处理,从而使得在有混响室内条件下的水
平方向定位精度接近人耳定位的精度。
4)首次探讨了将说话人识别技术用于语音定向的可能性,指出了利用我们提出
的联合算法的计算结果作为训练和测试数据,用于完成目前对主要说话人的识
别算法所需要的训练和测试过程,在理论和技术上是完全可行删从而解决了
室内语音定向利用说话人识别技术的关键问题,为提高并最终全面解决多人条
件下的室内语音定向问题提供了一个独创的理论方法。
总之,通过论文期间的研究和实验工作,我们在解决室内语音定向中的关
键难题——混响干扰时,首次引入了语音特征和说话人识别等语音处理技术,
并在理论和实验上初步证明了它是非常有效的方法。调研结果和文献研究表 ,
明,我们在室内语音定向问题上的研究无论在国际上或国内都是具有特色的。厂
关键词:语音定向,混响,语音处理,听觉仿真,时延估计
lI
The of localization
research
speech
inthe
reverberantroom
Abstract
The localizationisa researchisa of
speech technique field,it
promising keypart
the robot it
artificial in
canbeusedthe
intelligent ear,and
conference court entertainmentand
文档评论(0)