语音DOA技术在视频会议系统中的应用.pdfVIP

语音DOA技术在视频会议系统中的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音DOA技术在视频会议系统中的应用.pdf

电子技术 ·Electronictechnology 语音 DOA技术在视频会议系统中的应用 文/舒雪姣 陈景发 敬代波 本文系统地研究了基于麦克 风阵列的声源定位方法,分析 了 一 种基于麦克风阵列的延时估计 方法。通过仿真 实验证明了该种 算法的实用性及局限性,论证 了 I)OA技术在视频会议系统应用中的 可行性。 叮fa凸 【关键词】麦克风阵列 延时估计 LMS IterativeLoop 进入信息化时代以来,人们开始用现代 图2-1:混响情况下,SNR=5dB 化手段研究语音处理技术,使人们能够更加有 效地生产、传输、存储、获取和应用语音信息, 以促进社会发展。现在,视频讲座和教程在网 络教学和远程教育中应用越来越多,同时也受 到在校学生的追捧 。教师在讲课过程 中会不断 移动位置,如果在录制过程中要求摄像头一直 c口 对准老师,那么通常就需要人工控制,但这样 ∞ D 成本太高,所以我们希望能够实现摄像头转动 的自动控制。教师讲课就要发出声音,因此利 用定位声源控制摄像头转动就成了一种相对简 单的方法。 波达方向估计 (DOA)技术的关键在于 Iterativ~Loop 利用处在不同空间中的传感器阵列的阵元,接 收一个或多个不同方向的信号源发出的信号, 图2-2:混响情况下,SNR=OdB 然后利用现代信号处理方法快速、高精度地估 计出期望信号的方向,进而确定声源的位置。 基于麦克风阵列的声源定位技术本质上属于波 到的信号y。(k)和 y2(k)分别作为 自适应延时估 自适应滤波器基于输出最小误差的LMS 达方向估计的一个研究方向。本文主要研究了 计系统的基本输入信号和参考输入信号,用 准则来 自适应的调整权系数w(k)。根据 LMS 基于麦克风阵列的最小均方 自适应时延估计声 Y(k)去逼近Y。(k),Z 表示延迟一个采样时间 准则,当自适应滤波器系数为: 源定位算法,为视频会议、电话会议等系统中 间隔。wm(k),m=一P,一p+l,…,0,1,…,p为 自适 w(k)=R;J2(k)R2(k) (1—6) 自动控制摄像头对准发言人提供简单可行的方 应滤波器加权系数,k表示时间变量。z 是为 此 时,y。(n)和 y2(n)之 间 的均 方 误 差 法 。 了保证系统的因果性而引入的P个采样时间间 E[e(k)]达到最小值,此时滤波器系数w(k)收 隔,从而保证该结构能够适应延时t为正 (y(k) 敛。然后找出w(k)中最大值对应的下标m, 1最小均方 (LMS)自适应时延估计法 滞后Yl(k))和负 (y2(k)超前y。(k))两种情况。 再减去P,就能得到延时T。如果T不是采样 自适应 LMS延时估计法原理的框图如图 周期的整数倍,可 以对w( 进行插值得到延 1.1所示。用该方法求延时时,将两阵元接收 根据 自适应滤波器原理,基于LMS的时 时 。 延估计算法如下: 2LMS自适应时延估计法仿真

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档