T863%3a多话筒非特定人连续语音电话窄带语音数据库的建设.pdfVIP

T863%3a多话筒非特定人连续语音电话窄带语音数据库的建设.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六届全国人机语音通讯学术会议 中国 深A T863:多话筒非特定人连续语音电话窄带语音数据库的建设 岁笋,者习 中科院声学所语音交互技术研究中心 luoe止ds.aacndulma,iis.ac.co 接来自真实电话信道,同时采用多话筒并行录音的方 摘要 式,能较好的反映电话语音的统计特性,对电话语音 本论文描述了中科院声学所语音交互技术研究中心多 识别、话者识别系统的建设都具有较大的意义. 话简、非特定人、连续语音、电话窄带语音数据库T863 电话语音识别系统性能下降的一个主要原因是电话线 建设的一些问题。1863是通过播放多话者、连续纯净 路信道 (不包括话筒)的多变性[11e即使我们使用同 语音863数据库语音,并便之经过多种话简和公用电 一部电话对同一个电话号码进行拨号并建立连接,不 话交换网 P‘STN,构成的多个电话语音通话信道,并 同的拨号连接对应的电话线路信道也具有比较明显的 行录音,从而获得的多话简、非特定人、连续语音、 差异。为了准确的记录电话线路信道的统计学特性, 电话窄带语音数据库。T863的数据直接来自真实电话 T863电话语音数据都由一个特定的电话语音数据采集 信道,同时采用多话筒并行录音的方式,能较好的反 系统从真实的电话信道环境采集。该数据采集系统能 映电话语音的统计特性,为电话语音识别、话者识别 够通过声源 (人嘴模拟器或者音箱)自动播放863纯 系统的研究奠定了坚实的荃础。 净语音致据库中的语音文件,语音通过排列在声源前 面的多个电话话简构成的阵列进入公用电话网 1.引言 (PSTN),并在电话网的另外一端自动录音。为了记 录不同拨号连接对应的电话线路信道差异,每记录 当前流行的语音识别系统的性能严重依赖于建设识别 10--100句语音后,系统讲自动挂断当前电话线路连 系统的训练数据和实际应用环境数据之间的匹配程 接,井重新拨号,开始下一次电话语音数据采集。 度。当训练数据和实际数据之间具有较大的差异时, 电话语音识别系统性能下降的另外一个重要原因是话 系统性能发生急剧的下降[11。由于电话语音识别系统 筒的多变性。由于电话识别系统的终端设备 (用户电 在实际应用中常常受到各种影响因素的挑战,导致其 话机)分布及其广泛,因此,很难对用户使用的话简 性能下降,难以达到实际应用的要求。为了对电话信 类型进行限制,从而使该问题变得更加突出。有文献 道下的语音进行声学特性分析,研究新的电话语音识 指出,话简多变性对语音识别系统和话者识别系统性 别健壮性方法,或者建设非特定人连续语音识别系统, 能有巨大的影响[1)[2].为了记录不同电话话简对电话 建设一个多话筒、非特定人、连续语音、电话窄带语 语音的影响,T863数据库记录了多种电话话筒的录音 音数据库是非常必要的。然而不幸的是,研究者可用 结果。T863数据库采用12个不同的话简进行录音 4 的公共中文电话语音数据库很少。电话语音数据库的 个炭精式话简 (carbonhandset)、4个111极体式话简 缺乏成为限制中文电话语音识别系统

文档评论(0)

wuhuaiyu002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档