- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六届全国人机语音通讯学术会议 中国 深A
T863:多话筒非特定人连续语音电话窄带语音数据库的建设
岁笋,者习
中科院声学所语音交互技术研究中心
luoe止ds.aacndulma,iis.ac.co
接来自真实电话信道,同时采用多话筒并行录音的方
摘要 式,能较好的反映电话语音的统计特性,对电话语音
本论文描述了中科院声学所语音交互技术研究中心多 识别、话者识别系统的建设都具有较大的意义.
话简、非特定人、连续语音、电话窄带语音数据库T863 电话语音识别系统性能下降的一个主要原因是电话线
建设的一些问题。1863是通过播放多话者、连续纯净 路信道 (不包括话筒)的多变性[11e即使我们使用同
语音863数据库语音,并便之经过多种话简和公用电 一部电话对同一个电话号码进行拨号并建立连接,不
话交换网 P‘STN,构成的多个电话语音通话信道,并 同的拨号连接对应的电话线路信道也具有比较明显的
行录音,从而获得的多话简、非特定人、连续语音、 差异。为了准确的记录电话线路信道的统计学特性,
电话窄带语音数据库。T863的数据直接来自真实电话 T863电话语音数据都由一个特定的电话语音数据采集
信道,同时采用多话筒并行录音的方式,能较好的反 系统从真实的电话信道环境采集。该数据采集系统能
映电话语音的统计特性,为电话语音识别、话者识别 够通过声源 (人嘴模拟器或者音箱)自动播放863纯
系统的研究奠定了坚实的荃础。 净语音致据库中的语音文件,语音通过排列在声源前
面的多个电话话简构成的阵列进入公用电话网
1.引言 (PSTN),并在电话网的另外一端自动录音。为了记
录不同拨号连接对应的电话线路信道差异,每记录
当前流行的语音识别系统的性能严重依赖于建设识别 10--100句语音后,系统讲自动挂断当前电话线路连
系统的训练数据和实际应用环境数据之间的匹配程 接,井重新拨号,开始下一次电话语音数据采集。
度。当训练数据和实际数据之间具有较大的差异时, 电话语音识别系统性能下降的另外一个重要原因是话
系统性能发生急剧的下降[11。由于电话语音识别系统 筒的多变性。由于电话识别系统的终端设备 (用户电
在实际应用中常常受到各种影响因素的挑战,导致其 话机)分布及其广泛,因此,很难对用户使用的话简
性能下降,难以达到实际应用的要求。为了对电话信 类型进行限制,从而使该问题变得更加突出。有文献
道下的语音进行声学特性分析,研究新的电话语音识 指出,话简多变性对语音识别系统和话者识别系统性
别健壮性方法,或者建设非特定人连续语音识别系统, 能有巨大的影响[1)[2].为了记录不同电话话简对电话
建设一个多话筒、非特定人、连续语音、电话窄带语 语音的影响,T863数据库记录了多种电话话筒的录音
音数据库是非常必要的。然而不幸的是,研究者可用 结果。T863数据库采用12个不同的话简进行录音 4
的公共中文电话语音数据库很少。电话语音数据库的 个炭精式话简 (carbonhandset)、4个111极体式话简
缺乏成为限制中文电话语音识别系统
您可能关注的文档
- RM-200转矩流变仪的研制.pdf
- Robocup中在线教练程序的设计.pdf
- RP-HPLC-ELSD法同时测定银杏叶微乳软胶囊中4种萜类内酯的含量.pdf
- RP-HPLC测定复方醋酸棉酚片含量及其有关物质.pdf
- RP--HPLC测定人全血中环孢霉素A浓度的方法的研究.pdf
- RP-HPLC测定肾移植受者全血中CsA的c0%2cc2值.pdf
- RP-HPLC测定通窍鼻炎片中欧前胡素的含量.pdf
- RP-HPLC测定头孢尼西钠有关物质的方法的研究.pdf
- RP-HPLC同时测定大黄水提物中5种大黄游离型葸醌类衍生物的含量.pdf
- RP-HPLC同时测定壳聚糖止血海绵中3组分的含量.pdf
- 新解读《GB_T 33250-2016科研组织知识产权管理规范》.docx
- 新解读《GB_T 33327-2016紫外光固化涂料 贮存稳定性的评定》.docx
- 新解读《GB_T 2900.20-2016电工术语 高压开关设备和控制设备》.docx
- 新解读《GB_T 32689-2016发酵法氨基酸良好生产规范》.docx
- 新解读《GB_T 32929-2016电子商务交易产品信息描述 数码产品》.docx
- 新解读《GB_T 32677-2016牙膏中无机亚硫酸盐的检测方法》.docx
- 新解读《GB_T 33070-2016工业用聚N-乙烯基吡咯烷酮》.docx
- 新解读《GB_T 32549-2016萤石 评价品质波动的试验方法》.docx
- 新解读《GB_T 32740-2016自然生态系统土壤长期定位监测指南》.docx
- 新解读《GB_T 32745-2016小型水轮机磨蚀防护导则》.docx
文档评论(0)