种用于机器人语言任意说话者识别方案.pdfVIP

种用于机器人语言任意说话者识别方案.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6巷第4期 苏 州 大 学 学 报 (自然科学) oJ.6No.4 竺 JOU! UNIVE.R.S.TY一(NAT...U.—RAL—SCIENC—E Oct.1990 一 种 用 于 机 器 人 语 言 的 任 意 说 话 者 识 别 方 案 . 力 周桑特 (电子工程采) 摘 要:本文提 出了光利 用基音周期和声调特征.把说话人分成 若干层次,再利 用LPC参数韫定 同一层次话者的个人差符合高斯分布 采用 贝叶斯判别法消除其影 响进行任意话者语音识别的方法.拳文利 用该方法,选择不 同屡次说 话 人 在IBM—PC/xT计算机上进行模拟 识别试验,识别率在90嘶以上. 关键词 :语音.任意说话人 ,识别. 引 言 与说话人无关的语音识剐要克服的最大刚难就是个人差的存在.由于说话人的发音 器官的构造以及发音习惯的差异造成的语音的特短差异给语音识别带来很 大 困难 .而 且,要想克暇这些困难也并非是容易的事情.Il】在 往的经验 中,克服个人差的方法主 要有:对一个识别单位设定复数个标准模板;利用统计阁方法从许多说话人的发音参数 中得到平均的标准模板 极积地对古有个人差的语音参数进行归正 ,倒如,共振峰位置 归正法,DP法等.这些方法应该说都是前人总结的有效方法 .… 但这些方法也都有利 弊,主要表现在识别率的提高和运算量的增大这对矛盾上,怎样在运算量不增加过大的 情况下,提高识别牢是有待进,一步探 的问题.针对上述问题,本文提出了分两步消除 个人差影响的任意话者识别系统朗整体方案.实验i正明,利用本方法大大提高了识别率 而运算量却增加不多. 1 说话人差别的劳析 说话人差别主要来源予不 同话嚣的语音生成器官的构造差别,以及语音环境、发音 习惯的差别,由于不同年龄和不同性刷的说话人发音器官的构造上有整异,所以。所发 的音的物理性质也有羞异,而硅这种差剐是引起个人差的主要原因.讯音生成器官的器 收稿 Ⅱ帮:1089一n7—01 毋 ,lI大 学 学 报 (岛拣科学) 第6卷 别又可分为声带音源特性的差别和声道特性 的差别.它们主要反映在基频周期,频谱 曲 线的形状以及共振峰位置等的差别.如表(1)是一个45岁的男性乖一【个25岁的女性,对 同一元音发第一声的基音周期序列.从表中可以看出,差别是大的,而且,这种差别呈 现明显的阶梯性. 裹 l 基音周期举例 (周期单位:10 s 基音周期序列 1 2 3 4 5 6 7 8 9 10 “ 12 45岁的男性 51 52 52 50 51 50 50 50 52 50 51 5O 25岁的女性 28 28 30 30 30 28 27 30 30 30 28 28 另外,根据文献记载和 自己的实验分析,发现由个人差引起的语音参数l询羞别,其 分布都符合高斯分布.例如,根据文献对男女各十九人的基频分布统计表 明,男女发音 人的基频分布符合高斯分布.(见图1).t。基于上述分析,我们可以把说话人差别分成不 同层次说话人之 问的层别差 以及 同一层 次不同说话人之间的个人差.层别差是 由于语音 生成器官的构造差别引起的,它是说话人差别的 主要成份,同一层次个人差主要是由调音器官的 细微差别以及语音环境、发音习惯的差别.识别 时分两步消除个人差的影响.首先利用基频及声 调特征来区分不同层扶的话者,并在每一层次准 备相应的单词样本.转入相应层次后对同一层次 说话人之间的个人差,假定它们引起的单词差别 符合高新分布,利用贝叶斯判别器进行单词识别. 图 1 基频统计特性 2 识别方法 本系统待识别的语言是命令机器人动作的指令语句,共20个单词 表 2.由于率系 统在进行层别差分离时,要使 用基 音周期和四声特征参数.因此为了提高识别效率, 我们同时利用基音周期和声调特征对单诃进行粗判,把待识别的单词分艘心个子集。个

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档