DSP课程论文.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DSP课程论文

基于TMS320C6713 DSK的声纹识别系统设计 摘 要:声纹识别技术,即声纹识别技术,以其独特的方便性、经济性和准确性等优点受到广泛瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式之一,有着广阔的市场应用前景。 本文概述了声纹识别技术的概况及特征提取、模式识别等声纹识别的主要技术理论。系统在TMS320C6713 DSK上实现[1],采用美尔倒谱系数[1,2]作为特征参数,以高斯混合模型[1,3]作为识别模型。为了实现自举运行,模型参数存储在FLASHROM存储器中,以保证参数在掉电情况下不会丢失。系统充分的体现了人性化特点,设置了训练和识别的选择功能,并可进行说话人删除、补充、替换和更新工作;系统运行过程中,由DSP实验板自带的LED灯组合来显示系统的运行状态及最终的运行结果。 关键词: 声纹识别;DSP;美尔倒谱系数;高斯混合模型 声纹识别技术的发展及现状 声纹识别,又称声纹识别,是根据语音信号反映的说话人生理和行为特征的语音参数来确定或鉴别说话人身份的技术。由于每个人独特的声道特性和发音特点,使得说话人的语音信号具有区别于其他说话人的特征,这就是声纹识别的基本依据。声纹识别根据具体完成的识别任务分为说话人辨认和说话人确认。前者是说话人不声明身份,根据一段语音由系统判定目标属于一群人中的某个特定的人;后者是说话人声明身份,然后由系统确认是不是他所声称的人。根据识别对象的不同,可以将声纹识别分为与文本有关的声纹识别和与文本无关的声纹识别[1,4,5]。与文本有关的声纹识别,要求说话人提供发音的关键词或关键句子作为训练文本,而识别也必须按相同的内容发音;与文本无关的声纹识别,不论在训练还是识别都不规定说话内容,即其识别对象是自由的语音信号[3,4]. 声纹识别的研究始于20世纪30年代。早期的工作主要集中在人耳听辨实验和探讨听音识别的可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。Bell实验室的L.G. Kesta目视观察语图谱进行识别,提出了“声纹”的概念。之后,电子技术和计算机技术的发展,使得通过及其自动识别人的声音成为可能。Bell实验室的S.Pruzansky提出了基于模板匹配和概率统计方差分析的声纹识别方法[5],引起信号处理领域的许多学者的注意,形成了声纹识别研究的一个高潮。期间的工作主要集中在各种识别参数的提取、选择和实验上,并将线性预测分析等方法应用于声纹识别。 20 世纪 70年代末至今,声纹识别的研究重点转向对各种声学参数的线性或非线性处理以及新的模式匹配上,如动态时间调整、主成分分析、隐马尔可夫模型、神经网络和多特征组合等技术[6,7]。如今,声纹识别技术已经逐渐走向实际应用。ATT应用声纹识别技术研制出了智能卡,已经用于自动提款机。欧洲电信联盟在电信与金融结合领域应用声纹识别技术,完成了CAVE (CallerVerification in Banking and Telecomunication)计划,并启动TPICASSO (Pioneering Call Authentication for Secure Service Operation)计划,在电信网上完成了声纹识别。同时,Motorola和Visa等公司成立了V-comerce联盟,希望实现电子交易的自助化,其中通过声音确定人的身份是此项目的重要组成部分。其他的一些商用系统还包括:ITT公司的SpeakerKey,Keyware公司的VoiceGuardian, T-NETIX公司的SpeakEZ等。可见,声纹识别正逐步走入实用化阶段,并进入到人们的生活中去。 国内开展声纹识别研究的机构由北京大学、中科院声学所、中科院自动化所、清华大学、北京交通大学等,并先后得到了国家自然科学基金重大和重点项目等基金的支持,并取得了一定的研究成果。 二、声纹识别的原理 训练语音通过前端处理得到特征序列,语音信号的前端处理包括信号的数字化、预处理、端点检测、特征提取[2,5,8]。人之所以能够根据语音信号将声纹识别出来,是因为语音信号中包含了与说话人有关的信息。特征提取的作用就是提取能够表征人的特性的参数。这些特征序列通过训练得到每个使用者的模板或模板参数参考集 在使用时,语音通过相同的前端处理 ,得到特征序列,这些特征序列再与训练过程得到的模板比较,根据一定的相似性进行判断[9]。对于说话人辨认来说,提取的参数要与训练过程中的每一个人的参考模型加以比较,并把与它最近的那个参考模板所对应的使用者辨认为发出输入语音的说话人。对于确认来讲,则是将输入语音中导出的特征参数与其声音为某人的参考向量相比较。如果两者的距离小于规定的阐值,则予以确认,否则予以拒绝。声

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档