- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
说话人识别技术及其在工厂自动控制系统中的应用.doc
说话人识别技术及其在工厂自动控制系统中的应用
最近几年,说话人识别技术正在不断发 展。在身份确认关联的领域内,它凸显了重要的作用。 保障现场安全,防止身份不明的人员进入。夜间时段 无人值守,也要配有自动辨识这样的体系。它能通过 判别声音频谱,辨别出说话人。自动管控特有的工厂 系统,在真实运用之中应当搭配最优的软硬件,慎重 辨别身份。
关键词:说话人识别技术;工厂自动控制系统; 具体应用
:TN912.34 :A : 1006-8937 (2015) 08-0050-02
说话人识别体系采纳实时端点这样的测定算法、 基于帧的可行算法。它采纳MFCC特有的参数,当成 可辨识的参数。选取矢量量化、模板匹配这样的识别 计算。通过测试可知,说话人辨识特有的技术框架, 提升了原有的识别水准,保障了自动化架构之下的工 厂安全。与此同时,也便于平日操作,提升运行效率。
1概要的识别流程
说话人识别,是数字处理特有的语音处理。这种 识别方式与语音识别很近似,都是根据接纳的某一语 音,予以信号辨识;在这以后,提炼出有关的特征, 并建构辨识必备模型。说话人识别、近似特性的语音 识别,还是带有差异的。具体而言,说话人识别预设 的侧重点,并非辨识语义内涵,而是从原有的信号以 内提炼出个体特性。
说话人识别细分的层面,包含主体辨认、主体确 认。说话人特有的辨认步骤,是把没能标识出来的语 句,设定成若干主体范畴之中的某一主体,带有选择 的特性;主体确认依托的步骤,是根据拟定好的语句, 判别是否相符。这种确认程序,只包含双重可能:肯 定及否定。
说话人识别这一体系包含初始的认知时段和后续 的识别时段。在认知时段,根据发声语句,建构精准 特性的模型、参量特有的参考集。在后续的识别时段, 通过语音特有的导出参量,来比对预设的参量集,或 者设定好的模板。说话人确认这样的体系,把输入过 来的语音参量,比对特有的个体语音。若二者比对得 来的差值没能超出预设的阈值,则应能确认,否则予 以否认。
2自动控制运用
体系架构之内的工控机,被设定成工厂布设的上
位机。它依托着PCI特有的总线,接纳现场传递过来 的电话语音,并输入接纳的这类信号。工控机调配着 数据库、电话报警特有的界面、控制特性的界面。它 能辨识进到场地之中的操作主体,辨识语音属性,接 受远程特性的指令。PLC及场地架构的RS232,能够互 通信息。自动控制细分出来的现场控制,接纳了开启 指令,可以依循设定好的逻辑,自动管控开关,并管 控变频器。
PLC接纳传感数据发给上位机,上位机辨识下位 机供应过来的这些数值,然后预设反馈指令。说话人 识别特性的板块,包含拟定好的授权验证、拟定命令 输入。在这之中,DSP是辨识模块特有的中心部分, 能够提炼关涉的特征参数、匹配多重模板,同时辨识 有关的判决。DSP凸显的优势,是计算速率很快、内 存量被拓展、数值交换特有的速率也快。它能创设复 杂架构下的算法,搭配DSP特性的芯片,完成识别运 算。
3识别之中的端点测定
端点测定特有的方式,是识别体系架构中的前端 处理。端点检测特有的精准性,密切关涉识别之中的 精准性。例如:给出10个特有的英语数字,在识别测 定之中,端点误差若超出了 50ms,那么对应着的识
别率,就会限缩20%。说话人识别特有的框架,仓J设 了基于帧的、实时端点查验依托的方式,以便测算端
占?
首先,根据语音特有的能量状态、过零率变更的 总倾向,予以简单测定。这样做,能够辨识语音固有 的始末点范畴,提炼频谱特性。
其次,FFT解析得来的频谱结果,包含多频段特 有的布设特征。根据这一特性,可以判别元辅音。
再次,明晰了元辅音、对应着的浊音以后,采纳 前后拓展这样的搜索路径,辨识端点特有的帧。端点 检定预设的这类算法,根据语音固有的根本特性,随 时测定端点。它适应变更着的环境,排除了干扰,提 升测定之中的精准层级。
4辨识语音特性
4.1提炼主体特性
说话人独有的语音特性,关联着更广范畴的心理 状态、个体生理发音。为此,个体表征的语音特性, 带有动态变更的倾向。这种特性涵盖了某一范畴的语 音谱、多声道凸显的特性;与此同时,还包含带有超 音段这样的特性、个体声门状态。说话人固有的语音, 很难被直接显示。为此,采纳语音提炼这一方式,来 辨识语音特征。
搜索得来的信号,包含语音特性、主体个体范畴 的若干特性。这些交织特性,表征了复杂形式。特性 提取依托的步骤,是采纳明晰的语音特征,以便解析 信号。这样做,就舍掉了本源的信息内容,存留了独 有的个体特性。从信息论看,语音辨识关涉的参数影 响,是信息压缩这一总流程。
4.2线性预测解析
线性预测特有的解析技术,也即LP这一技术,是 参数提炼这一领域以内的广泛技术。布设的应用系统 也惯用这一技术提炼出明晰的倒谱参数。传
原创力文档


文档评论(0)