- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
( )
第26 卷第4 期 佛山科学技术学院学报 自然科学版 . 26 . 4
V o l N o
2008 年7 月 ( ) . 2008
Jou rnal of Fo shan U n iversity N atu ral Science Edition Ju l
文章编号:(2008)
基于音频比对的声纹识别技术
王 东, 陈俊龙, 张鸿贤
(佛山科学技术学院 计算机系, 广东 佛山 528000)
摘要: 为了克服声纹识别技术在应用中存在识别率低、使用情况不稳定、音频特征难以确定等确定。通过大量实
验分析, 建立了一系列声纹识别的音频特征模型, 并对目前普遍使用的匹配算法进行改进。与传统的声纹识别
技术相比, 声纹识别的准确率提高了20% 。
关键词: 声纹识别; 音频特征; 特征模型; 匹配算法
中图分类号: TN 912. 34 文献标识码: A
随着社会的进步以及计算机技术的迅猛发展, 声纹识别技术逐渐成为了研究热点。声纹识别属于生
物特征识别技术, 是一种根据语音波形所反映的说话人生理和行为特征的语音参数的技术。声纹识别系
统主要包括两部分: 特征提取和模式匹配。特征提取的任务是选取惟一能表现说话人身份的有效且稳定
可靠的特征, 并以此作为身份验证的依据; 而模式匹配的任务是把提取的音频特征与训练时提取的音频
特征进行相似性匹配。
1 基本的声学特征
在对音频进行采样的过程中, 需要从采样的样本数据中提取表征说话人惟一特征的音频特征参数,
即能代表原始音频中主要信息的参数[ 1, 2 ]。
1. 1 短时能量
音频短时能量体现了音频信号的幅值随时间的变化情况, 其主要作用是区分话音成分和非话音成
分, 即用来区分“有说话区”和“无说话区”, 也可以用作语音端点检测。音频信号的短时能量定义为
1 N - 1 2 1, 0 ≤ i ≤N - 1
( ) ( ) ( ) ( )
E n = i [S n i n - m ] , i = , 1
N ∑ 0, o th erw ise
i= m
( ) ( )
式 1 中, = 0~ - 1 , 如果 的起点不是从 = 0, 而是某个整数 , 那么相应的能量求和范围为
m N i i m
~ ( - 1) 。
m N
1. 2 短时过零率
过零率定义为单位时间内的过零次数, 其应用主要包括两类: 一类是用于粗略描述信号的频谱特
性, 另一类是用于判别一段音频信号中是否有语音。由于一般的过零率定义计算得到的值易受干扰, 因
此对其计算模型作出如下改进: 设一个门限 , 将过零的含义修改为超过正负门限, 可得下式
T
∞
sgn [x ( ) - T
您可能关注的文档
最近下载
- 安全管理人员初复训考核试卷含答案.doc
- 多模态大模型在金融行业的实践和展望-2024年全球人工智能与大模型开发与应用.pdf
- 电子商务测试题+参考答案.docx VIP
- 2024年江苏省南京市中考历史试题卷(含答案).docx
- 数独的社交互动:与朋友一起挑战数独.pptx VIP
- 大理州经济技术开发区“2.16”建筑施工生产安全事故调查报告警示学习教育.pptx
- 2017年高考全国2卷理综试题(Word版含答案).pdf
- 医疗服务公司医疗旅游服务合作协议.docx
- 人工智能技术在高中语文教学中的实践与应用研究教学研究课题报告.docx
- 山西大学《生物化学》内部题库练习期末真题汇编及答案.docx
文档评论(0)