- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
【语音处理】4个基本的时域信号特征分析技术
上一节主要介绍了关于加窗函数的相关内容。对语音的时域信号
进行分析是最直观的分析方式。本文将介绍语音信号处理中四种时域
特征,分别是短时能量、短时过零率、短时自相关函数以及短时平均
幅度差。
作者编辑|小米粥
编辑|言有三
1.短时能量
由于语音信号具有短时平稳性,我们通常对语音进行分帧处理。
首先定义矩形窗为w(m),那么对于语音信号x(t),其加窗分帧后第n
帧语音信号xn(m)为
矩形窗的是最直观、简单的窗函数,我们以其为例进行说明。矩
形窗的表达式为:
在该计算式中,n=0,T,2T,...,N为帧长,T为帧移长度。
第n帧语音信号xn(m)的短时能量En为
使用幅值平方将对高幅值信号具有较大的敏感度,为了降低敏感
度,定义短时平均幅度函数Mn为
短时能量En和短时平均幅度函数Mn的主要用途:
1.浊音相比较于清音的En具有较大的数值,因而可用于区分浊音
和清音。
2.利用短时能量区分有声段和无声段,也可对声母和韵母分界,
对无间隙的连字分界。
3.在语音识别任务中作为特征,表示能量特征和超音频信息。
2.短时过零率
短时过零率表示一帧语音中波形信号穿过零值的次数。对于连续
信号,过零意味着波形通过时间轴,而对于离散信号,过零意味着相
邻采样点的符号改变。
首先定义符号函数sgn[·]为
则第n帧语音信号xn(m)的短时过零率Zn为
由于短时过零率容易受到低频干扰,可设置相关门限T,将过零修
改为穿过正负门限的次数,即
门限的存在使得短时过零率Zn具有一定的扛干扰能力,避免随机
噪声导致的虚假过零。
短时过零率的主要用途:
1.浊音能量集中于3kHz内的低频率段,清音能量集中于高频率段,
而短时过零率可以一定程度反映频率高低,因而浊音段相对于清音段,
其短时过零率减低。
2.将短时过零率和短时能量结合实现端点检查。短时能量适用于
背景噪声较小的情况,而短时过零率适用于背景噪声较大的情况。实
际中,通常结合两个参数实现语音起点和终点的判断。
3.短时自相关函数
语音信号xn(m)的短时自相关函数Rn(k)为:
其中,若信号xn(m)具有周期性,则短时自相关函数Rn(k)也具有
周期性,且两者周期相同;Rn(k)为偶函数,当k=0s时,自相关函数
具有最大值。
假设语音信号xn(m)的周期为T,那么短时自相关函数Rn(k)将在
k=T,2T...取值时出现峰值。若要出现第一个峰值(即k=T),根据计算
式
需要取到信号中x(m=2T的样本点,即语音帧宽至少应大于两个
周期,否则第一个峰值将无法较好的显示。例语音最小基频为80Hz,
最大周期为12.5ms,两倍周期为25ms,因此10kHz的采样信号的帧
宽至少为250个采样点。
另一方面,考虑到语音信号的短时性,应设置较低的帧长,因此
可使用修正短时自相关函数,其定义为
其中,有
而
相比于短时自相关函数Rn(k),在修正短时自相关函数中,第一项
xn(m)与Rn(k)中的xn(m)相同,而第二项xn(m)与Rn(k)中的xn(m)
相比,差异在于额外向后包括了k个样本点。
在严格定义中,修正短时自相关函数是一个互相关函数,其不满
足自相关函数的性质(偶函数性),但其仍在周期整数倍上具有峰值。
短时自相关函数的用途:
1.浊音的自相关函数具有周期性,而清音的自相关函数类似于高
频白噪声,没有周期性。
2.根据自相关函数的第一个峰值的位置,估算浊音的基音频率。
4.短时平均幅度差函数
短时自相关函数使用大量乘法运算,计算时间较长,短时平均幅
度差Fn(k)使用减法代替了乘法,大大减少了运算量,大量运用于实时
语音处理方案上,其定义为
对于周期为T的语音信号,短时平均幅度差Fn(k)在k=T,2T...等取
值上具有周期性的极小值。类似的,修正短时平均幅度差为
短时平均幅度差Fn(k)和R
您可能关注的文档
- 个人职业生涯发展愿景规划范文 .pdf
- 不能立即改正的隐患按照治理方案改正3 .pdf
- 上海梅林2018年决策水平分析报告-智泽华 .pdf
- 上海市2023年优秀信创解决方案评分标准 .pdf
- 上村(社区工作人员)自考复习100题模拟考试含答案 .pdf
- 三级甲等医院建设可行性报告 .pdf
- 三官一律进社区工作总结 .pdf
- 三人合伙开公司协议书范本_协议书 .pdf
- 七类职业适应性测试单选试题库+参考答案 .pdf
- 七年级衔接课5(初中常见修辞手法及其作用) .pdf
- 25上半年2期套题班-行政职业能力测验(八).docx
- 公考讲义-2025年1月时政汇总.pdf
- 2025年省考逻辑填空1000 高频实词积累+刷题早读课 讲义.pdf
- 25上半年2期套题班-行政职业能力测验(九).docx
- 2025四川事业编FB综合岗考试-综合能力测试讲义-主观题基础,案例分析题,公文写作及文章写作题.pdf
- 25上半年2期套题班-行政职业能力测验(五).docx
- 2025申论多省联考刷题课真题资料-2025国考执法课程.doc
- 2025申论多省联考刷题课真题资料-2024江西执法课程.doc
- 25上半年2期套题班-行政职业能力测验(十).docx
- 2025申论多省联考刷题课真题资料-2024福建县乡课程.doc
最近下载
- 把规矩和纪律挺在前面心得体会模板.docx VIP
- 2025年中国新疆农产品贸易市场全面调研及行业投资潜力预测报告.docx
- 新人教版八年级物理下册知识点总结.doc VIP
- 海南版信息技术四年级下册第1课 制作文本幻灯片.pptx VIP
- 7.1.3++亚洲的自然环境+课件+-2024-2025学年人教版地理七年级下册.pptx VIP
- 部编人教版九年级语文下册作业课件 专题 专题五 古诗文默写.ppt
- 马工程教材《公共财政概论》PPT-第二章 公共财政职能.ppt
- 广西财政预算管理一体化系统操作手册-财政版东兴市.pdf VIP
- 上市公司财务报表分析——以新希望六和股份有限公司为例.docx
- 【良品铺子公司基于EVA模型指标的财务绩效评价研究】15000字.docx
文档评论(0)