- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验3 语音信号的端点检测
一、实验目的 1、本次实验是设计性实验,鼓励学生充分发挥自己的创造性,灵活利用所学的理论知识,设计出自己的解决方案。 2、熟悉并掌握语音端点检测技术。 二、实验原理 语音端点检测就是检测语音信号的起点和终点,因此也叫起止点识别。它是语音处理技术中的一个重要方面,其目标是要在一段输入信号中将语音信号同其它信号如背景噪声分离开来。在语音识别中,一个关键问题就是如何将语音信号精确地检测出来,为获得准确的识别提供前提。 以过零率ZCR和能量E为特征的起止点算法的根据是背景噪声与语音的短时段ZCR及E特征从统计看都有相当的区别。这里的E特征指的是能量类特征,用到的是该类特征中的短时段平均幅度M特征。 过零率的定义为:在统计的短时段中,信号波形穿越零电平的次数。 该方法的要点为:由于采集声音信号的最初的短时段为无语音段,仅有均匀分布的背景噪声信号。这样就可以用已知为静态的最初几帧(一般取帧)信号计算其过零率阈值IZCT及能量阈值ITL(低能量阈)和ITU(高能量阈)。 接下来就可以用过零率阈值IZCT及能量阈值ITL(低能量阈)和ITU(高能量阈)来进行起点及止点的判别。 先根据ITL、ITU算得一初始起点N1。方法为从第帧11开始,逐次比较每帧的平均幅度,N1为平均幅度超过的ITL第一帧的帧号。但若后续帧的平均幅度在尚未超过之前ITU又降到ITL之下,则原N1不作为初始起点,改记下一个平均幅度超过了的帧的帧号为ITL N1,依此类推,在找到第一个平均幅度超过ITU的帧时停止比较。 N1只是根据能量信息找到的起点,还未必是语音的精确起点。这是由于语音的起始段往往存在着能量很弱的清辅音,仅依靠能量很难把它们和无声区分开。但研究发现它们的过零率明显高于无声段,因此可以利用过零率这个参数来精确判断清辅音与无声区二者的分界点。 当N1确定后,从N1帧向N1-25帧搜索,依次比较各帧的过零率,若有3帧以上的ZCR≥IZCT,则将起点N1定为满足ZCR≥IZCT的最前帧的帧号,否则即以N1为起点。 语音结束点N2的检测方法与检测起点相同,从后向前搜索,找第一个平均幅度低于ITL、且其前向帧的平均幅度在超出ITU前没有下降到ILT以下的帧的帧号,记为N2,随后根据过零率向N2+25帧搜索,若有3帧以上的ZCR≥IZCT,则将结束点N2定为满足ZCR≥IZCT的最后帧的帧号,否则即以N2作为结束点。 三、实验要求 要求通过所学语音信号处理的知识,独立设计算法,实现对一段包含背景噪声且前后有一段空白的语音信号进行端点检测,找出语音的真实起点和终点。 四、实现方法 可先用麦克风录制一段语音,然后对语音加窗分帧,并利用语音增强技术最大限度地滤除背景噪声;对加窗后的语音信号求其短时平均幅度函数和短时平均过零率,然后设定这两种参数的阈值,最终在整段语音内通过两种参数与各自的阈值比较找出语音的真实起点和终点。 五、报告要求 1、实验目的及原理说明; 2、详细的算法说明; 3、实验的具体实施方案; 4、实验程序清单及实验结果; 5、实验结果分析。 6、参考文献(3-4本参考资料) 例:对whut.wav声音文件进行端点检测 %声音读取 [x,fs]=wavread(c:\whut.wav); x=x(20000:length(x)); x=x; %幅度归一化到[-1,1] x = double(x); x = x / max(abs(x)); %常数设置 FrameLen = 240; FrameInc = 80; amp1 = 8; amp2 = 1; zcr1 = 10; zcr2 = 5; maxsilence = 8; % 8*10ms = 80ms minlen = 15; % 15*10ms = 150ms status = 0; count = 0; silence = 0; %计算过零率 tmp1 = enframe(x(1:end-1), FrameLen, FrameInc); tmp2 = enframe(x(2:end) , FrameLen, FrameInc); signs = (tmp1.*tmp2)0; diffs = (tmp1 -tmp2)0.02; zcr = sum(signs.*diffs, 2); %计算短时能量 amp = sum(abs(enframe(filter([1 -0.9375], 1, x), FrameLen, FrameInc)), 2); %调整能量门限 amp1 = min(amp1, max(amp)/4); amp2 = min(amp2, max(amp)/20); %开始端点检测 x1 = 0; x2 = 0; for n=1:length(zcr) go
您可能关注的文档
最近下载
- 园长研修总结(3篇).docx VIP
- 东证期货-商品基本面量化框架系列-二-:黄金择时因子及多周期合成.pdf VIP
- 2024年9月8日贵州省黔西南州州直遴选(事业单位考聘)笔试真题及答案解析.doc VIP
- 安徽省综合评标评审专家入库、续聘考试试题(含答案).docx VIP
- 第2章金属材料组织-4-清华大学-工程材料.ppt VIP
- 第2章金属材料组织-3-清华大学-工程材料.ppt VIP
- 2025政治理论时政热点知识试题库(含+答案).docx VIP
- 2025人民防空防护设备产品选型目录.docx VIP
- 第2章金属材料组织-1-清华大学-工程材料.ppt VIP
- Unit 4 Plants around us课件(63张PPT)三年级上册(2024版).pptx VIP
文档评论(0)