- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音信号处理的基础知识
语音:人与人的沟通介面 语音的产生 §2.4 语音生成系统和语音感知系统 一、语音发音系统 二、语音听觉系统 ●肺:能源; ●喉:振动源,包括声带和声门; ●声道(声门到嘴唇的呼气通道):谐振腔; ●其他发音器官:包括唇、齿、舌、面颊等,使谐振腔改变形状。 一、语音发音系统(发音器官及其作用) 二、语音听觉系统(一个十分巧妙的音频信号处理器) 人类接收语音由人耳来完成,空气振动由耳廓收集,经外耳道而抵达鼓膜,鼓膜随之振动,使鼓室中的空气和听骨链也发生振动,听骨链的振动经前庭窗(卵圆窗)激励前庭淋巴,变为液波,液波使位于基底膜上的螺旋器受到刺激,将神经冲动经听神经传到中枢而产生听觉。 正常人的听觉系统是极为灵敏的,可听声的范围为0.02Hz-20kHz。 可听声的最小声压级(dB)称为听阈。-5 130dB,对低频和高频是不敏感的,听阈为60dB,在1kHz附近最敏感。 0.000063 0.0002 0.00063 0.002 0.02 0.063 0.63 20 200 声压/Pa 10 农村静夜 20 树叶沙沙声 30 耳语 40 安静房间 60 普通谈话 70 繁华街道 90 地铁 100 织布车间 140 飞机附近 声压级/dB 声源 1. 耳的结构(外耳、中耳和内耳)和功能 外耳:对声源定位和对声音放大的作用,由耳廓和外耳道组成。 ☆耳廓呈漏斗型,其作用是收集声音。 ☆外耳道直至鼓膜,其中充满空气,是一谐振腔,使谐振频率附近的频率成分有某些放大作用,导致声音有某些失真。 外耳道的长度为2.5cm,对波长为其4倍作用的声波能起到较好的放大作用,即有:4?2.5=10cm, 3000-4000Hz声波的波长为8.5cm-11.41cm,因此外耳道对这部分频率的信号有扩音作用,10dB左右。 外耳道 中耳 ★ 结构:总容量为2立方厘米,内含三块听小骨,锤骨、砧骨、镫骨,其中锤骨与鼓膜相接触,镫骨则与内耳的前庭窗相接触。 ★ 作用:进行阻抗变换,将中耳两端的声阻抗匹配起来;保护内耳。在一定声强范围内,听小骨实现声音的线性传递,而在特强声时,实现非线性传递。 内耳 ★ 结构:主要部分是耳蜗,耳蜗长约3.5cm,呈螺旋状盘绕2.5-2.75圈,是一个密闭的管子,内部充满了淋巴液。 前庭窗 镫骨 基底膜 ★ 作用:将振动变换为神经冲动。当声音传入中耳时,镫骨的运动经过前庭窗引起耳蜗内液体压强的变化,从而引起行波沿基底膜的传输,引起基底膜的振动。不同频率的声音产生不同的行波,其峰值出现在基底膜的不同位置上。基底膜的振动导致沿基底膜分布的毛细胞的电位发生改变,引起神经冲动,传递给大脑,产生听觉。 如果信号是一个多频率的信号,则产生的行波将沿着基底膜在不同的位置产生最大幅度,从这个意义上讲,耳蜗就像一个频谱分析仪,将复杂信号分解成各种频率分量,这种作用称为人耳的时频分析特性。耳蜗在语音接收过程起着重要的作用。 人工耳蜗是一种电子装置,能帮助重度及极重度耳聋患者获得或重新恢复听觉。它代替病变受损的听觉器官,把声音转换成编码的电信号传入内耳耳蜗,刺激分布在那里的听神经,再由大脑产生听觉。 人工耳蜗 麦克风接收声音,并通过导线将其传至言语处理器;言语处理器对声音进行数字化、滤波编码等处理,并将编码信号经导线传至传输线圈;传输线圈将编码信号通过耦合传至皮下的接收器;接收器对编码信号进行解码;按信号选择一定位置的电极,刺激耳蜗内的听神经纤维,使其产生兴奋,将信号传入大脑,产生听觉。 人工耳蜗的工作原理 2.声音传入内耳的途径 由空气传导,称为气导,其过程为: 声波 耳廓 鼓膜 听骨 内耳 基底膜上 毛细胞电位改变 神经冲动 由骨传导,称为骨导,其过程为: 声波 颅骨 外淋巴振动 内耳 基底膜上毛细胞电位改变 神经冲动 3. 人耳的两个重要特性 (1)耳蜗对声信号的时频分析特性 (2)人耳的掩蔽效应 人耳的掩蔽(masking phenomenon)效应:在一个强信号附近弱信号将变得不可闻,被掩蔽掉了。 掩蔽阈值 被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限和掩蔽阈值(masking threshold),在这个掩蔽阈值以下的声音将被掩蔽掉。 掩蔽效应分为同时掩蔽(频域掩蔽)和短时掩蔽(时域掩蔽)。同时掩蔽是指存在一个弱信号和一个强信号,当其频率接近时,强信号会提高弱信号的阈值,就会导致弱信号变得不可闻。 1kHz的听阈 1dB 20dB 4dB 可闻声 3dB 不可闻声 图形描述 同时出现的A声和B声,若原来A声的阈值为50
您可能关注的文档
- 礼仪知识100问.doc
- 社会主义的法治与法制.doc
- 蜀派园林景观建筑古典建筑.doc
- 社会经济与文化教育.ppt
- 行产业分类林业.doc
- 福建专科起点升本科招生专业与统一考试.doc
- 行政职权目录分表行政许可类.doc
- 行政诉讼的受案范围行政诉讼受案范围的概述.ppt
- 表3江苏捷通检验认证有限公司经营服务性收费含社团会费.doc
- 表3河南18个政府推进义务教育均衡发展工作得分情况表.doc
- 新启航英语二年级上册Unit5 Festival Period 2 课件.ppt
- 10.相亲相爱一家人 情境化教学课件-统编版2026道德与法治一年级下册.ppt
- 7星星点点 AI赋能课件 2026人美版美术一年级下册.ppt
- 3.2 世界的气候类型(教学课件) 2025中图版地理八年级上册.ppt
- 5.1 发达国家与发展中国家的差异(教学课件) 2025中图版地理八年级上册.ppt
- 13.快乐的儿童节 情境化教学课件-统编版2026道德与法治一年级下册.ppt
- 新启航英语二年级上册Unit5 Festival Period 1 课件.ppt
- 2025冀教版数学三年级上册全册教学课件.ppt
- 地理试卷云南名校联盟2026届高三上学期第三次联考(12.25-12.26).docx
- 2025~2026学年第一学期 高一年级英语试卷.docx
最近下载
- AI工业设备预测性维护解决方案.pptx VIP
- 《马克思主义基本原理》教案 第5课 坚持按唯物辩证法办事.pdf VIP
- 湖南省高三英语复习:介词复习.doc VIP
- 内浮顶储罐消防知识培训.pptx VIP
- 立体定向γ-射线放射治疗原发性肝癌的临床疗效与应用分析.docx VIP
- 2026及未来5年中国智能门禁系统市场数据分析及竞争策略研究报告.docx
- 门诊部护士长年终述职PPT课件.pptx VIP
- 电仪技术培训教材最终版.doc VIP
- 2025年人教版(2024)小学信息科技六年级(全一册)教学设计(附目录P219).docx
- 《马克思主义基本原理》教案 第4课 事物的普遍联系与变化发展(下).pdf VIP
原创力文档


文档评论(0)