- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
交通信息工建15041
带通滤波1 带通滤波n 带通滤波2 带通滤波1 带通滤波1 带通滤波1 编码器 编码器 编码器 综 合 器 分 配 器 译码器 译码器 译码器 输出 输入 信号输入 信号输出 语音信号压缩编码 线性预测编码(linear predictive coding,LPC) 是一种因音源编码。LPC是通过分析话音波形来产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少。在接收端使用LPC分析得到的参数,通过话音合成器重构话音。合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型。时变线性滤波器既当作预测器使用,又当作合成器使用。分析话音波形时,主要是当作预测器使用,合成话音时当作话音生成模型使用。随着话音波形的变化,周期性地使模型的参数和激励条件适合新的要求。 语音信号压缩编码 时变线性滤波器(预测器) 时变线性滤波器(合成器) 预测系数 音调 清音/浊音 信号的幅度 传输信道 话音波形 合成话音 语音信号压缩编码 预测器和合成器实际上是一个离散的随时间变化的时变线性滤波器。分析话音波形时,作为预测器使用,对输入的音频信号分帧(如每10ms为一帧)提取参数。合成话音时作为话音生成模型系统使用。随着话音波形的变化,周期性地使模型的参数和激励条件适合新的要求。 小结 1、数字化的目的 2、数字化的主要步骤 3、数字化的理论依据 4、量化噪声的度量 5、语声信号压缩的依据 6、语声信号压缩的方法 2015年3月27日 交通信息工程(四) 道路交通信息处理 交通信息处理: 预处理: (数字化、数据压缩、清洗修补、数据融合…… ) 信息提取: (事件检测、状态判别、交通预测、号牌识别……) 道路交通信息处理 地图匹配技术 样本过滤技术 数据融合技术 状态估计技术 状态预测技术 参数校准技术 交通模型 实时交通状态 道路交通信息处理 道路交通信息处理 模拟信号数字化: 采样、量化、编码 采样:离散化 量化:有限取值 编码:转换为二进制序列 道路交通信息处理 采样(Nyquist)定理: 设连续信号X(t)的最高频率分量为Fm,以等间隔Ts(Ts称采样间隔,fs=1/Ts称为采样频率)对X(t)进行采样,得到Xs(t)。如果Fs=2Fm,则Xs(t)保留了X(t )的全部信息(从Xs(t)可以不失真地恢复出X(t))。 道路交通信息处理 量化后的离散模拟信号,不仅在时间上离散的,而且在数值上也是离散的。 量化过程将引入误差,量化精度取决于最小的量化单位Δ,即二进制数码最低有效位所对应的模拟信号数值。例如Δ=100mV,即数字量的最低有效位对应100mV,显然Δ越小,A/D转换的精度越高。 道路交通信息处理 量化精度的表示方法是量化信号噪声比,简称为量化信噪比(signal-to-noise ratio,SNR) : SNR= 10 log [(Vs)2 / (Vn)2]=20 log (Vs/ Vn) (dB) 其中,Vs表示信号电压,Vn表示噪声电压; SNR的单位为分贝(dB)。 道路交通信息处理 每个量化后的离散模拟信号样值,用一组二进制序列表示,因此编码速率取决于采样速率和量化级数。 道路交通信息处理 数据压缩: 减少语音、图像等信息冗余,提高资源利用率。 语音信号压缩的主要依据: 一、语音信号的物理特征 声音信号的基本参数:频率和振幅。 声音按照频率分为三种类型:次声、可听声、超声。低于20Hz的声音为次声,或称为亚音信号(subsonic);可听声的声音频率范围为20~20000 Hz;高于20000 Hz的声音为超声,或称超声波(ultrasonic)信号,频率能反映出声音的声调。 ??????? 语音信号压缩编码 声音信号的另一个基本参数是振幅,表示声音信号的强弱。声音信号的强度相差很大,从可以听见的最弱声到最强声,其强度相差1万亿倍。声音的强弱采用分贝作为量纲: 声音分贝数 = 10*log(P1/ P0 ) 一般情况下人说话的话音信号的频率范围在300~3000 Hz,称为话音(speech)信号,在这种频率范围里感知的声音幅度大约在0~120 dB之间。
文档评论(0)