- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
通信原理A第七章1
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 时隙=时间间隙 * 时隙=时间间隙 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 其它的音频信号编码方法(续) 与波形编码不同,参量编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参量,并将其变换成数字代码进行传输。解码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参量编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的可靠性,即保持原语音的语意,但重建信号的波形同原语音信号的波形可能会有相当大的差别。这种编码技术可实现低速率语音编码,比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低,连熟人都不一定能听出讲话人是谁。线性预测编码(LPC)及其它各种改进型都属于参量编码。 其它的音频信号编码方法(续) 计算机的发展为语音编码技术的研究提供了强有力的工具,大规模、超大规模集成电路的出现,则为语音编码的实现提供了基础。80年代以来,语音编码技术有了实质性的进展,产生了新一代的编码算法,这就是混合编码。它将波形编码和参量编码组合起来,克服了原有波形编码和参量编码的弱点,结合各自的长处,力图保持波形编码的高质量和参量编码的低速率,在4-16Kbit/s速率上能够得到高质量的合成语音。多脉冲激励线性预测编码(MPLPC),规则脉冲激励线性预测编码(RPELPC),码本激励线性预测编码(CELP)等都是属于混合编码技术。很显然,混合编码是适合于数字移动通信的语音编码技术。 各种语音编码方法比较 编码方法 传输速率 (kb/s) 最小基带带宽 (kHz) 质量 PCM ADPCM SBC+ADPCM △M SBC(子带) RPE/LTP(规则脉冲激励) LD-CELP(低延迟码激励) MPE/LPC(多脉冲) CELP(码本激励) LPC(线性预测) LPC+VQ(矢量量化) 64 32 64 32 16 16 16 8 4.8 2.4 1.2 32 16 32 16 8 8 8 4 2.4 1.2 0.6 长途电话质量 长途电话质量 广播质量 通信质量 通信质量 通信质量 接近长途质量 通信质量 通信质量 合成质量 合成质量 电话质量的音频(0.3--3.4K kHz ) G728, LD-CELP 16kb/s , GSM ,RPE/LTP, 13kb/s ,(欧洲移动) GTIA ,VSELP, 8kb/s (美国移动) NSA ,CELP,4.8 kb/s NSA ,LPC,2.4kb/s 调幅广播质量的音频 50Hz-7kHz 采样率16KHz ,14bit 量化,PCM码率224Kb/s, 采用G.722(子带)标准可压缩到64Kb/s,适于ISDN的B信道,传输高质量语音。 高保真立体声音频压缩标准 即CD音质音频20Hz--20KHz 采样率44.1kHz,,16位量化,立体声 数据量为??? 44.1*16b*2=1411.2kb/s=176.4KB/s 1小时为?? 176.4KB/s*3600s=635MB? 目前,采用MPEG音频标准,有三层(第三层MP3),采用子带及熵编码技术,可压缩到每声道32kb/s-448kb/s 多媒体视听业务音频 ?? ITU关于电视电话系统和终端设备的技术标准针H.320用于ISDN网,不适合窄带电话网,而H.324既适合高速数字网,也适合在普通电话之类的窄带网上使用,H.323标准用于质量不能保证的局域网LAN 在H.320中,语音编码标准为G.711(64 kb/s )、G.722(64 kb/s )、G.728(16 kb/s ), H.324分配给语音带宽6.5 kb/s (高——采用MP-MLQCELP)和5.3K(低——采用ACELP),采用的语音压缩标准为G.723 H.323系统语音压缩方法有6种,即G.711(64 kb/s )、G.722(64 kb/s )、G.728(16 kb/s )、G.723、G.729、MPEG AUDIO????????????????????????? 语音技术在计算机领域中的应用 语音技术在计算机领域中的关键技术是语音识别技术和语音合成技术。 语音识别技术(ASR :Automatic Speech Recognition ),是指将人说话的语音信号转换为可被计算机程序所识别的文字信息,从而识别说话人的语音指令以及文字内容的技术。典型应用: 命令控制和识
文档评论(0)