Speexmanul基础手册中文版专业资料.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在VOIP音频算法中,回音处理已经成为一个关系通话质量关键问题。 回声产生在IP网络关键有两种: 1.声学回声 2.电路回声 声学回声关键又分成以下多个: a ) 直接回声:由扬声器产生声音未经任何反射直接进入麦克风 b ) 间接回声: 由扬声器发出声音经过数次反射后,再进入Mic 对于第二种回声,拥有多路径,时变性特点.是比较难处理. 因为IP网络下传输延迟较大,而通常情况下,对于人耳,假如声音延迟达成了10ms以上话,那么回声就会越来越显著. 通常来讲,VOIP中声音延迟关键来自于多个方面: 1. 编码延迟: 通常情况下编码算法在声音压缩时全部会产生延迟,就我们采取Speex来讲,延迟大约在20ms左右 2. 处理延迟, 封装时延, 缓冲时延等 3. 在IP网络中数据传输过程也会照成延时.这由目前网络情况决定. 回声消除模型: a) 建立远端声音模型,进行回声估量, 从采集值中减去估量值 b) 声学模型 Speex是一套专门用于压缩声音库,因为其专门针对声音,所以压缩声音性能很高.Speex因为其压缩性能,及0.80版后跨平台性能,所以在网络声音传输中有很大价值.不过需要注意是speex只能对声音进行压缩,不支持音乐压缩,假如你需要音乐压缩你或许需要用vorbis库. ???????不过speex资料像其它大全部数专用库一样,并没有大多汉字资料.所以在这里我决定将里面最关键编程技术翻译出来.一来是练习练习自己翻译资料能力,二来是方便部分英语水平较差好友.因为本人能力有限,有些感觉有出入或难了解地方能够去speex官方网站 .org找到英文原版说明. 1,speex介绍(略) 2特征描述 这个章节展示了speex关键特征,以衣部分相关对话(speech)编码一个概念,方便帮助我们愈加好了解下一章节. 取样率(Sampling rate) Speex关键是设计了三种不一样取样率:8kHz,16kHz,32kHz.这些分别代表了窄宽(narrowband),多频率,超声. 质量 Speex编码大全部数时间是被一个范围为0到10质量参数来控制??.在一个比特率为常量(CBR)操作中,质量参数是一个整数,而对于变动比特率(VBR)参数是一个float; 复杂性(变量) 用speex,你能够将编码设置成许可复杂度.这由一个范围为1到10整数来控制完成,就像你用选项-1到-9来控制gzip和bzip2压缩质量.在通常利用中,噪声等级复杂度1是在1到2dB之间,比复杂度10要高,不过CPU需要复杂度10大约5倍高行复杂度1.在实践中,最好是设置在2到4之间,尽管更高设定通常有用,当编码一个非对话声音(non-speech sounds)像DTMF语气(tones). 变波特率(VBR Variable bit-rate (VBR) allows a codec to change its bit-rate dynamically to adapt to 变波特率(VBR)许可编码动态地改变它波特率以适应声音编码”难度”.在speex举例来说, 像元音(vowel)和瞬间高音(high-enenrg transients)需要个高比特率来取得一个不错质量,而摩擦音(fricative)能够被充足地用相对较少字节来进行编码.因为上面这个原因,VBR能够调整到一个低比特率却达成一个一样质量,或用某个比特率达成愈加好质量.尽管有上面这些优点,不过VBR也有两个关键缺点.首先,仅仅靠指定质量值,这里没有一个相关最终平均比特率确保.(译者注:作者大约是想说没有什么明确方法知道质量值)另外,对部分即时通信,像IP电话(VoIP)这种包含着最大比特率,必需把比特率设为足够低以适应传输通道. 平均比特率(ABR) 平均比特率经过动态地调整VBR质量去得到一个确定目标比特率,从而处理了VBR中一个问题..因为质量/比特率被即时调整了,整体质量将会稍稍低于由VBR对一个 设置得和目标平均比特率很靠近质量数编码得到结果. ? 声音生动性检测(VAD) 声音生动性检测将会发觉音频正在被编码成对话,静音,或背景噪音.VAD总在用VBR进行编码时暗中起作用,所以选项仅仅对一个不是VBR操作起作用.对于不是VBR操作来说,speex觉察出一个不属于对话周期,然后对它用足够字节重新生成为背景噪音.不这叫做舒适噪音生成(CNG). 不连续传输(DTX) 不连续传输是VAD/VBR操作一个额外选项,当背景噪音一定时,它能够完整地传输.因为在基于文件操作中,我们不能停止对文件进行写入,所以只有5字节被这种帧所利用.(给250bps通信) Algorithmic delay 迟时算法 每一个声音编码造成了在传输上延时.对于speex,这种延时等于frame大小加上部分数量需要

文档评论(0)

173****6081 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档