一、 方案设计与论证.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、 方案设计与论证

数 据 传 输 摘 要 本系统对语音信号采用时域处理方法:数据采集直存直取、欠抽样采样、自相似增量调制法等三种方法,分别完成了对语音信号32.7秒、65.5秒、147.4秒的存储与回放;前置自动增益控制(AGC)将语音信号控制在A/D转换器可处理的范围内以保证话音采样不失真;带通滤波器合理的通带范围有效地滤除了带外噪声,减小了混叠失真;通过后级补偿电路对输出的语音信号进行了校正,回放语音清晰;并具有自动录音、手动录音、录/放音时间显示以及掉电后保护语音信号等功能。 方案设计与论证 本题目是设计制作一个数字化语音存储与回放系统。要求前置放大器的增益为46dB,增益可调;带通滤波器,带宽为300Hz~3.4kHz;ADC采样频率fs=8kHz,字长=8位;语音存储时间≥10秒;DAC变换频率fc=8kHz,字长=8位;且要求回放语音质量好(话音清晰、失真小、杂音少)。方案考虑如下。 语音编码方案论证 语音是一维时间信号,由于是表示语言声音的信号,所以不是恒定的,信号的性质随时间变化很大。为了充分利用有限的存储空间,并不失真地传送语音信号必须对采集后的语音信号进行进一步压缩,即语音压缩。所谓语音压缩,是为了声音信号更大信息量的传送与记忆而压缩数据,并有效地回放声音的过程。语音压缩可由将语音信号采集,并利用适当的量子化形式的压缩符号化或预测符号化等进行。 现代常用的语音信号表示方法如用生成模的参数表示声音时,参数的数据率为5K比特/秒左右,与波形符号化相比,参数表现的数据率显著变低,若使用声音生成模,则以利用声音信号分析而得的模的参数为基础,可进行声音的再合成。在听觉上得到的与原声音没有多少不同的合成声音。参数的数据率为信号波形数据率的以下, 所以可进行高效的声音数据压缩。 单从声音的存储与压缩率来考虑,生成模参数表示法明显优于信号波形表示法。但要将之应用于单片机,显然信号波形表示法相对简单易实现,具有很强的可行性。故方案的设计均从声音信号以波形存储来考虑。基于这种思路的算法,除了传统的一些脉冲编码调制外,目前已使用的有VQ技术及一些变换编码和神经网络技术,但是算法复杂,目前的单片机速度低,难以实现。结合实际情况,提出了以下几种可实现的方案。 短时平均跨零计数法 该方案通过确定信号跨零数,语音信号编码为数字信号。该方案主要应用于语音识别中,具有较小的回放失真,音质较好。但对于现用单片机,处理数据能力低,故该方法不易实现。 实时幅值采样法 采样过程如下图所示: 直存直取法 该方案将话音信号的抽样值直接存取,以保证在回放时能真实的重现抽样值。由于这种方法重现的是采样的真实值,所以只存在一般量化噪声,与A/D转换精度有关。故此方法回放质量最好,但占用存储空间也最大,编码速率为62.5kBit/s,每采集1秒钟的话音信号需占用7.8125K字节。由于我们扩展了256K字节的RAM,故采用这种方法作为不压缩的存储,音质好,录音可达32.768秒。该方法示意图如图1: 图1 注:该方法中的量化台阶为10H,图中70H、80H、70H、60H、50H、40H、50H、 70H、 90H、C0H、D0H、D0H为所要存储的值,解码后所输出的值为:70H、 80H、70H、60H、50H、40H、50H、70H 90H、C0H、D0H、D0H 欠抽样采样法 虽然语音信号频谱在高频处迅速下降,但语音信号并非固有的频带受限。对于浊音来说,超过4kHz频率的频谱比其峰值要低40dB以上。另一方面,对于清音,即使超过8kHz,频谱也没有显著下降。因此为了精确的表示所有语声,常常需要大于20kHz的抽样率。然而,在大多数应用中不需要这样高的抽样率。通常我们只要有3.5kHz以下的频谱足以清晰地传输话音信号,即8kHz的采样速率足矣,通常的“电话语音”就是用4kHz的奈奎斯特频率实现的。因此可以8K的采样速率对话音信号采样,而存储时采用奇存法,即只存奇数点而抛弃偶数点,回放时在两相邻奇数点之间的偶数点只需用两数的平均值代替即可。这样既保留语音信号的主要部分,使回放的音质较为理想,又提高了存储器的利用率,理论计算录音时间可达65.536秒,数据压缩率为1:2。但是,由于这种方法的采样速率实际上只有4kHz,故在回放时会产生一定的失真。该方法示意图如图2所示 图2 注:图中70H、70H、50H、50H、90H、D0H、为所要存储的值,解码后所输出的值为:70H、70H、70H、60H、50H、50H、50H、70H 90H、B0H、D0H 自相似增量调制法 从典型的语音信号可以看到,语音信号的特征是随时间而变化的,在大多数语音处理方案中,基本的假定为语音信号特性随时间的变化是缓慢的。这个假定导出各种“短时”处理方法,在这里语音信号被分隔

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档