一、方案设计与论证.docVIP

下载本文档

37
0
约8.17千字
约 30页
2018-04-30 发布于河南
举报
版权申诉

一、方案设计与论证.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一、方案设计与论证

数据传输摘要本系统对语音信号采用时域处理方法：数据采集直存直取、欠抽样采样、自相似增量调制法等三种方法，分别完成了对语音信号32.7秒、65.5秒、147.4秒的存储与回放；前置自动增益控制（AGC）将语音信号控制在A/D转换器可处理的范围内以保证话音采样不失真；带通滤波器合理的通带范围有效地滤除了带外噪声，减小了混叠失真；通过后级补偿电路对输出的语音信号进行了校正，回放语音清晰；并具有自动录音、手动录音、录/放音时间显示以及掉电后保护语音信号等功能。方案设计与论证本题目是设计制作一个数字化语音存储与回放系统。要求前置放大器的增益为46dB，增益可调；带通滤波器，带宽为300Hz～3.4kHz；ADC采样频率fs=8kHz，字长=8位；语音存储时间≥10秒；DAC变换频率fc=8kHz，字长=8位；且要求回放语音质量好（话音清晰、失真小、杂音少）。方案考虑如下。语音编码方案论证语音是一维时间信号，由于是表示语言声音的信号，所以不是恒定的，信号的性质随时间变化很大。为了充分利用有限的存储空间，并不失真地传送语音信号必须对采集后的语音信号进行进一步压缩，即语音压缩。所谓语音压缩，是为了声音信号更大信息量的传送与记忆而压缩数据，并有效地回放声音的过程。语音压缩可由将语音信号采集，并利用适当的量子化形式的压缩符号化或预测符号化等进行。现代常用的语音信号表示方法如用生成模的参数表示声音时，参数的数据率为5K比特/秒左右，与波形符号化相比，参数表现的数据率显著变低，若使用声音生成模，则以利用声音信号分析而得的模的参数为基础，可进行声音的再合成。在听觉上得到的与原声音没有多少不同的合成声音。参数的数据率为信号波形数据率的以下，所以可进行高效的声音数据压缩。单从声音的存储与压缩率来考虑，生成模参数表示法明显优于信号波形表示法。但要将之应用于单片机，显然信号波形表示法相对简单易实现，具有很强的可行性。故方案的设计均从声音信号以波形存储来考虑。基于这种思路的算法，除了传统的一些脉冲编码调制外，目前已使用的有VQ技术及一些变换编码和神经网络技术，但是算法复杂，目前的单片机速度低，难以实现。结合实际情况，提出了以下几种可实现的方案。短时平均跨零计数法该方案通过确定信号跨零数，语音信号编码为数字信号。该方案主要应用于语音识别中，具有较小的回放失真，音质较好。但对于现用单片机，处理数据能力低，故该方法不易实现。实时幅值采样法采样过程如下图所示：直存直取法该方案将话音信号的抽样值直接存取，以保证在回放时能真实的重现抽样值。由于这种方法重现的是采样的真实值，所以只存在一般量化噪声，与A/D转换精度有关。故此方法回放质量最好，但占用存储空间也最大，编码速率为62.5kBit/s，每采集1秒钟的话音信号需占用7.8125K字节。由于我们扩展了256K字节的RAM，故采用这种方法作为不压缩的存储，音质好，录音可达32.768秒。该方法示意图如图1：图1 注：该方法中的量化台阶为10H，图中70H、80H、70H、60H、50H、40H、50H、 70H、 90H、C0H、D0H、D0H为所要存储的值，解码后所输出的值为：70H、 80H、70H、60H、50H、40H、50H、70H 90H、C0H、D0H、D0H 欠抽样采样法虽然语音信号频谱在高频处迅速下降，但语音信号并非固有的频带受限。对于浊音来说，超过4kHz频率的频谱比其峰值要低40dB以上。另一方面，对于清音，即使超过8kHz，频谱也没有显著下降。因此为了精确的表示所有语声，常常需要大于20kHz的抽样率。然而，在大多数应用中不需要这样高的抽样率。通常我们只要有3.5kHz以下的频谱足以清晰地传输话音信号，即8kHz的采样速率足矣，通常的“电话语音”就是用4kHz的奈奎斯特频率实现的。因此可以8K的采样速率对话音信号采样，而存储时采用奇存法，即只存奇数点而抛弃偶数点，回放时在两相邻奇数点之间的偶数点只需用两数的平均值代替即可。这样既保留语音信号的主要部分，使回放的音质较为理想，又提高了存储器的利用率，理论计算录音时间可达65.536秒，数据压缩率为1:2。但是，由于这种方法的采样速率实际上只有4kHz，故在回放时会产生一定的失真。该方法示意图如图2所示图2 注：图中70H、70H、50H、50H、90H、D0H、为所要存储的值，解码后所输出的值为：70H、70H、70H、60H、50H、50H、50H、70H 90H、B0H、D0H 自相似增量调制法从典型的语音信号可以看到，语音信号的特征是随时间而变化的，在大多数语音处理方案中，基本的假定为语音信号特性随时间的变化是缓慢的。这个假定导出各种“短时”处理方法，在这里语音信号被分隔

您可能关注的文档

文档评论（0）

f8r9t5c + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：8000054077000003

1亿VIP精品文档

更多 >

一、方案设计与论证.docVIP