- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《16位单片机及语音嵌入式系统》-赵定远第07章.ppt
第七章
音频压缩算法
;;语音辨识技术有三大研究范围:口音独立、连续语音及可辨认字词数量
口音独立:
1)早期只能辨认特定的使用者即特定语者(Speaker Dependent,SD)模式2)非特定语者模式(Speaker Independent,SI)
连续语音:
1)单字音辨认 2)整个句子辨识
语音识别原理简图
;压缩分类
压缩分无损压缩和有损压缩。
无损压缩一般指:磁盘文件,压缩比低:2:1~4:1。
而有损压缩则是指:音/视频文件,压缩比可高达100:1。
凌阳音频压缩算法根据不同的压缩比分为以下几种
SACM-A2000:压缩比为8:1,8:1.25,8:1.5
SACM-S480: 压缩比为80:3,80:4.5
SACM-S240: 压缩比为80:1.5
按音质排序:A2000S480S240
常用的音频形式和压缩算法
1) 波形编码:sub-band即SACM-A2000
特点:高质量、高码率,适于高保真语音/音乐。
2) 参数编码:声码器(vocoder)模型表达,抽取??数与激励信号进行编码。如:SACM-S240。
特点:压缩比大,计算量大,音质不高,廉价!
3) 混合编码:CELP即SACM-S480
特点:综合参数和波形编码之优点。
除此之外,还具有FM音乐合成方式即SACM-MS01
;语音识别电路基本结构如图所示:
;SACM_A2000
该压缩算法压缩比较小(8:1)所以具有高质量、高码率的特点适用于高保真音乐和语音。
其相关API函数如下所示:
void SACM_A2000_Initial(int Init_Index) //初始化
void SACM_A2000_ServiceLoop(void) //获取语音资料,填入译码队列
void SACM_A2000_Play(int Speech_Index, int Channel, int Ramp_Set) //播放
void SACM_A2000_Stop(void) //停止播放
void SACM_A2000_Pause (void) //暂停播放
void SACM_A2000_Resume(void) //暂停后恢复
void SACM_A2000_Volume(Volume_Index) //音量控制
unsigned int SACM_A2000_Status(void) //获取模块状态
void SACM_A2000_InitDecode(int Channel) //译码初始化
void SACM_A2000_Decode(void) //译码
void SACM_A2000_FillQueue(unsigned int encoded-data)//填充队列
unsigned int SACM_A2000_TestQueue(void) //测试队列
Call F_FIQ_Service_ SACM_A2000 //中断服务函数
;SACM_S480
该压缩算法压缩比较大80:3, 存储容量大,音质介于A2000和S240之间,适用于语音播放, 如“文曲星”词库
其相关API函数如下所示:
int SACM_S480_Initial(int Init_Index) //初始化
void SACM_ S480_ServiceLoop(void) //获取语音资料,填入译码队列
void SACM_ S480_Play(int Speech_Index, int Channel, int Ramp_Set)
void SACM_ S480_Stop(void) //停止播放
void SACM_S480_Pause (void) //暂停播放
void SACM_S480_Resume(void) //暂停后恢复
void SACM_S480_Volume(Volume_Index) //音量的控制
unsigned int SACM_S480_Status(void) //获取模块的状态
Call F_FIQ_Service_ SACM_S480 //中断服务函数
;SACM_S240
该压缩算法的压缩比较大80:1.5,价格低,适用于对保真度要求不高的场合, 如玩具类产品的批量生产,编码率仅为2.4 Kbps。
其相关API函数如下所示:
int SACM_S240_Initial(int Init_Index) //初始化
void SACM_ S240_ServiceLoop(void) //获取语音资料,填入译码队列
void SACM_ S240_Play(int Speech_I
您可能关注的文档
最近下载
- 民用无人驾驶航空器操控员训练机构规范.pdf VIP
- 中山大学《大学物理》2022-2023期末试卷(1).docx VIP
- DB50T 1527-2023 黑水虻处理猪粪技术规程.pdf VIP
- DB13(J)T 8491-2022 下凹桥区雨水调蓄排放设计标准(京津冀).pdf VIP
- DB13(J)T 8505-2022 历史建筑修缮与利用技术标准.pdf VIP
- DB13(J)T 8540-2023 地源热泵系统工程技术标准.pdf VIP
- 贵阳市普通中学2022~2023学年度第一学期期末监测考试试卷2.pdf VIP
- PTN网络的OAM技术简析.doc VIP
- TSG 11-2020 锅炉安全技术规程 含2024年第1号修改单.docx VIP
- TSG 23-2021 气瓶安全技术规程 含2024年第1号修改单.docx VIP
原创力文档


文档评论(0)