浅析家庭智能音箱中的语音识别技术 .pdfVIP

下载本文档

1
0
约4.18千字
约 7页
2025-03-26 发布于河南
举报
版权申诉

浅析家庭智能音箱中的语音识别技术 .pdf

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浅析家庭智能音箱中的语音识别技术--第1页

浅析家庭智能音箱中的语音识别技术

浅析家庭智能音箱中的语音识别技术--第1页

浅析家庭智能音箱中的语音识别技术--第2页

胡益恺

摘要随着人们对于居家生活质量要求的逐渐提高，各种智能家居产品走进了人们的生活，

其中智能音箱就是最为典型的一种。智能音箱的核心技术是语音识别技术，语义识别技术的

目的是模拟人与人之间对话，使机器通过逻辑运算理解自然语言。文章以家庭智能音箱中语

音识别技术为主要内容，简析语音识别中重要的流程和技术，叙述了语音识别目前的缺陷和

改进方向。

关键词智能音箱；语音识别；自然语言

中图分类号TP3A1674-6708（2019）229-0123-02

1智能音箱介绍

1.1智能音箱

智能音箱是现代科技产物，是基于语音识别技术的音箱的衍生物。智能音箱在家庭用途十分

广泛，涉及生活许多方面，可以说智能音箱已经进入日常生活。智能音箱有多种功能，基本

满足了人们日常生活服务。目前的家庭智能音箱可以实现设置闹钟，点播音乐等功能，链接

网络后可实现了解未来天气、上网购物、打电话等功能，另外可以连接第三方软件，也可实

现对家用智能电器的控制，而智能服务仅需说一句话即可实现叫外卖、叫服务、打车、订餐

等多种功能。对于不同年龄段的人，智能音箱也可以通过设置不同模式来实现较为人性化的

回答，例如，小度智能音箱中儿童模式下语气会更加亲切，让儿童更有亲？切感。

1.2典型智能音箱

目前大多数互联网企业都有推出自己的智能音箱，这使得智能音箱市场越来越大，竞争越来

越激烈。现在的智能音箱在外观上并无太大区别，所以用户更加注重的是智能音箱本身性

能。智能音箱的性能主要从他的语言交互能力，反应速度，准确度来体现。以下是对现在比

较火热的智能音箱的测评（表1）。

为了实现智能音箱的多种功能，智能往往需要多种技术。当用户发出的一段语言信号时，智

能音箱首先要去接受该信号，这里运用了麦克风列阵技术，一般的音箱内置7～8个麦克

风，这使得智能音箱能够从多个方向正确的接收语音信号以及消除回音和杂音带来的影响，

得到语音信号后需要对信号加工处理使机器“理解”自然语言，则用到自然语言处理和语言

浅析家庭智能音箱中的语音识别技术--第2页

浅析家庭智能音箱中的语音识别技术--第3页

识别技术。最后智能音箱所计算出的结果需要重新合成语音信号，这用到了语音合成技术。

在这众多技术中，最核心就是语音识别？技术[1]。

2语音识别技术流程

智能音箱中语音识别技术十分复杂，它综合了心理学，语言学，统计学等多门学科，若要研

究语音识别技术，需要從语音识别技术中各个重要步骤入手，这里主要研究其预处理、特征

提取、训练识别3部分，如图1所示。

2.1预处理

一段语音信号往往伴随着环境杂音，这杂音对语音识别影响巨大。因此首先要去除这些环境

杂音。一段语音信号的频率基本稳定在一个区间内，通过抗混叠滤波将信号频谱上的杂音区

段与目标语音信号区别来并获得目标信号，同时完成模拟信号向数字信号的转变。

另外，由于语音信号中的目标信号功率小，而杂音的功率大，杂音占了输入的大部分区域。

由此，对目标信号进行预加重处理来提高目标信号的能量。根本上说是提高振幅，方便区

分？杂音。

端点检测也是预处理中重要的一部分。环境杂音任何时候都存在，而语音信号只存在一段，

端点检测旨在确定语音信号的起始位置，避免非语音时段噪音混入。短时平均幅度与短时平

均过零率是两种端点检测常用方法。

另外，目前语音识别软件分为两种模式，一种是手动截取语音，例如苹果手机中的Siri，

用户需按住特定按键完成语音信号的采集。另一种是自动截取语音，市场大多数智能音箱都

采取这种模式，但精度相对较差，一般都是用户输入特定的语音信号后才开始语音采集，例

浅析家庭智能音箱中的语音识别技术--第3页

浅析家庭智能音箱中的语音识别技术--第4页

如使用小爱同学时，命令格式是“小爱同学+你提出的问题”总体上讲，预处理部分的目的

是消除杂音，为后面计算机理解自然语言奠定基础[2]。

2.2特征提取

采集到语音信号后做的第一个步骤就是特征提取，它将一段语音信号分为多个区段，并将其

中含有实际意义的

您可能关注的文档

文档评论（0）

初心 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

浅析家庭智能音箱中的语音识别技术 .pdfVIP