- 4
- 0
- 约1.56万字
- 约 32页
- 2025-03-08 发布于山西
- 举报
中国AI语音识别市场研究报告
1
目录
1Al语音识别定义与解读 2
2中国Al语音识别市场概览 3
2.1Al语音识别产业链分析 3
2.2中国AI语音识别市场驱动因素 5
2.2.1需求端:下游需求增长,AI语音识别市场空间稳步提高 5
2.2.2技术端:算力、算法、大数据升级,AI语音识别准确率持续提升 6
2.2.3政策端:人工智能上升至国家战略地位,AI语音识别行业加快布局和落
地 7
2.3中国AI语音识别市场趋势洞察 7
2.3.1云计算渐发展,商业化前景更广阔 7
2.3.2多技术协同发展,语音交互更生动 8
2.3.3语音技术渐开放,普惠生态更繁荣 10
2.4中国AI语音识别市场关键成功因素分析 10
3中国AI语音识别市场竞争格局分析 12
3.1沙利文企业增长评价数据来源和研究主体 12
3.2中国AI语音识别市场企业增长评价结果及分析 12
3.3沙利文评价模型的设计 16
4研究方法和研究范围介绍 18
4.1研究方法 18
4.2研究范围 18
2
1Al语音识别定义与解读
语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令的能力。在智能时代,越来越多的场景在设计个性化的交互界面时,采用以对话为主的交互形式。一个完整的对话交互是由“听懂——理解——回答”三个步骤完成的闭环,其中,“听懂”需要语音识别(AutomaticSpeechRecognition,ASR)技术;“理解”需要自然语言处理(NaturalLanguageProcessing,NLP)技术;“回答”需要语音合成(TextToSpeech,TTS)技术。三个步骤环环相扣,相辅相成。语音识别技术是对话交互的开端,是保证对话交互高效准确进行的基础。
语音识别技术自20世纪50年代开始步入萌芽阶段,发展至今,主流算法模型已经经历了四个阶段:包括模板匹配阶段、模式和特征分析阶段、概率统计建模阶段和现在主流的深度神经网络阶段。目前,语音识别主流厂商主要使用端到端算法,在理想实验环境下语音
识别准确率可高达98%以上。
图1-1:Al语音识别发展历程
模板匹配阶段
(1950s-1960s)
20世纪50年代至60年代属于AI语音识别的萌芽阶段,在该阶段语音识别主要是通过模板匹配的方法实现,在本阶段语音识别的主要特点是系统只能理解有限的词汇以及内存中的数字,无法将语音转化为完整的句式或者词汇,同时对于不同的声音模式,机器能识别的数量极为有限。
模式和特征分析阶段
(1970s-1980s)
20世纪70年代至80年代属于AI语音识别的起步阶段,在该阶段系统可以通过对声音的模式和特征设置参数,并基于大量词汇进行连续的语音识别,在本阶段语音识别系统仍主要处于研究和探索阶段,主要成果来自高校及研究所。
心
概率统计建模阶段
(1990s-2010s)
语音识别开始正式步入成长期,主流算法开始转为概率统计建模阶段,主要应用的模型为隐马尔可夫模型(HMM)和高斯混合模型(DMM)。
在本阶段,语音识别系统开始逐渐有成熟的商业化产品面世。
同时,神经网络在语音识别领域也在稳步发展,直至Hinton在2006年提出深度置信网络(DBN),深度神经网络(DNN)开始频繁出现在语音识别的主流市场,并挑战传统概率统计算法的主导地位。
深度神经网络阶段
(2010年至今)
21世纪10年代至今,语音识别领域已经开始大规模出现商业化落地的消费级产品及专业级产品,算法也由传统概率统计算法转向以深度神经网络方法为主导。近几年出现的端到端模型进一步提升了语音识别的准确率,截止2019年年末,在安静的近场场景下,语音识别的准确率已经高达98%以上。与此同时,语音识别作为Al交互的入口,也在更多的场景下得到广泛应用。
来源:fsTEAM软件采编,沙利文研究院绘制
3
2中国Al语音识别市场概览
2.1Al语音识别产业链分析
中国A
原创力文档

文档评论(0)