- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专题讲座:语音识别与声纹识别;Contents;;1 语音信号处理基础
;对语音的研究;对语音的研究;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.1 语音信号的产生;1.2 语音信号的感知(自学);1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;1.3 语音信号的线性产生模型;输出语音频谱 ;1.4 语音信号的非线性产生模型(了解);声音处理;● 文件;声音处理;短时能量和过零率;参数提取的预处理;各种参数的比较;Mel-频率;Mel-频率;MFCC;2 语音识别;参考资料;内容提示;特定人和非特定人(话者相关或话者无关)
词汇量(大,小)
孤立词,连接词,关键词和连续语音
自然发音和朗读发音
口音(方言)
背景噪音(环境噪音)
信道差异(固定电话,麦克,手机等)
声学模型(HMM,mono-phone,bi-phone,tri-phone)
声学特征(MFCC)
解码(Viterbi);识别指标:
SER(Sentence Error Rate,句子错误率)
WER(Word Error Rate,词错误率)
CER(Character Error Rate,字错误率)
PER(Phone Error Rate,音节错误率)
采样率,8kHz(电话或手机),16kHz(麦克风)
时域,频域
端点检测,静音检测或有效音检测(VAD);人类利用语言相互交流信息,包括语音和文字两种表达方式。通过语音相互传递信息,这是人类最重要的基本功能之一。随着信息社会的发展,人与人之间,人与机器之间也需要进行大量的信息交换。
计算机语音识别是智能计算机系统的重要特征。这一技术的应用将从根本上改变计算机的人机界面,从而对计算机的发展以及推广应用产生深远的影响。;人与人之间、人与机器之间的语音信息处理过程;计算机模拟人类交流信息的过程;基于电话的语音识别技术,使计算机直接为客户提供金融证券和旅游等方面的信息查询及服务成为可能,进而成为电子商务中的重要一环(Voice-Commerce)。
语音识别技术作为声控产业,对编辑排版、办公自动化、工业过程和机器操作的声控技术起到重大的推进作用。可以预言,语音技术必将对工业、金融、商业、文化、教育等诸方面事业产生革命性的影响。;主要先进国家都将此工程列为国家级研究项目;Bill Gates 在97年世界计算机博览会(COMDEX)主题演讲会上描绘IT事业的发展宏图时指出:
下一代操作系统和应用程序的用户界面将是语音识别。工业界应对语音识别领域的重大突破做好充分准备,因为那将是一场席卷全球的另一次热潮。
1998年11月5日,微软中国研究院在北京成立。该中心的任务是重点研究计算机在中文环境下的易用性。 ;IBM公司潜心研究语音识别技术迄今已达30年之久,投资超过2亿美元。
IBM公司于1995年在北京成立了中国研究中心,中文语音信息处理成了该中心三大研究领域之一,并于1997年9月4日,在北京推出了中文连续语音识别产品ViaVoice。
;1998年,英特尔公司也宣布致力于推广语音识别技术,除了在北京举办首届语音技术国际论坛之外,还在北京、上海、成都、广州等地展开了“基于英特尔框架的语音识别技术”的宣传活动。
联合了七家世界著名学术机构(中科院自动化所、清华大学、香港科技大学、香港中文大学、麻省理工学院、俄勒岗研究院、WATERLLOO大学)成立了“国际语音技术研究组织”,致力于计算机语音技术的基础研究
文档评论(0)