人工智能导论第10章_自然语言理解教材教学课件.pptVIP

下载本文档

2
0
约1.61千字
约 35页
2018-03-14 发布于天津
举报
版权申诉

人工智能导论第10章_自然语言理解教材教学课件.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

毕业论文毕业设计开题报告论文报告设计报告可行性研究报告

第 10 章自然语言处理及其应用 ;第10章自然语言处理及其应用;第10章自然语言处理及其应用;第10章自然语言处理及其应用;10.1.1 自然语言理解的概念;10.1.2 自然语言理解研究的产生与发展 ;第10章自然语言处理及其应用;文字表达句子的层次：词素→词或词形→词组或句子。声音表达句子的层次：音素→音节→音词→音句。语言处理过程分为五个层次：语音分析、词法分析、句法分析、语义分析和语用分析。语用分析：研究语言所存在的外界环境对语言使用产生的影响。构成单词发音的独立单元是音素。上下文不同而发音不同。语音分析就是根据音位规则，从语言流中区分出一个个独立的音素，再根据音位形态规则找出一个个音节及其对应的词素或词。;3. 语义分析; 语义文法是将文法知识和语义知识组合起来，以统一的方式定义为文法规则集。 ; 目的：为了找出动词和跟动词处在结构关系中的名词的语义关系，同时也涉及动词或动词短语与其他的各种名词短语之间的关系。 ;S;第10章自然语言理解及其应用;10.3 机器翻译;10.3.1 机器翻译方法概述; 1. 直译式翻译系统(direct translation MT systems) 通过快速的分析和双语词典，将原文译出。; 3. 中介语式翻译系统(inter-lingual MT systems) 先生成一种中介的表达方式，而非特定语言的结构；再由中介的表达式，转换成译文。 ; 4. 知识库式翻译系统(knowledge-based MT systems) 翻译经常需要除了词汇之外的各种知识，使用知识获取工具(knowledge acquisition)，以充实知识库的内容。 ; 基本原理：用户利用已有的原文和译文，建立起一个或多个翻译记忆库，在翻译过程中，系统将自动搜索翻译记忆库中相同或相似的翻译资源（如句子、段落等），给出参考译文，使用户避免无谓的重复劳动，只需专注于新内容的翻译。翻译记忆库同时在后台不断学习和自动储存新的译文，变得越来越“聪明”。;第10章自然语言理解及其应用;10.4.1 语言识别的概念;10.4.2 语音识别的主要过程; 语音信号预处理采样：对信号进行量化，量化不可避免地会产生误差。量化后的信号值与原信号值之间的差值为量化误差，又称为量化噪声。预加重：是提升高频部分，使信号的频谱变得平坦，保持在低频到高频的整个频带中，能用同样的信噪比求频谱，以便于频谱分析或声道参数分析。端点检测：包含语音的一段信号中确定出语音的起点以及终点。;过零率：信号中波形穿越零电平的次数来描述幅度变化的剧烈程度。;;矢量量化（vector quantization，VQ）技术是七十年代后期发展起来的一种数据压缩和编码技术。在标量量化中整个动态范围被分成若干个小区间，每个小区间有一个代表值，对于一个输入的标题信号，量化时落入小区间的值就用这个代表值代替。;5.识别。识别系统的输入是从语音信号中提出的特征参数语音识别所采用的方法一般有：（1）模板匹配法。在训练阶段，用户将词汇表中的每一个词依次说一遍，将其特征矢量作为模板存入模板库。在识别阶段，将输入语音的特征矢量序列依次与模板库中的每个模板进行相似度比较，将相似度最高者作为识别结果输出。（2）随机模型法。如隐马尔可夫模型(HMM)。用HMM的概率参数来对似然函数进行估计与判决，从而得到识别结果。（3）概率语法分析法。不同的人说同一些语音时，相应的语谱总有一些共同的特点以区分于其他语音。将区别性特征与来自构词、句法、语义等语用约束相互结合，构成由底向上或自顶向下的交互作用知识系统。 ;10.4.3 隐马尔可夫模型;;解决三个基本问题：;输入语音; THE END