- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 自然语言理解(Natural Language Understanding);10.1 自然语言理解概述; 语言是音义结合的词汇和语法体系,是实现思维活动的物质形式。语言是一个符号体系,但与其他符号体系又有所区别。
语言是以词为基本单位的,词汇又受到语法的支配才可构成有意义的句子,句子按一定的形式再构成篇章等。词汇又可分为词和熟语。熟语就是一些词的固定组合,如汉语中的成语。词又由词素构成,“教师”是由“教”和“师”这两个词素所构成的。词素是构成词的最小的有意义的单位。“教”这个词素本身有教育和指导的意义,“师”则包含了“人”的意义。; 语法是语言的组织规律。语法规则制约着如何把词素构成词,词构成词组和句子。语言正是在这种严密的制约关系中构成的。用词素构成词的规则叫构词法,如教+师→教师。一个词又有不同的词形、单数、复数、阴性、阳性等等。这种构造词形的规则称为构形法,如教师+们→教师们。这里只是在原来的词后面加上一个复数意义的词素,所构成的并不是一个新的词,而是同一词的复数形式。构形法和构词法称为词法。 ; 语法中的另一部分就是句法。句法也可分成两部分:词组构造法和造句法。词组构造法是词搭配成词组的规则,如红+铅笔→红铅笔。这里“红”是一个修饰铅笔的形容词,它与名词“铅笔”组合成了一个新的名词。造句法则是用词或词组造句的规则,“我是计算机科学系的学生”,这是按照汉语造句法构造的句子。下图就是上述语法构造的一个完整的图解。
另一方面,语言是音义结合的,每个词汇有其语音形式。一个词的发音由一个或多个音节组合而成,音节又由音素构成,音素分为元音音素和辅音音素。音素是指一个发音动作所构成的最小的语音单位。 ; 语言 ; 从微观上讲,语言理解是指从自然语言到计算机系统内部之间的一种映射。从宏观上看,语言理解是指机器能够执行人类所期望的某些语言功能。这些功能包括:
(1)回答有关提问;
(2)提取材料摘要;
(3)文本释义;
(4)不同语言翻译。
自然语言理解是语言学、逻辑学、生理学、心理学、计算机科学和数学等相关学科发展和结合而形成的一门交叉学科;它能够理解口头语言或书面语言。语言交流实际上是一种基于知识的通信。 ; 对自然语言的理解是一个十分艰难的任务,即使建立一个只能理解片言断语的计算机系统,也是很不容易的。这中间有大量的极为复杂的编码和解码问题。一个能够理解自然语言的计算机系统就像一个人那样需要上下文知识以及根据这些知识和信息进行推理的过程。自然语言不仅有语义、语法和语音问题,而且还存在模糊性等问题。具体地说,自然语言理解的困难是由下列3个因素引起的:
(1)目标表示的复杂性;
(2)映射类型的多样性;
(3)源表达中各元素间交互程度的差异性。 ;10.1.4 自然语言理解研究的进展
机器翻译是自然语言理解最早的研究领域。
70年代初期,语言理解对话系统的研究取得进展。伍兹的LUNAR系统、威诺甘德的SHRDLU系统和香农的MARGIE系统等是语言理解对话系统的典型实例。
新型的智能计算机要求设计出更为友好的人机界面,使自然语言、文字、图象和声音等信号能直接输入计算机。
口语理解研究促进人机对话系统走向实用化。自然语言是表示知识最为直接的方法。因此,自然语言理解的研究也为专家系统的知识获取提供了新的途径。
此外,自然语言理解的研究已促进计算机辅助语言教学(CALI)和计算机语言设计(CLD)等的发展。;10.1.5 自然语言理解过程的层次
语言虽然表示成一连串的文字符号或者一串声音流,但其内部事实上是一个层次化的结构,从语言的构成中就可以清楚的看到这种层次性。一个文字表达的句子是由词素→词或词形→词组或句子,而用声音表达的句子则是由音素→音节→音词→音句,其中每个层次都是受到语法规则的制约。因此,语言的分析和理解过程也应当是一个层次化的过程。许多现代语言学家把这一过程分为5个层次:语音分析、词法分析、句法分析和语义分析和语用分析。虽然这种层次之间并非是完全隔离的,但是这种层次化的划分的确有助于更好地体现语言本身的构成。 ; 1、语音分析
在有声语言中,最小可独立的声音单元是音素,音素是一个或一组音,它可与其他音素相区别。语音分析则是根据音位规则,从语音流中区分出一个个独立的音素,再根据音位形态规则找出一个个音节及其对应的词素或词。
2、词法分析
其主要目的是找出词汇的各个词素。如unchangeable是由un-change-able构成的。在英语语??中,找出句子中的词汇是一件很容易的事,
您可能关注的文档
最近下载
- 广东省广州市庆丰实验学校2024-2025学年高一上学期10月月考数学试题(解析版) .pdf VIP
- 2025年护肤行业新品洞察.pdf VIP
- 《民宿文化与运营》课件——第二章 民宿类型.pptx VIP
- 《促织》教学课件.pptx VIP
- QB-T 1438-2007 簿册-轻工行业标准.pdf VIP
- 2025年4月护肤爆品拆解.pdf VIP
- AED使用培训课件.pptx VIP
- 金税四期税务风险预警指标汇总.pdf
- 第2课+丰富多彩的中华传统体育+课件 2025-2026学年人教版(2024)初中体育与健康八年级全一册.pptx VIP
- 中国药品流通行业市场运行分析及发展趋势与投资研究报告2025-2028版.docx
文档评论(0)