- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自然语言理解 主 讲 :付 宏 杰 单 位 :信息工程学院 第五章:自然语言理解 基本概念 当我们从事任何一项研究的时候,总要关注两方面的问题:一是是什么,为什么?二是做什么,怎么做?这恰恰是科学与技术紧密相关的两个方面。 自然语言处理既是一项技术,又是一门科学。 5.1 基本概念 信息的主要载体-语言 语言的两种形式-文字和声音 文字和声音作为语言的两个不同形式的载体,所承载的信息占整个信息组成的70%以上(文字:70%,图象:20%;其它:10%) q 如何让计算机实现人们希望实现的语言处理功能? q如何让计算机真正实现海量的语言信息的自动处理和有效利用? 5.1 基本概念 q 语言学(linguistics) 是指对语言的科学研究。作为一门纯理论的学科, 语言学在近期获得了快速发展,尤其从上个世纪60年 代起,已经成为一门知晓度很高的广泛教授的学科。 包括:历时语言学(diachronic linguistics)(或 称历史语言学(historical linguistics))和共时语言学(synchronic linguistics)、描述语言学(descriptivelinguistics)、对比语言学(contrastive linguistics)、结构语言学(structural linguistics)等等。 5.1 基本概念 q 语音学(phonetics) 研究人类发音特点,特别是语音发音特点,并提出各种语音描述、分类和转写方法的科学。 包括: (1)发音语音学(articulatory phonetics),研究 发音器官如何产生语音;(2)声学语音学(acoustic phonetics),研究口耳之间传递语音的物理属性;(3) 听觉语音学(auditory phonetics), 研究人通过耳、听觉 神经和大脑对语音的知觉反应。 5.1 基本概念 根据不同的研究方法,语音学又分为: (a)一般语音学(general phonetics): 对语音发音、声学或知觉的一般研究。 -与语言学的分析目的没有什么关系。 (b)实验语音学(experimental phonetics): 对具体语言语音特点的研究。 -语言学研究的一部分,有人甚至认为是语言学不可或缺的基础。 5.1 基本概念 问题: 语音学究竟是一门独立的学科还是应视为语言学的一个分支呢? è复数的语言科学(linguistic sciences) 语言学和其它学科的交叉产生了许多语言学的新分支,包括纯理论的和应用性的,如人类语言学(anthropologicallinguistics)、计算语言学(computational linguistics)、生物语言学(biolinguistics)、心理语言学(psycholinguistics)、教育语言学(educational linguistics)和社会语言学(sociolinguistics)等等。 5.1 基本概念 q计算语言学(Computational Linguistics) 计算语言学是利用电子数字计算机进行的语言分析。虽然许多其它类型的语言分析也可以运用计算机,计算分析最常用于处理基本的语言数据-例如建立语音、词、词元素的搭配以及统计它们的频率。 -《大不列颠百科全书》 5.1 基本概念 q计算语言学(Computational Linguistics) 是语言学的一个研究分支,用计算技术和概念来阐述语言学和语音学问题。已开发的领域包括自然语言处理(natural language processing, NLP),言语合成,言语识别,自动翻译,编制语词索引,语法的检测,以及许多需要统计分析和领域(如文本考释)。 -《现代语言学词典》[戴维.克里斯特尔,1997] 5.1 基本概念 q自然语言处理 或称自然语言理解(natural language understanding, NLU),人工智能研究的重要内容之一。自然语言处理(natural language processing,NLP)就是利用计算机为工具对人类特有的书面形式和口头形式的自然语言的信息进行各种类型处理和加工的技术。 -冯志伟《自然语言的计算机处理》 5.1 基本概念 近几年来,自然语言处理研究得到了前所未有的重视和长足的进展,并逐渐发展成为一门相对独立的学科而倍受关注,而且自然语言处理技术不断与语音识别(speech
文档评论(0)