网站大量收购闲置独家精品文档,联系QQ:2885784924

人工智能-powerpointpresentation.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人工智能-powerpointpresentation

A.《简明不列颠百科全书》(中国大百科全书出版社1986年出版) 语言学(Linguistics)是对语言的科学研究。语言学的名称始于19世纪中叶,强调语言研究的新方法以区别于传统语文学方法。 B.王宗炎 为《中国大百科全书·语言文字》(1988年)写的语言学词条 语言学是以人类语言为研究对象的学科。它的探索范围包括语言的结构、语言的运用、语言的社会功能和历史发展,以及其他与语言有关的问题。 语言学基本概念 语法:语法就是词的构造、变化的规则和用词造句的规则,它是语言在其长期发展过程中形成的,全体成员必须共同遵守的规则。 词法:词法指词位的构成和变化的规则。 句法:句法是指组词成句的规则。 我们可以期待,总有一天机器会同人在所有的智能领域里竞争起来。但是,如何开始呢?这是一个很难决定的问题。许多人以为可以把下棋之类的极为抽象的活动作为最好的出发点,不过,还有一种办法也应加以考虑,就是为机器配备具有智能的、可用钱买到的意识器官,然后,教这种机器理解并且说英语。这个过程可以仿效通常小孩子学话的方式进行。我不能确定到底哪个出发点更好,但应该都值得一试。 关于自然语言处理 自然语言处理是植根于计算机科学、语言学与数学等多学科一门新兴学科,它的研究内容主要是自然语言信息处理,也就是人类语言活动中,信息成分的发现、提取、存储、加工与传输。 自然语言处理的研究成果可在机器翻译、文献检索、信息提取、文本管理、自然语言人机接口等重要领域得到应用。近年来,因特网(Internet)日益普及,社会对语言信息处理技术的需求日趋迫切。自然语言处理作为语言信息处理技术的主要基础学科,其重要意义已经得到学术界和产业界越来越多的认可,在欧美已经有不少大学设立了自然语言处理系或专业,从本科起就组织自然语言处理的教学工作。 从计算角度研究语言 所谓从计算的角度来看语言的性质,就是要求将人们对语言的结构规律的认识以精确的、形式化的、可计算的方式呈现出来,而不是像其他语言学研究那样,在表述语言的结构规律时一般采用非形式化的表达形式。 例子 . 张三赶跑了李四 . 张三把李四赶跑了 . 李四被张三赶跑了 . 吴妈以前很喜欢阿Q的理论 . * 吴妈把阿Q的理论以前很喜欢 . * 阿Q的理论被吴妈以前很喜欢 语法规律 1)汉语中的一个基本句型是: P0: X +动词+Y 2)P0可以变换为“把”字句或“被”字句 P1: X+把+Y+动词 P2: Y+被+X+动词 3)有些时候P0可以变换为P1,P2; 有些时候P0不可以变换为P1,P2; 翻译的问题 . 原文: The spirit is willing, but the flesh is weak 译文:酒是好的,但肉是馊的 (心有余而力不足) . 原文:How are you? 译文:怎么是你? 原文:How old are you? 译文:怎么老是你? 翻译的问题 I bought a table with three legs.(我买了一张有三条腿的桌子。) I bought a table with three dollars.(我花三美元买了一张桌子。) 翻译的问题 计算机要翻译这两句话,却碰到了不易处理的歧义结构问题。尽管当代计算机的存储容量极大,但也不可能一一记住所有英语句子的汉语译文。计算机不难记住数量有限的英语句子结构及其对应的汉语句子结构。一般地说,计算机系统里有了这样的知识,就可以通过句法分析和查词典实现自动翻译了。这一步算是句法理论(syntax)的成就。 上述两个句子的结构都是:名词短语+ 动词+ 名词短语+ 介词短语 翻译的问题 最后的介词短语既可以修饰句中的动词,也可以修饰后一个名词短语。要计算机针对具体的句子决定取舍,可就犯难了。因此要以某种形式给计算机灌输诸如“桌子有腿,用美元可以购物”之类的知识,并要教会计算机如何运用这些知识,这属于语义学(semantics)和语义分析的研究范围。在很多情况下,计算机死记住一些静态的知识还不能消解这种结构的歧义,还要学会分析上下文和谈话的环境,从语境中获取并活用动态的知识,这又要靠语用学(pragmatics)和语境分析(context analysis) 发挥作用了。除了要分析语言,文章生成(text generation)也是一门学问。 语言交流的单位 言语的辨知和言语的发生在使用语言时,人们要听懂对方的话,这是言语的辨知;自己又要能说出话来,这是言语的发生。??从心理学看来,话语内容的基本单位是命题。要听懂对方的话,就要知道它的命题,要弄清其中有多少个成分,各成分又以哪里为界线。从1965年起,美国学者M.加雷特等人常常使用“卡塔研究法”,即故意在一句话不应该停顿的地方插入“卡塔”声(下文

您可能关注的文档

文档评论(0)

1honey + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档