冯志伟讲座 计划语言学的历史跟现状.pptVIP

冯志伟讲座 计划语言学的历史跟现状.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
冯志伟 一 计算语言学的性质 计算语言学是一门边缘学科   计算语言学(computational linguistics)是用计算机研究和处理自然语言的一门新兴的边缘学科。 由于计算语言学的研究对象是自然语言,因此,语言学家把它算为语言学的一个分支; 由于计算语言学要采用先进的计算机科学技术来研究和处理自然语言,因此,计算机科学家把它算为计算机科学的一个分支; 由于计算语言学要研究自然语言的形式结构和自然语言处理的算法,因此,数学家把它算为应用数学的一个分支。 这种情况说明,计算语言学不是一门单纯的学科,而是一门边缘性学科。 自然语言处理的过程 一般地说,计算机对自然语言的研究和处理应当经过如下4个过程: 从语言学的角度提出自然语言处理的问题和理论(linguistic problem); 把需要研究的语言学问题加以形式化(linguistic formalism),使之能以一定的数学形式或者接近于数学的形式,严格而规整地表示出来; 把这种严格而规整的数学形式表示为算法(algorithm),使之在计算上形式化(computational formalism); 根据算法编写计算机程序,使之在计算机上加以实现(computer implementation)。 理论和方法 上述的第一、第二个过程属于计算语言学的理论部分; 第三和第四个过程属于计算语言学的方法部分。 我们有时把第三和第四个过程叫做自然语言的计算机处理(Natural Language Processing by Computer),简称自然语言处理(Natural Language Processing)。 更新知识   我们希望计算语言学研究人员同时具备语言学、数学和计算机科学的知识,成为文理兼通、博学多识的人才。 对于不可能同时具备语言学、数学和计算机科学知识的研究人员,至少对于自己原来所学的专业是精研通达的内行,对于另外两个专业不是似懂非懂的外行,这样,才有可能有效地从事计算语言学研究。 因此,我们应该提倡计算语言学的研究人员不断地进行更新知识的再学习。“活到老,学到老”,对于计算语言学研究人员来说,决不是一句装扮门面的空话,而应该成为身体力行的座右铭。 二 计算语言学的萌芽期 萌芽期、发展期和繁荣期   同其他任何学科一样,作为一门新兴边缘科学的计算语言学是在一定的社会历史条件下应时代的要求而逐渐成长起来的,计算语言学的成长历程可以分为萌芽期、发展期和繁荣期3个时期。 “巴比塔”   人类对于计算语言学的研究早在“计算语言学”这个名称出现之前就开始了。人类历史上最早的计算语言学研究就是机器翻译(machine translation)。 圣经《创世纪》中说,古代人类说的原是一种统一的语言,交流思想非常方便,劳动效率也很高,他们曾经想建立一座高达天庭的通天塔,叫做“巴比塔”,来显示他们的丰功伟绩。建造巴比塔的壮举震惊了上帝,上帝便施伎俩,让不同的人说不同的语言,使人们难于交流思想,无法协调工作,以此来惩罚异想天开的巴比塔建造者。结果,巴比塔没有建成,而语言的不同,却成为人们相互交往的极大障碍。这样的传说当然是不可信的,但是,语言的障碍却时时刻刻在困扰着人们。 巴比塔 “普遍语言”的运动 在17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。 笛卡儿(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上来编写词典。 在17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann Joachim Becher)等人都出版过这类的词典。由此开展了关于“普遍语言”的运动,一些人试图在逻辑原则和图形符号的基础上,创造出一种无歧义的语言,这样一来,人们就不必再由于误解而产生交际方面的困惑了。 维尔金斯 维尔金斯(John Wilkins) 在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character and Philosophical Language, 1668)中提出的中介语(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。 数字语法 1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W. Rieger) 曾经提出过一种数字语法(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译” (德文是

文档评论(0)

rachel + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档