《基于认知的汉语计算语言学研究》序言.pdfVIP

下载本文档

19
0
约7.87千字
约 5页
2017-09-13 发布于重庆
举报
版权申诉

《基于认知的汉语计算语言学研究》序言.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《基于认知的汉语计算语言学研究》序言读了袁毓林教授新著的文集《基于认知的汉语计算语言学研究》，使我联想到美国著名人工智能专家 T. Winograd 在 1983 年写的专著《作为认知过程的语言》（Language as a Cognitive Process ）。这两本书都试图从认知的角度来研究计算语言学的问题。可惜Winograd 的专著只写了“句法”（Syntax ）部分，没有再继续往下写。几年以前，我在国外曾经遇见 Winograd ，问他为什么不继续写“语义学”（Semantics ）部分，他回答说，语义学太复杂，不打算继续写下去了，这样，《作为认知过程的语言》这本专著可以说只是写了一半，就半途而废了。从 Winograd 的学识和才气来说，他是完全可以继续写下去的，可是他没有继续写，我感到非常之可惜。毓林的这本文集，着重从认知的角度探讨论元结构和语义标注，基本上都是语义的问题，恰好弥补了 Winograd 专著的不足，令我感到兴奋。 T. Winograd 在他的专著中说，为了从认知的角度来研究语言，应该解决如下两个问题：第一，一个人要说话和理解语言，必须具有哪些知识？第二，为了在语言交际中使用这些知识，人们的心智（mind ）是怎样组织这些知识的？根据研究计算语言学多年的实践经验，一个人在说话和理解语言时，不仅需要关于语言的知识，而且还需要各种非语言的知识，例如关于外在世界的知识、日常生活中的常识等，这已经是不容争论的问题，事实上，计算语言学研究者也在努力把这些知识形式化，以便计算机处理。但是，要了解人们的心智究竟怎样组织这些知识，却是一个十分困难的问题。认知语言学试图解决这样的问题。认知语言学是 20 世纪 80 年代才出现的语言学科，如果把 1989 年在德国 Duisburg 召开的国际第一届认知语言学会议作为认知语言学诞生的标志，那么，这门学科至今才有短短 16 年的历史，可以说是非常年轻的学科。其实，在认知语言学产生之前，很早就有人提出了通过语言来揭示人类心智的问题，已经涉及到认知语言学的问题。1933 年，英国数学家 A. M. Turing 就预见到未来的计算机将会对自然语言研究提出新的问题。他在《机器能思维吗》一文中指出：“我们可以期待，总有一天机器会同人在一切的智能领域里竞争起来。但是，以哪一点作为竞争的出发点呢？这是一个很难决定的问题。许多人以为可以把下棋之类的极为抽象的活动作为最好的出发点，不过，我更倾向于支持另一种主张，这种主张认为，最好的出发点是制造出一种具有智能的、可用钱买到的机器，然后，教这种机器理解英语并且说英语。这个过程可以仿效小孩子说话的那种办法来进行。” Turing 提出，检验计算机智能高低的最好办法是让计算机来讲英语和理解英语，他天才地预见到计算机和自然语言将会结下不解之缘。我认为，Turing 这种预见的实质，就是提出了“语言是认知的窗口”这个重要命题。这个命题是认知语言学的基础。所以，从认知的角度来研究计算语言学，进行“基于认知的汉语计算语言学研究”，是非常必要的。毓林在这本文集中，从认知的角度研究了汉语的论元结构和描述框架，并进行了真实文本语义标注的实践，使我们对于汉语的论元结构有了更加深刻的认识。在20世纪70年代末和80年代初，我在法国格勒诺布尔理科医科大学研制汉-法/英/ 日/ 俄/德多语言机器翻译系统FAJRA 时，就根据Tesnière 的依存语法（grammaire de dépendence ），对汉语动词、形容词和部分名词的论元结构进行了初步的探索，当时我提出的论元有：施事、受事、与事、关涉、时刻、时段、时间起点、时间终点、空间点、空间段、空间起点、空间终点、初态、末态、原因、结果、工具、方式、目的、条件、作用、内容、范围、论题、修饰、比较、伴随、判断、陈述、附加等，共30个，其中，施事、受事、与事3个论元是“行动元”（actants），其他27个论元是“状态元”（circonstants）。我根据机器词典中存储的单词的语法和语义的静态信息以及在句法分析中运算得出的句法功能的动态信息，使用计算机求解了这些论元信息，把汉语自动地翻译成5种外语，顺利了完成了多语言机器翻译实验。可是，我在20多年前对于汉语论元结构的研究，是从依存语法和工程应用的角度出发的，根本没有考虑到这些论元的认知基础。