- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
我与计算语言学的缘分 - International Language Communication
《现代语文》,2007 年第 9 期(总第 282 期),p127-128
我与计算语言学的缘分
冯志伟
计算语言学是一个横跨语言学、数学和计算机科学的交叉学科。语言学和数学都是
有着相当长历史的古老学科。语言学历来被看作是典型的人文科学,数学则被许多人看作是
最重要的自然科学。在学校教育中,语文和数学被认为是两门最基础的学科,成为任何一个
受教育者的必修课。它们似乎成了学校教育的两个极点:一个极点是作为文科代表者的语文,
另一个极点是作为理科代表者的数学。很少有人想到,这两门表面上如此不同的学科之间竟
然会存在着深刻的学术联系。计算机科学是研究计算机的新兴学科,带有相当强的工程性质
和浓烈的技术色彩,属于高科技的范畴,表面上看来,作为典型的人文科学的语言学与属于
高科技的计算机科学也不会存在什么瓜葛。因此,在一般人的心目中,这门横跨语言学、数
学和计算机科学的计算语言学似乎是不可思议的,甚至是有悖于常识的,就是连“计算语言
学”这个名称也几乎是荒谬绝伦的。
然而,一些具有远见卓识的学者却早就洞察了语言学、数学和计算机科学之间的紧
密联系。1847 年,俄国数学家布里亚柯夫斯基( В.Я.Буляковский)提出了用
概率方法来进行语法、词源及语言历史比较研究的思想。1894 年,瑞士语言学家索绪尔(De
Saussure)指出,“在基本性质方面,语言中的量和量之间的关系可以用数学公式有规律地
表达出来”,后来,他在其名著《普通语言学教程》(1916 年)中又指出,语言学好比一
个几何系统,“它可以归结为一些待证的定理”。1904 年,波兰语言学家博杜恩.德.库尔
特内(Baudouin de Courtenay)认为,语言学家不仅应该掌握初等数学,而且还有必要掌握
高等数学 。他表示坚信,语言学将日益接近精密科学,语言学将根据数学的模式,一方面
“更多地扩展量的概念”,一方面“将发展新的演绎思想的方法”。1933 年,美国语言学
家布龙菲尔德(L. Bloomfield)提出了一个著名的论点:“数学只不过是语言所能到达的最高
境界”。法国数学家阿达玛(J. Hadamard)说得更好:“语言学是数学和人文科学之间的桥梁”,
他一语道破了语言学和数学之间的联系,并清楚地看出了语言学是人文科学中最容易与数学
建立联系的学科。
著名俄国数学家马尔可夫(A. A. Марков)更是躬行实践,他在 1913 年把普希
金的叙事长诗《欧根·奥涅金》中的连续字母加以分类,研究俄语字母序列内部的关系,提
出了马尔可夫随机过程论,后来成为了一个独立的数学分支,对现代数学的发展产生了深远
的影响。语言结构中蕴藏着的数学规律,成为了马尔可夫创造性思想的取之不尽的源泉。
1946 年第一台电子计算机 ENIAC 在美国研制成功。就在电子计算机问世的同一年,
英国工程师布斯(A.D.Booth )和美国洛克菲勒基金会副总裁韦弗(W.Weaver )在讨论电子
计算机的应用范围时,就提出了利用计算机进行语言自动翻译的想法。韦弗在 1947 年 3 月
4 日给控制论学者维纳(N. Wiener )的信中说:“我怀疑是否真的建造不出一部能够作翻译
的计算机?即使只能翻译科学性的文章(在语义上问题较少),或是翻译出来的结果不怎么
优雅(但能够理解),对我而言都值得一试。”可见,电子计算机一出现,计算机科学家的
慧眼就投到了自然语言的自动处理方面。
这样看来,语言学、数学和计算机科学之间确实有着深刻的内在联系,那么,作为
一门横跨语言学、数学和计算机科学的计算语言学的存在便应该是合情合理的了。
我是一个普通的凡人,当然不可能有上述学者那样的远见卓识。我是在一个偶然的
机会与计算语言学结下了不解之缘的。这里,我愿意说一说我与计算语言学的这种缘分。
我于 1957 年高中毕业后,考入北京大学地球化学专业本科就读,当时我非常崇拜俄
罗斯地球化学家费尔斯曼(Felsman),一心想研究化学元素在地球上的分布规律。就当我在
北京大学认真学习地球化学的前后,国外兴起了数理语言学,建立起了完善的理论和方法,
并且在许多大学中开设了数理语言学的课程。数理语言学作为一个独立的学科出现在现代语
言学的百花园中。在五十年代虽然还没有出现“计算语言学”这个名称,但是,数理语言学
与后来出现的计算语言学有着密切的联系。北京大学高举五四“民主”和“科学”的大旗,
学术空气
文档评论(0)