本讲座选自清华大学中国语言文学系黄国营老师于2016年1月.PDFVIP

  • 18
  • 0
  • 约4.65千字
  • 约 19页
  • 2018-12-13 发布于天津
  • 举报

本讲座选自清华大学中国语言文学系黄国营老师于2016年1月.PDF

本讲座选自清华大学中国语言文学系黄国营老师于2016年1月

本讲座选自清华大学中国语言文学系黄国营老师于2016年1月19日在 RONGv2.0系列——“语言语音语义与大数据技术”专场论坛上所做的 题为《未来的语法书和词典可能是什么样儿?——大数据和语言学研 究》的演讲。 这个题目一方面来源于大数据时代来临我自己的感受,同时也来 源于对我们这些年研究的一个反思。 现在网上很多在线的词典、在线的输入法,还有在线的百科全书, 百科维基等,实际上已经给我们预示了大数据对传统语文工具所带来 的一种颠覆性的改变:大数据的时代已经到来。数据和信息大爆炸, 大数据体量非常巨大的,而且还是increasing data,不断飞速增长; 是real-time data,可以实时处理及时得到结果的;还是cloud-based data,是基于云计算很方便管理和分析的。现在大数据已经从数量的 增加,到了发生质变的这么一个阶段。所以这种情况非常深刻地影响 了语言研究的理论和方法,最终会体现在语法书和词典上面。 在不久的将来,语法书和语法词典可能会有一种新的形态,它是 基于大数据和云计算的一种多功能综合平台,这种平台可能具有下面 几个特点:第一,它是语法和词汇一体化的,也就是说语法书和词典 是融合在一起的。第二,是研究、编辑、使用一体化的。第三,它是 多层次、多维度、多功能的一体化的。如果从语言学理论上来说,它 实际上就是语言和言语的一体化。从语法学上来讲,语言学的很多纠 结问题,也是编写语法书或者编写词典当中可能遇到的很多麻烦。实 际上大都出现在语言和言语,这衔接两者的最后的一公里。 这种与时俱进的多层次、多维度、多功能的词典和语法书,它是 传统的纸媒体的工具无法实现的,只能在网上以电子形式出现,并且 具有传统的语文工具书所不可能具有的优势。大数据的理论非常重视, 一个是全样本,而不是抽样。第二它重视像似性和网络性,而不是我 们传统重视的符号性。第三它重视的是相关性而不是因果性。第四它 重视的是描写性,而不是解释性,也就是说它强调的是What,而不是 Why。而这些都是在语言学里面传统的理性主义和经验主义两种取向 的根本分歧。在现在大数据呼啸而来之际,是非常值得我们思考的。 理性主义、经验主义在语言学当中的影响,实际上它是一个波浪式的 前进和螺旋式的上升,这样才会互相交替的,但是现在又来了这么一 个新的阶段,就是整个波浪当中的一段。 语法。在大数据的时代,在这个背景下面,未来电子版的语法书 我想可能和传统的是很不一样的,它编写的方法和使用的方法很不一 样。我这里讲两个小故事,谈谈我为什么会有这样的认识。一个是非 谓形容词,我在1978年读研究生的时候做的第一次作业写的第一篇小 文章“非谓形容词”,一般的形容词是可以又做谓语又做定语的。但 是非谓形容词只能做定语,而不能做谓语。这个“非谓形容词”有的 叫区别词,这是甚至把它和形容词并列。非谓形容词是把它作为形容 词下面的一个小类。但是做这个作业的时候,我就在琢磨这么一个问 题,因为你用这个主谓宾定状补,区分句法的可能性,能承担什么、 不能承担什么,来判别给形容词分类,那么你现在把这个非谓形容词, 能做定语、不能做谓语的在形容词里面,列一个小类,甚至还有的学 者把它看成是和形容词平行的另外一个大类。但问题在于,如果我们 用“非谓”,能充当什么成分,不能充当什么成分这个标准来检测的 话,这个形容词里面到底能有多少类产生?当时80年代我研究生考试, 就让同学做这么一个题目,形容词横向上的主谓宾定状补,纵向的主 谓宾定状补,如果形容词根据句法的表现来分类有很多很多的类。为 什么我们现在只能提出非谓形容词这个小类呢?别的小类还有很多 啊。当时有的学生就根据这个思路写了一篇文章发表,就是形容词里 面既然有只能做定语,不能做谓语的,有没有反映出来只能做谓语不 能做定语的?有,而且100多个。比如说这个行,行不行,比如 “这 个小伙子真行”,但是你不能说这是一个“行小伙子”,你可以说“这 小伙子很棒”,也可以说“这是一个棒小伙子”。“行”就是能做谓 语,不能做定语,这样一类的,就看怎么处理它们了。这说明什么问 题呢?我就觉得这里面,分类可能有很多,分类的角度、层次和结果 其实是没完没了的,我们平时讨论的纠缠不清,很多涉及分类的性质、 方法和思路。 第二个例子讲讲“老师有多书”。我的留学生看到我家里有很多书, 他就说“老师有多书”。我说你不能说老师有多书,你只能说老师有很 多书。你可以说有好书、有新书、有旧书,但是为什么不能说有多书 呢?因此也牵扯到形容词的问题,为什么多、少就必须要加状语呢? 这样的

文档评论(0)

1亿VIP精品文档

相关文档