北京地区现场即席话语语料库的取样与代表性问题.docxVIP

  • 60
  • 0
  • 约1.09万字
  • 约 16页
  • 2019-07-01 发布于广东
  • 举报

北京地区现场即席话语语料库的取样与代表性问题.docx

北京地区现场即席话语语料库的取样与代表性问题 顾曰国 屮国社会科学院语言研究所 提要 取样与代表性是语料库建设首要的问题。它们关系到语料库的可信度和质量。本 文首先对前人的研究作了回顾,内容包括北京口语语料、伦敦■伦德语料库、标 准美国英语口语库和英国国家语料库口语库。接着介绍了北京地区现场即席话语 语料库是如何解决取样和代表性问题的。 关键词:取样、代表性、口语语料库 现场即席话语指两人或两人以上在某一场合事先无准备的谈话。它不同于我们常 说的“口语”,表现在口语包括的内容很广,下面这些都可以说是口语: 无准备 有话题限制 但是无准备 有话题限制无书面准备 有书面准备但不念稿 念稿子 单人 如自言自语 如讲个人经历 如口语考试 如口头独白、单口相声 如阴读、新闻广播 两人或两人以上 殆如日常牛活交谈 *如体育沙龙 *如现场采访 如演戏、相声 如集体朗诵 带星号的才属于本文定义的现场即席话语,其中H常生活中无准备的交谈最具 有典型性。建构现场即席话语语料库是一个非常复杂的过程,涉及到诸多方方面 面。其中首要的就是木文要讨论的取样与代表性问题。这是因为现场即席话语是 最古老也是日常生活中最频繁的语言活动,可以说是腑拾皆是,同时还是个开放 集,是无法穷尽的。这就决定了取样与代表性问题是不可逾越的。具体说來,我 们必须在着手建库之前对下述问题作出有理有据的回答:录谁的话语?录什么内 容

文档评论(0)

1亿VIP精品文档

相关文档