汉语搭配定量分析探究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语搭配定量分析初探 孙茂松黄昌宁方捷 中国北京 邮政编码100084 清华大学计算机科学与技术系 摘 要 搭配在语言教学 特别是第二语言教学 语言信息处理等领域具有一定的应用价值 汉语搭配的研究仍停留在主要以人 语言学家 的主观判断为标准的定性分析阶段 缺乏定 量数据的支持 本文借鉴了国外在语言学和语料库语言学两个方面关于搭配研究的最新成 果 提出了包括强度 离散度及尖峰三项统计指标在内的搭配定量评估体系 并据之构造了 相应的搭配判断算法 作为对该算法的初步测试 我们以一个约七百一十万词次的新华社新 闻语料库为工作平台 利用计算机对 能力 一词可能构成的搭配进行了全面分析 实验结 果显示 就该词而言 算法自动发现搭配的准确率约为 33.94% 本项研究可望为语言学家 客观 系统 一致地分析搭配提供定量的辅助手段 既可减轻工作强度 又可提高搭配的质 量和覆盖面 1. 意义 为什么我们说 穿衣 戴帽 而不说 穿帽 戴衣 为什么同是 看 当后接 电影 球赛 小说 朋友 时 英语译文必须分别以see, watch, read 及visit 与之 对应? 显然 这是搭配 (collocation) 的影响所致 搭配在语言教学 特别是第二语言教学 进而在语言交际中的作用 早已为人们所认识 并且日益得到重视 近年出版或再版的一些 比较著名的英语通用词典(general-purpose dictionary), 如 Webster’s New World Dictionary, Collins English Dictionary, Concise Oxford Dictionary, The Random House Dictionary of the English Language, 均收录了一定数量的搭配 正反映了这种趋势 搭配研究的一个新兴应用领域是语言信息处理 一切自然语言处理系统归根结底都是基 于知识的系统 如果希望计算机实现对一个句子的理解或翻译 那么人完成同样任务所需要 的全部知识 严格说来计算机一点儿也不能少 搭配知识则是所谓 全部知识 中有机组成 部分之一 仍以 看电影 看球赛 看小说 看朋友 为例 对它们进行句法 语义 分析 就会发现它们的句法结构和语义表示完全相同 均为动宾结构且宾语均为动作 看 的受事 必须嵌入相关的搭配知识才能体现出 差异 从而生成合适的译文 再如 汉 语中双音节动词加双音节名词既可构成谓词性成分 如 生产化肥 生产汽车 , 也可 构成体词性成分 如 生产能力 生产资料 前者具语法上的普遍性 后者则属 个 例 搭配 根据搭配知识很容易排除分析过程中遇到的此类歧义 2. 对搭配的认识及其相关研究 什么是搭配 视乎不同的理论角度与应用背景 语言学家 包括词典编辑工作者 对此 问题存在着不同的理解 如Allerton 1984; Benson 1985,1986,1989,1990;Cruse 1986; Halliday 1985; Palmer 1981 本文不打算展开讨论 在搭配领域最具影响的研究当推美国宾州大学 Benson 教授的工作及其负责编篡的BBI Combinatory Dictionary of English 1985,1986 我 们比较倾向 Benson 编篡BBI 时给出的关于搭配的定义 定义 搭配是一种具有任意性的 重复出现的词的组合 A collocation is an arbitrary and recurrent word combination. 从Benson 的定义可知搭配的两条重要性质 性质1 搭配是重复出现的 这一性质决定了搭配应有一定的流通度 而非偶然的 个例 性质2 搭配是任意的 这里有必要引入两个与性质 2

文档评论(0)

精品教学资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档