网站大量收购独家精品文档,联系QQ:2885784924

基于语料库技术形容词注释实态调查.doc

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于语料库技术形容词注释实态调查

基于语料库技术形容词注释实态调查   摘要文章是关于形容词注释的中观研究,关注的基本内容是形容词注释项目的构成和分布,而非各项目的顺序和结构的安排。文章基于意义和用法并重的外向型学习词典注释理念,对两部比较主流的外向型学习词典的形容词注释语言进行了全切分式标记,建设了形容词注释语言精加工语料库和数据库,通过对词典形容词注释的实态描写,说明了形容词注释的重点和难点,客观分析了现有注释的优劣,提出了相关的建议。   关键词形容词语料库注释项目   形容词是汉语的三大实词类之一,其重要性不言而喻。然而,由于研究手段的限制,精加工语料库的缺乏,已有的研究通常是举例定性式的研究,对外向型汉语学习词典形容词注释语言的现状,即对目前词典中形容词到底注释了哪些内容,各项内容分布如何,哪些项目是注释的重点难点,哪些该注,哪些不该注,该如何注等注释实态缺乏了解。词典是语言学习最基本和最重要的工具,其词语注释的优劣直接影响教、学的效果。所以应该加强对汉语学习词典的基础研究,而基础研究应该从对现有学习词典注释语言的实态调查开始。   为此,本研究选择当前比较主流的外向型学习词典《商务馆学汉语词典》(以下简称《商务馆》)、《现代汉语常用词用法词典》(以下简称《用法》),对其中所有被注形容词的注释内容,按功能进行划分,标记所有划分出来的注释项目,形成形容词注释语言标记语料库和注释项目数据库,在此基础上,进行系统的统计、分析和描写。希望该实态调查可以为汉语学习词典和对外汉语教材中形容词的注释及形容词教学提供参考。   一、 形容词注释项目的划分   词语皆因独特而存在,每个词语具体的注释内容各不相同,对这些内容进行实态分析,必须找到合适的切口以形成划分。面向汉语为第二语言学习者的词语注释,除了传统词典的意义注释项目外,还会注释词语的各种属性、各种组合特征,以及为预防偏误设置的其他需求,因而对注释项目的划分,应站在使用者的立场上,依其所起的作用或功能划分。这些功能的甄别,可资借鉴的先验知识有语言学本体研究成果,偏误研究成果及信息处理界知识库建设的经验等。根据语法本体界研究、对外汉语教学界的偏误研究、语言信息处理界有关知识库建设经验,结合对词典形容词注释语言的实验性标记,本研究为形容词注释内容的划分,制定了标记项目集。   该项目集共分为8大类36个注释项目(各项目的具体说明见“各类注释项目情况分析”一节)。其中: ① 传统常规注释项目“词目、拼音、繁体”;② 新常规注释项目“使用度”,词语使用的频率序,体现了词语的常用性,是语料库技术的成果;③ 典型意义注释项目“短语注、句子注、语义补充”;④ 典型用法注释项目,包括词性、语法功能、句类、语法形式、搭配、结构表达式、位置等,下辖的项目有“词性、兼类词性、兼类注、语法功能、特殊语法功能、语法例外、特定句类、重叠+重叠形式、否定形式、常用语形、语法搭配、语义搭配(适用对象描写)、与‘的|地’搭配、结构式、一般位置、条件位置”等;⑤ 社会交际类注释项目“语体风格、词语色彩、语气”;⑥ 防错注释项目“辨析、易混词、反义词、错例、错例注”;⑦ 综合实现项目“词|短语例、例句、例注”;⑧ 其他注释项目“英文注释、附加说明”。事实上,还有词典标记类项目,如插入语、义项号、代词号(~)、注意栏目标记等。由于本次考察不考察注释项目的顺序和结构,所以此类项目将以另文讨论。   其中,语义补充为除对当前词目理性意义注释外,对其使用中的易混淆意义或特别意义进行补充说明或注释,有预防语义偏误的功效。比如“彻底……: ‘彻底’不表示各个部分的总和”。这个补充可以预防学习者写下“那些强盗彻底(全部)落网”这样的句子。(见《用法》“彻底”条目)。   二、 词典形容词注释实态   以下对形容词注释语言的统计、分析和描写,均基于我们制作的《商务馆》和《用法》两部词典的形容词注释语言标记语料库和数据库。   (一) 形容词注释项目的分布情况   两部词典形容词的实际注释项目的分布数据如表1所示。   (二) 各类注释项目情况分析   以下我们将通过对表1数据的分析来探讨数据反映出来的形容词注释特性和问题。   1. 常规注释项目情况   无论传统理解型词典还是学习型词典,在注释词语时,通常都会注释此类项目。它们一般处于“用法和意义”注释的外围,通常出现在词条的头部,包括词目、拼音。“繁体”列于此,主要也是因为其出现在词条的头部,而且最常见的《现代汉语词典》也立有该项目。使用度(《用法》中的“位序”),这个项目是随着语料库技术在词典编纂中的应用而出现的注释项目,是词语(或义项、词性)使用程度的量化数据在词典编纂中的体现。“位序”作为展示词语使用度的注释项目,在词典中出现有积极的意义,但可以不同方式展示,比如字体、

文档评论(0)

fangsheke66 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档