概 说 - 在确立语法属性项目时主要是根据计算机分析.docVIP

概 说 - 在确立语法属性项目时主要是根据计算机分析.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概 说 - 在确立语法属性项目时主要是根据计算机分析

《现代汉语语法信息词典》说明 《现代汉语语法信息词典》(以下简称“语法词典”)是北京大学计算语言学研究所历时13年开发研制的电子词典。该词典近年来引起了人们的广泛关注,取得了很好的社会效益和经济效益。本文将对该词典的特点及不足作一评述。 1、语法词典的特点 1、1语法词典是电子词典,采用数据库文件格式存放,便于查询、检索、利用 语法词典是迄今为止世界上最大的描写现代汉语词语语法信息的电子词典,采用关系数据库文件格式描述词语及其语法属性的二维关系,属性值以简单明了的汉字表示。比如对动词的部分信息的描述如下: 词语 准谓宾 前名 后名 外内 体谓准 双宾 动趋 着了过 在 重叠 包围 准 可 可 外 体 趋 着了过 包装 准 可 可 外 体 趋 着了过 在 ABAB 给 外 体 双 趋 了过 在 整个词典共包括32个库文件,其中总库1个,子库23个,分库8个(详见后文)。所有库都可以用“词语、词类、同形”三个属性字段进行连接。这样,32个库文件构成有上下位继承关系的“树”,子结点继承父结点的全部信息,或者说,将父结点与子结点连接起来就可以得到词语的更全面的信息。这种结构可图标如下: 总库 名词库 时间词库 方位词库 区别词库 动词库 形容词库 代词库------(23个) 体词宾 谓词宾 双宾语动 动结式动 动趋式 离合词 人称代 指示与疑问 语分库 语分库 词分库 词分库 动词分库 分库 词分库 代词分库 这样的数据库文件的电子词典可以利用计算机数据库的技术按需求进行各种各样的查询、检索、分类,便于各种信息的提取、利用。该词典经过加工、改造后,可以上网变为网络词典,实现资源的高度共享。 语言知识的组织、表示方法,一直以来是计算机语言信息处理专家和计算语言学专家关注的问题。利用计算机数据库技术建立电子词典,是语言知识组织、表示的一种有效方法,它为语言信息处理专家快捷、方便地获取各种所需的语言知识提供了不可多得的有效方式。在这方面,语法词典为我们建立了一个很好的模式,现在沿用此模式开发的各种电子词典越来越多。 1、2语法词典的理论基础——词组本位语法 语言信息处理需要高质量的电子词典支持。高质量的电子词典不仅要求语言知识的内部表示一致、准确无误、覆盖范围广、信息丰富,而且要求知识的表述简洁程度高。要开发出这样高质量的语法词典就必须依据一种科学的语法理论,因为不同的语法理论所关注的语言现象以及对相同的语言现象所作的解释都不尽相同,而且在语法知识表述的简洁程度上也不同。汉语语法学产生了一系列语法体系,如“词本位”“句本位”“词组本位”“小句本位”“字本位”等。从信息处理对汉语语言知识提出的要求来看,衡量一种语法体系优劣的标准是对汉语语法知识的发掘程度及表述的简洁程度。这几种语法体系在发掘汉语语法知识方面各有侧重。句本位对汉语句型知识可能会有较深入的总结;小句中枢对汉语的复句系统应该更能产生研究成果;词组本位则更容易深入探求汉语的短语结构规则及规律;字本位对汉字组词的规则更加重视。从表述的简洁程度看,因为汉语在构造句的各个层次上存在着大致的同构倾向,词组刚好处在几级语言单位的中间,上可联系句子、篇章,下可联系词、语素,词组本位体系牢牢扣住这一点来组织汉语语法知识,总体上来看,比句本位表述语法知识要精练一些(詹卫东,2000)。语法词典将朱德熙先生创立的词组本位语法作为理论指导,这就保证了它具有丰富的语法信息和简洁的表述方式,从而保证了词典的质量。 1、3采用形式化的描述方法,全面系统地反映了汉语语法信息,使其构成一个有机的整体。 从理论上说,尽管确定符号系统的两种方法——分类法与属性描述法对于认识事物是等价的,同样可以达到给事物划分等价类的目的。但由于汉语词类至今是一个悬而未决的问题,如何运用各种标准进行具体的分类,分歧很大,加上词语的语法特征又非常复杂,不同的类有相同的语法特征,即便是属于同一类的词语,内部语法特征也并不一致,存在很大差异。要想找到一种对内具有普遍性对外具有排他性的原则,一百多年来的研究证明是不可能的。在这种情况下,如果单纯采用一般语言学著作的分类法,势必会丢失许多有用的语法信息。这样的词典既不能反映词的语法特征的全貌,也不能说明词的实际使用情况,实用性不大。语法词典采用的是分类与属性描述相结合,以属性描述为主的方法,在粗分类的基础上进行语法属性的描述,属性描述尽可能详尽。在确立语法属性项目时主要是根据计算机分析和生成汉语句子的需要,涉及了词法、句法、语义、照应几个方面的信息,几乎包括了词语在具体文本中所可能具有的全部词法信息、句法信

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档