现代汉语综合型语言知识库.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现代汉语综合型语言知识库.pdf

现代汉语综合型语言知识库 北京大学 (北京大学计算语占学研究所北京100087I) 语言知识库是自然语言处理系统不可或缺的组成部分,语言知识序的规模和质苗在很 大程度上决定了自然语言处理系统的成败。这已经成为自然语言处理技术研究者和系统开 发者的共识,语言知识库的内容及其知识表达形式是多种多样的。 of 北京人学计算语言学研究所(InstituteComputationalLinguistics,ICL/PKU) 自1986年成立以来,一直在语言知识库建设这块土地上耕耘,现今有了如下一些收获: (1)现代汉语语法信息词典(GrammaticalKnowledgeBase,GKB) Semantic (2)面向汉英机器翻译的现代汉语语义词典(ChineseDictionary,cSD) (3)大规模现代汉语多级标注语料库(word—SenseTaggingCorpus,STC) (4)面向跨语言文本内容处理的中文概念词典(ChineseConceptDictionary,CCD) (5)英汉对照般语语料库(BilingualA1ignedCorpus,BAC) Term (6)多个专业领域的术语库(Multi—disciplineBank,MTB) Structure (7)现代汉语短语结构规则库(PhraseBase,PSB) Poem (8)中国古代诗词语料库(Ancient Corpus,APC) (9)服务于语言知识库建堤的各种『:具软件 在各种语言知识中,词汇知识是最基本的。ICL/PKU把词汇知识库看作是语言知识库的 主体,其中成果(1)至(4)就是在词汇语义知识库方面的积累。 成果(1)至(5)汇集的都是日常生活语言的知识,成果(6)则提供专业知识。成果 (7)描述的则是句法结构知识.含600多条扩充的上下文无戈句法规则。成果(8)利用 在现代汉语信息处理研究中积累的技术和方法开展古代诗词计算机辅助深层研究,同时进 行古代汉语和现代汉语的纵向对比研究。建造语言知识库同样需要,L具软件的辅助,成果 (9)中包含了北大计算语言所开发的一系列工具软件。 这些语言数据资源汇集的语言知识及其表述形式独立于特定的语言信息处理系统和实 现算法,这种设计理念使得使得知识库的内容便丁用户理解和运用,井得以广泛传播。这 些语言数据资源之间的相互支撑关系如图1所示。 图1语言数据资源支撑关系 .-39.. 北大计算语言所的研究成果不仅规模大、种类多。而且质量上乘,目前已经购买以上 研究成果许可使用权的有各大公司、研究所和大学,地域遍布美国、德国、法国、瑞典、 日本、韩国、新加坡、中国大陆、香港和台湾,这些单位的相关自然语言处理研究涉及的 语言除汉语外,还包括英语、日语、法语、德语、韩语(朝鲜语)、蒙占语、藏语等等。 这些知识库的规范大部分已经公开发表,并且规模相当大的样例在网上公布并鼓励自 由下载,欢迎登陆网站www.icl.Bku.edu.C11查看。 修桥铺路甘为人梯(GKB) 《现代汉语语法信息词典》(GKB)是ICL/Pl(U建设的语言知识库大厦的第一块基石, 这是一部面向语言信息处理的大型电子词典,依照语法功能和意义相结合的准则收录了8 万词语,建立了基于语法功能分布的词类体系,在分类的基础上按类详细描述每个词的各 种语法属性。其成功得益于北火中文系朱德熙、陆俭明、郭锐教授早期的合作与指导。GKB 的系统结构见图2。它以词的句法信息详实著称于学界(样例见表1)。 表1GKB总库之样例 词语 词类 同形 拼音 释史

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档