“现代汉语语义词典”的结构及应用.docVIP

“现代汉语语义词典”的结构及应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2006年2月 第1期语言文字应用AppliedLinguisticsFeb.,2006No.1“现代汉语语义词典”的结构及应用 王 惠 詹卫东 俞士汶1223 (1.新加坡国立大学中文系 新加坡 117570;2.北京大学 北京 100871)   [摘要“]现代汉语语义词典(SKCC)”是一个面向汉英机器翻译的大规模汉语语义知识库,它以数据库文件形式收录616万余实词,不仅给出每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的各种语义搭配限制语义自动分析、。、内容,[关键词];;;[]100325397(2006)0120134208 StructureandApplicationof TheSemanticKnowledge2baseofModernChinese WangHui,ZhanWeidong,YuShiwen Abstract:TheSemanticKnowledge2baseofModernChinese(SKMC)isalargescale bilingualsemanticresource.Itprovidesalargeamountofsemanticinformationsuchassemantichierarchyandcollocationfeaturesfor66539ChinesewordsandtheirEnglishcounterparts.ItsPOSandsemanticclassificationrepresentthelatestprogressinChineselanguageengineering.Thedescriptionsofsemanticattributesarefairlythoroughandcomprehensive.ThemainworkinthispaperistointroducetheoutlineofSKMC,andestablishamulti2levelWordSenseDisambiguation(WSD)modelbasedonit.TheresultsindicatethattheSKMCiseffectiveforwordsensedisambiguationinChineseandarelikelytobeimportantforgeneralChineseNaturalLanguageProcessing(NLP). Keywords:SemanticKnowledge2base;WSD;Lexicalsemantics;NLP;Chinese [收稿日期]2003-10-20 [作者简介]王惠,新加坡国立大学助教,博士,主要研究汉语词汇学、语义学和计算语言学;詹卫东,北京大学副教授,博士,主要研究汉语语法、语义和计算语言学;俞士汶,北京大学教授,主要研究计算语言学。 3本研究得到国家973重点基础研究项目(G199803050724)和(G199803050721)资助,研究还得到北京大学陆俭明教授的大力支持,在此一并致谢。 2006年第1期王 惠等“:现代汉语语义词典”的结构及应用1    35 一 前 言 在机器翻译系统及其他自然语言处理系统中,通常都有一部包括语义信息的电子词典。 为了给计算机自动分析提供更全面、深入的语义信息,我们应充分吸收现有的研究成果,在语法知识库的基础上构建语义知识库。不仅要进行系统的语义分类,而且要对词义组合信息加以全面描述,进一步加强动态的语义组合知识的研究和总结,建立一个与语言工程应用紧密配合的、合理的语义知识描述框架。 北京大学与中科院计算所自1994年联合开发“汉英机器翻译模型系统”开始,就着手研制为汉英机器翻译服务的“现代汉语语义词典”,目的是在语法分析的基础上,为计算机提供更深入的语义信息。1996年至1998年,双方共同承担了国家863高科技项目“通用机器翻译开发平台和汉英机器翻译系统”课题(项目编号:863230620320622)。作为该课题的一个重要组成部分“,现代汉语语义词典”进入到大规模开发阶段,并取得了重要的阶段性成果,完成419万名词、动词、形容词的语义分类,并在配价理论的基础上,简要描述了其语义搭配限制(王惠等,1998)。从2001年开始“,现代汉语语义词典”973目的支持,二 (1  词时间词处所词方位词代 词动 词形容词区别词状态词副 词数 词总 库 3752256718520423621142382775399799710966539 属性字段 15151515151615151511118 “66539个通用采用Foxpro810实现,共有12个数据库,其中包含全部词语的总库1个,每类词语各建一库,计11个。每个库文件都详细刻画了词语及

文档评论(0)

3344483cc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档