中文CCG树库的构建.pdfVIP

  • 38
  • 0
  • 约2.52万字
  • 约 8页
  • 2015-09-29 发布于湖北
  • 举报
中文CCG树库的构建.pdf

第26卷第3期 中文信息学报 v01.26,No.3 2012年5月 INF()RMATl0N JOURNAL0FCHINESE PROCESSINGMay,2012 编者按:中国中文信息学会于2011年8月在河南洛阳召开“第十一届全国计算语言学学术会议”。 会议的程序委员会向本刊推荐了一批优秀论文,编辑部得到授权,又请专家审阅,并请作者修改,其 中的21篇在本期发表,以飨读者。 文章编号:1003一0077(2012)03一o003一06 中文CCG树库的构建 宋彦1,黄昌宁2,揭春雨1 (1.香港城市大学中文、翻译及语言学系,香港九龙达之路83号; 2.微软亚洲研究院,北京100080) 摘要:组合范畴语法CcG)是一种类型驱动的语法.可以高度词例化(1exicalized)井兼顾句法和一定程度上语叉 的表达,可为深层次的文本分析提供有效支持。将CCG应用于真实文本分析需要编制大规模的词库,为了避免为 此付出的昂贵人力和资源。一个经济有效的解决方案是利用现有短语句法树库来自动生成ccG树库。该文提出 在清华中文树库的基础上自动生成(二cG树库的方法,在预定义的中文句型和基于清华树库的动词子范畴框榘的 支持下,通过标准转换算法,得到一个包含3z737句、超过35万词次的中文CCG树库。该树库通过手工和自动评 价验证,又与已有文献所报告的多语种CCG树库构建工作比较,均证明谊文所述方法的有效性。 关键词:组合范畴语法;树库;中文句型;动词子范畴框架 中图分类号:TP39l 文献标识码:A ConstructionofChineseCCGbank s0NGYanl,HUANG changnin矿,KITchunyul of of (1.DepartmentChinese,TranslationLinguistic5,CityUniver3jtyHongKong, 83TatChee AVe.。Kowloon,HongKongSAR,China; Research 2.Microsoft 100080,China) Asia,Be幻ing a lexicalizedfomaIismwitha Grammar(Ca:)is grammar Abst甩ct:CombinatoryCategorial type.driven transpar— to entinterfacebetween and5emantics,whichisessentialto text To CoBreal syntax in-depthprocessing.apply scale1exiconneedstobeconstructedas a dealof texts,howeyer,alarge

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档