- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于依存语法的语料库标注研究
陈 波
摘要:依存关系的标注一直是近年来计算语言学界语言资源建设的的主流之一。本文从理论研究和实践研
究两大方面对国内外依存语法标注的进展做了一个大致梳理,针对汉语依存语法标注的研究现状,提出了一
些建议。
关键词:依存语法;标注;生成;投射
On w.th Relations
LabeIjngC0rpusDependency
ChenBo
centerfor of
Studyh:ngIlage皿d曲珊ad仰,Ⅵ,uhanUniverS“y,Wuhan,430072
of
D。paftment
is
with reladononeof也e researcbes0f resource
corpus
AbStract:L曲elingdependency p叩ular laⅡguage
coIlstnIcⅡonin of
compuⅢi0Ⅱal paperexplores也edeVebp硼eⅡt corplJsusiIlg
nnguist迦.The labeⅡng
relations丘omtwo someadVices research f【ltLlrewofkfor
regardiⅡg也e statIlsand ChineSe
4spects,then,pr0Vides
labeling relations.
usingdependency
Keywords:DependencyG瑚AmaI:L曲elin备Gen哪60n:PTojectio丑
大规模的语料库建设是近年来自然语言处理的主要任务之一。语料库的标注一般分为四个阶段:语法标
注一句法标注一语义标注一话语标注。到目前为止,语法标注(即词性标注)的工作已经基本解决,第二阶
段句法标注工作也基本完成,而第三阶段语义标注则成为瓶颈。然而如果不能解决语义标注问题,就无法实
s仃uctu∞)、如何
现句子的语义理解、机器翻译等难题。如何能够直接抽取谓词论元结构(predicate.argument
辨别句子中的成分充当什么样的语义角色(Semantic
r01e)?学者们开始重新考虑依存语法,主要基于以下3
个原因:①依存语法中不含有非终极符结点,层次较浅,依存树可以直接映射到谓词论元结构。可以利用依
存树便于抽取动词句式;也易于表示句子的语义结构。②依存语法不用考虑词序。对于词序比较自由的语言
而言,特别适合运用依存语法进行语言分析。③中心词驱动。在句法分析中,依存的概念(如一个短语的中
心词和语法关系的表达)是普遍存在的。在依存树中可以直观地反映出句子的核心成分。
因此,近年来无论国际上还是国内,都在尝试运用基于依存语法的方法来对语料库进行标注:对于已经
用短语语法标注过的语料库,就尝试进行由短语结构树向依存结构树的转换工作。迄今为止,国内外对依存
语法标注的研究,如相关的理论建构、算法的设计、模型的建构等方面,有了很大的进展。
·286·
1 依存语法标注研究在国外
国外的研究状况整体来说就是“研究深入、方法多样、不断创新”。在运用依存语法进行语言分析方面
的做了大量工作,在标注方面尝试了很多种方法,建构了很多模型,并针对这些模型还提出了相应的评估方
法。
的Mrr理论(th
文档评论(0)