汉语依存句法分析关键技术分析-analysis of key technologies of chinese dependency syntax analysis.docx

下载文档 降价啦

17
0
约13.75万字
约 136页
2018-05-26 发布于上海
举报
版权申诉
保障服务

汉语依存句法分析关键技术分析-analysis of key technologies of chinese dependency syntax analysis.docx

1、本文档共136页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

汉语依存句法分析关键技术分析-analysis of key technologies of chinese dependency syntax analysis

析联合模型中句法特征占据主导地位，导致词性特征无法贡献其消歧作用。对此，本文提出一种面向词性标注和依存句法分析联合模型的训练算法。算法分别不同的步长对词性特征和句法特征的权重进行更新。和传统的平均感知器和被动进取训练算法相比，分离被动进取训练算法可以很自然的增大词性特征的权重，从而更好的平衡联合模型中词性特征和句法特征的消歧作用。实验发现，我们的基于分离被动进取训练算法的联合模型在汉语和英语数据上都可以取得最好的词性和句法准确率。4.提出了基于准同步文法的多树库融合方法。汉语存在多个异构树库，而利用多个树库以提高依存句法分析准确率是一个非常有吸引力的课题。本文提出一种基于准同步文法的多树库融合方法，充分利用标注规范不同的多个单语树库，以提高句法分析准确率。我们设计了丰富的转换模式来刻画不同标注规范间的对应规律，然后基于这些转化模式形成准同步文法特征，从而增强基准依存句法分析模型。准同步文法特征用来指导句法模型做出更好的决策，并且可以很自然的融入到基于图的句法分析解码算法中。实验结果表明，我们的方法可以充分利用源树库的知识。从而提高句法模型在目标树库上的准确率。总之，本文针对汉语特点，深入研究了基于标点的快速高阶依存句法分析方法、词性标注和依存句法分析的联合模型和多树库融合问题，大大提高了汉语依存句法分析处理实际文本数据的效率和准确率。本研究取得了一些初步的成果。我们期待这些研究成果可以进一步推动自然语言处理领域和其他上层应用如机器翻译、信息抽取的发展。关键词：依存句法分析；柱搜索；联合模型；分离被动进取训练算法；多树库融合AbstractDependencyparsingaimstoanalyzethesyntacticstructureofagivensentence,andconvertsthewordsequenceintoatree.Adependencyconsistsoftwowords,andtheonewordmodifiestheotherone.Thelabelofthedependencyrepresentsthespecificrelationbetweenthetwowords,suchassubject,object,adverbialmodifier,andsoon.Amongdi?erentsyntaxformulizations,thedependencygrammarhasgainedmoreandmorein-terestinparsingcommunityduetoitscharacteristics:(1)representationsimplicity,(2)easytoannotate,(3)easytomakeuseof.TheinternationalconferenceofComputationalNaturalLanguageLearning(CoNLL)hasorganizedsharedtasksonmultilingualdepen-dencyparsingfrom2006to2009,whichlargelypromotestheresearchondependencyparsing.Meanwhile,dependencyparsinghasbeenmoreextensivelyappliedtomachinetranslation,questionanswering,textmining,informationretrieval,andsoon.Researchondependencyparsinghastwoimportantgoals.Onegoalistoimprovetheparsingaccuracy,whiletheotheristoimprovetheparsinge?ciency.Accurateparsingresultscanprovidereliablesyntacticstructuresforhigher-levelapplications.Alongwiththequickgrowthofthewebdata,higher-levelapplicationsneedtoprocessalargeamountofinformationinsomelimitedtime.Therefore,parsinge?ciencyisalsoimportant.Thisthesiscoversthetwoissuesandconsistsoffourparts.Weproposeafasthigh-orderdependencyparsingmethodbasedonbeamsearchandpunctuation.Thepreviouslypro