- 1、本文档共136页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉语依存句法分析关键技术分析-analysis of key technologies of chinese dependency syntax analysis
析联合模型中句法特征占据主导地位,导致词性特征无法贡献其消歧作用。对此,本文提出一种面向词性标注和依存句法分析联合模型的训练算法。算法分别不同的步长对词性特征和句法特征的权重进行更新。和传统的平均感知器和被动进取训练算法相比,分离被动进取训练算法可以很自然的增大词性特征的权重,从而更好的平衡联合模型中词性特征和句法特征的消歧作用。实验发现,我们的基于分离被动进取训练算法的联合模型在汉语和英语数据上都可以取得最好的词性和句法准确率。4.提出了基于准同步文法的多树库融合方法。汉语存在多个异构树库,而利用多个树库以提高依存句法分析准确率是一个非常有吸引力的课题。本文提出一种基于准同步文法的多树库融合方法,充分利用标注规范不同的多个单语树库,以提高句法分析准确率。我们设计了丰富的转换模式来刻画不同标注规范间的对应规律,然后基于这些转化模式形成准同步文法特征,从而增强基准依存句法分析模型。准同步文法特征用来指导句法模型做出更好的决策,并且可以很自然的融入到基于图的句法分析解码算法中。实验结果表明,我们的方法可以充分利用源树库的知识。从而提高句法模型在目标树库上的准确率。总之,本文针对汉语特点,深入研究了基于标点的快速高阶依存句法分析方法、词性标注和依存句法分析的联合模型和多树库融合问题,大大提高了汉语依存句法分析处理实际文本数据的效率和准确率。本研究取得了一些初步的成果。我们期待这些研究成果可以进一步推动自然语言处理领域和其他上层应用如机器翻译、信息抽取的发展。关键词:依存句法分析;柱搜索;联合模型;分离被动进取训练算法;多树库融合AbstractDependencyparsingaimstoanalyzethesyntacticstructureofagivensentence,andconvertsthewordsequenceintoatree.Adependencyconsistsoftwowords,andtheonewordmodifiestheotherone.Thelabelofthedependencyrepresentsthespecificrelationbetweenthetwowords,suchassubject,object,adverbialmodifier,andsoon.Amongdi?erentsyntaxformulizations,thedependencygrammarhasgainedmoreandmorein-terestinparsingcommunityduetoitscharacteristics:(1)representationsimplicity,(2)easytoannotate,(3)easytomakeuseof.TheinternationalconferenceofComputationalNaturalLanguageLearning(CoNLL)hasorganizedsharedtasksonmultilingualdepen-dencyparsingfrom2006to2009,whichlargelypromotestheresearchondependencyparsing.Meanwhile,dependencyparsinghasbeenmoreextensivelyappliedtomachinetranslation,questionanswering,textmining,informationretrieval,andsoon.Researchondependencyparsinghastwoimportantgoals.Onegoalistoimprovetheparsingaccuracy,whiletheotheristoimprovetheparsinge?ciency.Accurateparsingresultscanprovidereliablesyntacticstructuresforhigher-levelapplications.Alongwiththequickgrowthofthewebdata,higher-levelapplicationsneedtoprocessalargeamountofinformationinsomelimitedtime.Therefore,parsinge?ciencyisalsoimportant.Thisthesiscoversthetwoissuesandconsistsoffourparts.Weproposeafasthigh-orderdependencyparsingmethodbasedonbeamsearchandpunctuation.Thepreviouslypro
您可能关注的文档
- 汉推背景下俄罗斯乌拉尔联邦大学的对外武术教学分析-analysis of foreign wushu teaching in wulaer federal university of russia under the background of han tui.docx
- 汉坦病毒嵌合基因g1s0.7 g2s0.7重组腺病毒的改建 表达及其免疫学特性的比较研究-comparative study on the reconstructed expression and immunological characteristics of recombinant adenovirus g1s0.7 g2s0.7 of hantavirus chimeric gene.docx
- 汉推背景下俄罗斯乌拉尔联邦大学的对外武术教学研究-research on foreign wushu teaching in wulaer federal university of russia under the background of han tui.docx
- 汉维文化差异及翻译策略分析-analysis of cultural differences between chinese and uygur and translation strategies.docx
- 汉魏六朝女性作家作品分析-analysis of female writers' works in han, wei and six dynasties.docx
- 汉魏乐器发展分析-analysis on the development of musical instruments in han and wei dynasties.docx
- 汉魏之际士人精神状态分析-analysis of intellectuals' mental state in han and wei dynasties.docx
- 汉文古籍标准化元数据转换分析与应用-analysis and application of metadata conversion in chinese ancient books standardization.docx
- 汉译英过程中逻辑连接的转化——以《微风入林》的英译为例-the transformation of logical connection in chinese - english translation —— taking the english translation of breeze into forest as an example.docx
- 汉译英作为新cet语法结构测试题型的效度分析-validity analysis of chinese - english translation as a new cet grammatical structure test item.docx
最近下载
- 年会语言类节目搞笑朗诵《我爱上班》表演.pptx
- 《马克思主义基本原理概论》教案12 资本主义的本质及规律.doc VIP
- 55种语言汉译译音表-世界人名翻译大辞典.pdf
- 我们的母亲叫中国:.pptx VIP
- 1.6+隋唐时期的中外文化交流++课件++2024-2025学年统编版七年级历史下册+.pptx VIP
- 水稻绿色高产高效创建服务 投标方案(技术方案).docx
- 医用氧自检检查记录表.pdf
- 2024辽宁沈阳市文体旅产业发展集团有限公司中层岗位招聘5人笔试备考试题及答案解析.docx
- 《国际经济法学》(第二版)课后思考题答案.pdf
- 55个单病种(术种)管理指标质量控制标准(第二部分).xlsx
文档评论(0)