基于动态词嵌入对齐的无监督泰语依存句法分析.pdfVIP

  • 1
  • 0
  • 约2.21万字
  • 约 7页
  • 2026-01-16 发布于江西
  • 举报

基于动态词嵌入对齐的无监督泰语依存句法分析.pdf

信息技术XINXIJISHU2023年第4期

基于动态词嵌入对齐的无监督泰语

依存句法分析

1ꎬ21ꎬ21ꎬ2

张弘弢ꎬ文永华ꎬ王剑

(1.昆明理工大学信息工程与自动化学院ꎬ昆明650500ꎻ

2.昆明理工大学ꎬ云南省人工智能重点实验室ꎬ昆明650500)

摘要:泰语的依存句法分析任务具有重要研究价值ꎮ但泰语作为低资源语言ꎬ缺乏公开可用的句

法标注训练集ꎬ难以训练有效的依存解析模型ꎮ针对这种情况ꎬ借助泰语和英语间的动态词嵌入对齐

矩阵ꎬ将在英语标注数据上训练的依存解析模型迁移到泰语中ꎬ分析无监督泰语依存句法ꎮ实验结果

表明ꎬ该方法能有效地从无标注泰语数据中提取到依存句法知识ꎮ此外该方法还支持多语言联合训

练迁移到泰语来提升泰语依存句法分析的性能ꎮ

关键词:依存句法分析ꎻ泰语ꎻ无监督ꎻ动态词嵌入对齐ꎻ迁移学习

中图分类号:TP391文献标识码:A文章编号:1009-2552(2023)04-0001-07

DOI:10.13274/j.cnki.hdzj.2023.04.001

UnsuperviseddependencyparsingofThailanguagebasedondynamicwordembeddingalignment

1ꎬ21ꎬ21ꎬ2

ZHANGHong ̄taoꎬWENYong ̄huaꎬWANGJian

(1.FacultyofInformationEngineeringandAutomationꎬKunmingUniversityofScienceandTechnologyꎬ

Kunming650500ꎬChinaꎻ2.YunnanKeyLaboratoryofArtificialIntelligenceꎬKunmingUniversityofSci ̄

enceandTechnologyꎬKunming650500ꎬChina)

Abstract:ThetaskofdependencyparsinginThaihasimportantresearchvalue.Howeverꎬasalow ̄re ̄

sourcelanguageꎬThailacksapubliclyavailabletrainingsetofsyntacticannotationsꎬmakingitdifficultto

trainaneffectivedependencyparsingmodel.Inresponsetothissituationꎬthedependencyparsingmodel

trainedonEnglishannotateddataistransferredtoThaiwiththehelpofdynamicwordembeddingalignment

matrixbetweenThaiandEnglishꎬrealizingunsupervisedThaidependencyparsinganalysis.Theexperi ̄

mentsresultsshowthatthemethodcaneffectivelyextractdependencysyntaxknowledgefromunannotated

Thaidata.InadditionꎬthemethodalsosupportsthejointtrainingofmultiplelanguagestotransfertoThai

toimprovetheperformanceofdependencyparsinginThai.

Keywords:dependencyparsingꎻThailangua

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档