软件工程论文:基于图文信息增强的汉-越伪平行句对抽取方法探讨.docxVIP

  • 5
  • 0
  • 约5.79千字
  • 约 13页
  • 2021-11-12 发布于江苏
  • 举报

软件工程论文:基于图文信息增强的汉-越伪平行句对抽取方法探讨.docx

软件工程论文:基于图文信息增强的汉-越伪平行句对抽取方法探讨 本文是一篇软件工程论文,本文首先利用 Scrapy 爬虫从互联网上获取了大量的汉-越双语可比语料,同时分析维基百科页面的结构特点,结合页面概念链接关系提取基于维基百科的汉-越双语可比语料;分析新闻事件特点,利用维基百科可比语料为桥梁,结合新闻事件要素关联及维基百科可比语料,研究跨汉-越双语文本相似度计算方法,研究跨语言新闻事件相关性分析方法,并对数据进行筛选,构建了大量的汉-越双语文本可比语料库。 第一章 绪论 1.1 选题背景及意义 越南与我国毗邻,在国家“一带一路”战略下,越南与我国的交流合作越来越密切,机器翻译也

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档