基于多任务学习的跨语言句子嵌入研究
摘要
跨语言句子嵌入学习的目标是将句子映射到一个共享表示空间中,使得语义相近的
句子表征更接近,而对于语义不同的句子表征要有明显区分度。目前,跨语言句子嵌入
研究有多种方法:其一,使用线性变换方法,通常该方法会选择一种语言嵌入空间作为
基准,然后将其他语言嵌入空间通过正交变换方法转换到该基准语言表示嵌入空间中,
以此来实现跨语言句子在词义和语义上的对齐。但是这种方法实现跨语言句子嵌入学习
的扩展性不好且严重依赖于语料资源;其二,使用预训练语言模型BERT对句子编码表
示,但研究表明这种方法得到的句子向量空间存在各向异性问题,即学习到的词嵌入在
向量空间中呈现一个锥形空间,这样引起表示退化问题。因为高频词会在锥形空间下方,
分布较为密集且整体更靠近原点,而低频词分布在锥形空间上方分布较为稀疏且整体分
布距离原点更远。由此受语料中词频和各向异性两大因素影响导致表示上下文句向量语
义不准确问题。
鉴于上述问题,本文在已有预训练语言模型基础上,使用语言无关的句子编码器
LaBSE对句子进行编码,结合泛化性更好的多任务学习方法,提出了两种句子表示模型
——MT-LaBSE和M
您可能关注的文档
最近下载
- 湖北十堰市2026届高三年级元月调研考试一模英语试题.docx VIP
- 2025-2030中国气凝胶行业未来前景展望及发展趋势洞悉研究报告.docx VIP
- 7-主要潜力测评工具与学习敏锐度报告.pdf VIP
- 增值税法及实施条例对照解读-2026.pdf VIP
- 2026年“十五五”规划建议时政考题300题及答案.pdf VIP
- 企业人力资源招聘与配置手册(标准版).docx VIP
- 新建年产3000万块环保砖建设项目环境影响报告表.doc VIP
- 食品安全管理师抗压考核试卷及答案.docx VIP
- 2025年美国注册管理会计师存货领用与发出的授权与记录控制专题试卷及解析.pdf VIP
- 沃斯温克VOSWINKEL-快速接头2019卡普灵中文样本.pdf VIP
原创力文档

文档评论(0)