- 1
- 0
- 约4.04万字
- 约 12页
- 2025-08-01 发布于北京
- 举报
Aya-23使用哪种语言?多语言如何影响内部语言表示
1,1,22
KatharinaTrinley,ToshikiNakai,TatianaAnikina,TanjaBaeumel
1SaarlandUniversity
2GermanResearchCenterforArtificialIntelligence(DFKI)
{katr00001,tona00002}@stud.uni-saarland.de
Abstract多语言模型在中间处理过程中通常默认
使用英语,正如多语言工作流(MWork)假设
大型语言模型(LLMs)在多语言任务中表
现出色,但其内部语言处理机制仍不为人(Zhaoetal.,2024)所描述的那样,这表明LLMs
所理解。我们分析了仅解码器的LLM——将非英语输入内部转换为英语后再生成输出。
Aya-23-8B,在处理代码混合、完形填空和支持这一点的是对推理语言模型(RLMs)
翻译任务时与主要单语模型如Llama3和(Wangetal.,2025)的研究发现,即使在其他输
本Chinese-LLaMA-2相比的表现。通过使用入语言中也依赖于内部的“枢轴”语言或脚本。
译logit镜头和神经元专业化分析,我们发现:然而,这种偏好是否仅限于RLMs还是所有多
中(1)Aya-23在翻译过程中激活了类型相关的语言LLMs中的普遍模式尚不清楚。因此,我
1语言表示,不同于以英语为中心的模型依
v赖单一中介语言;(2)代码混合神经元激活们问:
9
7模式随混合率变化,并且受基础语言的影
2响大于混合进来的语言;以及(3)Aya-23针H1:平衡的多语言模型如何处理翻译任务——它们是
0否会同时激活多种语言,而不像以英语为中心的模型
2对代码混合输入的语言特异性神经元集中那样依赖单一的中介语言?
.
7在最终层,这与之前对仅解码器模型的研
0究结果不同。进一步的神经元重叠分析显神经元级别的分析已经识别出特定于语言
5
2示,书写系统的相似性和类型学关系影响的模式(Kojimaetal.,2024;Tangetal.,2024),但
:
v了跨模型类型的处理方式。这些发现揭示这些研究主要考察以英语为基础的模型,因此
i
x了多语言训练如何塑造LLM内部结构,并尚不清楚多语种训练是否会导致根本不同的内
r
a为未来的跨语言转移研究提供了信息。
部处理机制。虽然大语言模型的语言能力与特
1介绍定的神经元子集有关,特别是在早期和晚期层
(Kojimaetal.,2024;Tangetal.,2024)中,但在
您可能关注的文档
- WBHT:一种用于检测骨干网中黑洞异常的生成式注意力架构-计算机科学-生成式人工智能-异常检测-自注意力.pdf
- 准悖论联接:本应运动却不动的联接-计算机科学-机器学习-算法.pdf
- 通过注意力进行聚类:利用预先拟合的变换器进行数据划分-计算机科学-机器学习-数据挖掘-模式识别.pdf
- 联合光纤和自由空间光基础设施规划用于混合集成接入和回传网络-计算机科学-机器学习-拓扑优化-网络规划-6G.pdf
- DYNARTmo:一种用于可视化语音运动模式的动态发音模型-计算机科学-人工智能-语音发音.pdf
- 数据高效的预测增强校准通过交叉验证-计算机科学-风险控制预测集-预测驱动推理-交叉验证-室内定位.pdf
- 循环代数证明证书-计算机科学-机器学习-算法.pdf
- 最小最大平均循环权重问题-计算机科学-机器学习-算法.pdf
- 2025至2030中国负载测试工具行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030中国钨(VI)氟化物气体市场竞争格局及未来需求趋势分析报告.docx
- 2025至2030酒店产业政府现状供需分析及市场深度研究发展前景及规划可行性分析报告.docx
- 2025-2030中国笔记本电脑和平板电脑行业市场现状供需分析及投资评估规划分析研究报告.docx
- 2025-2030中国安乃近行业运行形势及竞争策略分析研究报告.docx
- 2025至2030中国医用显示器行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030中国飞机加油行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030中国电机启动器行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030中国帮助创作工具(HAT)软件行业深度研究及发展前景投资评估分析.docx
- 2025至2030增益均衡器行业市场占有率及投资前景评估规划报告.docx
- 2025至2030红茶行业市场风险投资及运作模式与投融资报告.docx
- 2025至2030中国变频功率计行业调研及市场前景预测评估报告.docx
原创力文档

文档评论(0)