摘要
摘要
近年来,预训练语言模型在自然语言处理任务中展现了卓越的性能。然而,
在实际应用中,由于训练域和测试域之间的分布偏移,模型的泛化性能常常受到
显著影响。传统的方法,如领域适配和增量学习,虽然能够通过增量训练缓解分
布偏移问题,但通常依赖带标注的数据,训练代价高且难以在动态环境中实时应
用。由于测试数据提供了额外的价值密度信息,为此,在推理提升模型鲁棒性的
研究逐渐受到人们的关注,并在提升模型泛化性,预测精准性发挥重大
摘要
摘要
近年来,预训练语言模型在自然语言处理任务中展现了卓越的性能。然而,
在实际应用中,由于训练域和测试域之间的分布偏移,模型的泛化性能常常受到
显著影响。传统的方法,如领域适配和增量学习,虽然能够通过增量训练缓解分
布偏移问题,但通常依赖带标注的数据,训练代价高且难以在动态环境中实时应
用。由于测试数据提供了额外的价值密度信息,为此,在推理提升模型鲁棒性的
研究逐渐受到人们的关注,并在提升模型泛化性,预测精准性发挥重大
文档评论(0)