变压器模型在社交机器人检测中的比较分析.pdfVIP

  • 2
  • 0
  • 约1.56万字
  • 约 13页
  • 2026-02-27 发布于北京
  • 举报

变压器模型在社交机器人检测中的比较分析.pdf

变压器模型在社交机器人检测中的比较分析

RohanVeitandMichaelLones

DepartmentofComputerScience,Heriot-WattUniversity,Edinburgh,UK

rv2009@hw.ac.uk,m.lones@hw.ac.uk

摘要社交媒体已成为当今社会的关键交流媒介。这一认识促使许多方面

雇佣人工用户(或机器人)误导他人相信不实之词或采取对他们有利的行

为。先进的文本生成工具,如大型语言模型,进一步加剧了这个问题。本文

本旨在比较基于编码器和解码器转换器的机器检测模型的有效性。开发了管

译道来评估这些分类器的性能,结果表明基于编码器的分类器表现出更高的

准确性和鲁棒性。然而,基于解码器的模型通过任务特定对齐显示出更大

中的适应能力,暗示在不同应用场景中具有更多的泛化潜力以及更优越的表

1现。这些发现有助于防止数字环境被操纵的同时保护在线讨论的完整性。

v

6

3Keywords:机器人检测,变换器,机器学习

9

4

1

.1介绍

9

0

5随着互联网的发展,其上的服务也随之演变;曾经无害的平台如社交媒

2

:体已从与朋友联系和自我表达的机会转变为一种向大众传播可信度参差不

v

i齐的信息的工具,塑造公众信念甚至影响现实世界事件[2]。像X和Facebook

x

r这样的网站使个人、组织或政府能够以前所未有的范围进行沟通。这一因素

a

巩固了社交媒体作为当今叙事形成支柱的地位,它们对人际交流有着“深远

的影响”[18]。

社交媒体的影响尤其体现在其放大叙事的能力上。展示极化和煽动性观

点的帖子会受到算法的推广,这些算法更倾向于关注互动而非展示中立信息

的有见地的文章。一个这样的例子是COVID-19大流行,其间社交媒体助

长了误导性信息的传播,导致疫苗拒绝和口罩抵制[8]。因此,很明显必须

采取措施防止虚假信息污染数字空间;识别虚假用户是这一过程的重要组成

部分。

一个“机器人”是平台上的一个虚拟用户,它表现得像真实用户一样。

当它们首次出现时,由于广播信息的重复性,通常很容易被检测到,这意味

2Veitetal.

着可以使用基于规则的方法(如内容阈值,比如重复消息限制[20])来消除

它们。然而,现代机器人已经进化到利用先进的自然语言处理工具,例如大

型语言模型,使它们能够更好地融入真实用户中并规避现有的检测措施[7]。

在这项研究中,将在不同的测试案例下评估多种机器人检测管道,以分

析它们的优点、缺点和理想应用。

2背景

本节将简要提供社交媒体中机器人检测的基础背景以及将在本研究中

调查的相关技术。它将涵盖所选案例研究的合理性,并评估最近相关研究及

其不足之处,以突出应进行调查的研究空白。这些组成部分将为section3中

详细描述的方法奠定基础。

2.1机器人

在[12]中,社交媒体机器人被定义为一种计算机算法,能够生成内容并

与用户互动。虽然这本身并不具有恶意(通过现已不存在的账户提醒我推

文证明,该账户允许用户在

文档评论(0)

1亿VIP精品文档

相关文档