- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
网络欺凌检测通过激进增强提示
AishaSaeid,AnuSabu,GirishA.Koushik
FerranteNeriDipteshKanojia
NICEResearchGroupInstituteforPeople-CentredAI,
SchoolofComputerScienceElectronicEngineering,
UniversityofSurrey,UK
{a.saeid,as05318,g.koushik,f.neri,d.kanojia}@surrey.ac.uk
Abstract文化界限的表达成为可能。然而,这些平
台也成为了诸如网络欺凌和在线骚扰等有
检测社交媒体上的网络欺凌仍然是一个关键挑
害行为的热点地区(HindujaandPatchin,
战,因为其表达方式微妙且多样。本研究调查
本2010;Kowalskietal.,2014)。特别是网络欺
了将攻击行为检测作为统一训练框架中的辅助
译任务是否能够提升大型语言模型(LLMs)在凌,由于其对受害者心理和情感上的深刻
中网络欺凌检测方面的泛化能力和性能。使用指影响而成为一个紧迫的问题(Wangetal.,
1令调优的LLM在五个攻击数据集和一个网络2019)。与传统欺凌不同的是,后者可能
v
0欺凌数据集上进行了实验。我们评估了多种策局限于特定时间和地点,网络欺凌受害者
6略:零样本、少样本、独立LoRA微调以及多则可以在多个数字平台上不受限制地受
3
6任务学习(MTL)。鉴于MTL结果不一致,我到攻击,这对年轻成人人口产生了重大影
0.们提出了一种丰富提示流水线的方法,在这种
8响(Slonjeetal.,2013)。
0方法中,将攻击预测嵌入到网络欺凌检测提示
5中以提供上下文增强。初步结果显示,丰富提
2检测网络欺凌颇具挑战性,因为其语
:示流水线始终优于标准的LoRA微调,表明基
v言复杂多变,从明显的攻击到微妙的、带
i于攻击信息的上下文显著提升了网络欺凌检测
x能力。本研究强调了辅助任务(如攻击行为检有被动攻击性的表达都有,这些往往逃过
r
a测)提升LLM在社交网络关键安全应用中的了常规监管系统对其隐含针对性含义的
泛化潜力。捕捉~(Xuetal.,2012)。传统的基于关
关键词:网络欺凌检测,攻击性言论检测,大型语键词和规则驱动的检测方法难以适应社交
言模型(LLMs),多任务学习(MTL),上下文提媒体中不断演变的俚语和隐藏的信息模式
示,参数高效微调(LoRA),在线骚扰,社交媒体~(Waseemetal.,2017)。大型语言模型
安全(LLMs)方面的最新进展,如Gemma系
您可能关注的文档
- 偏斜引起的插入损耗偏差(SILD)和 FOM_SILD:量化高速通道中 P/N 偏斜效应的指标.pdf
- 基于精细调整的自监督模型的脑网络分析在脑疾病诊断中的应用.pdf
- 通过输入驱动的显著性适应启用设备端医疗 AI 助手.pdf
- 面向可扩展的 SOAP 笔记生成:一种弱监督多模态框架.pdf
- 天气编辑:使用 4D 高斯场进行可控天气编辑.pdf
- ArXivBench:在哪些情况下你应该避免使用 ChatGPT 进行学术写作.pdf
- 面向通过梯度告知贝叶斯神经网络实现可扩展的贝叶斯优化.pdf
- 深度学习方法在电池生产线上检测热失控事件.pdf
- 利用生存分析预测工业喷头的寿命.pdf
- 从嘈杂的有序疾病进展标签中学习疾病状态.pdf
- 在 Telegram 上的表情反应通常反映社会认同而非情感共鸣.pdf
- AntiCheatPT: 一种基于 Transformer 的竞技类电脑游戏作弊检测方法.pdf
- 街道视图社会性:跨越 15 个城市的城市社会行为可解释分析.pdf
- EmoAugNet: 一种信号增强的混合 CNN-LSTM 框架用于语音情感识别.pdf
- 大语言模型推理效率的 KV 缓存压缩综述.pdf
- 通过产品-流程-资源资产知识图缓解柔性生产中的不良状况.pdf
- XAG-Net: 跨切片注意力与跳过门控网络用于 2.5D 股骨 MRI 分割.pdf
- 多组学分析通过展开图平滑先验进行癌症亚型推断.pdf
- 深度抖动:透过深度看见真相.pdf
- 可解释的通过解剖学感知多重实例学习的类风湿性关节炎评分.pdf
最近下载
- 2024-2025学年全国中学生天文知识竞赛考试题库(含答案).pdf VIP
- 安全给药管理制度.pptx VIP
- 安全防护措施费用投入计划.pdf VIP
- 2026江苏辖区农村商业银行紫金农村商业银行校园招聘60人笔试备考试题及答案解析.docx VIP
- 一例脑卒中气管切开合并吞咽障碍患者护理个案汇报.pptx VIP
- 2026江苏辖区农村商业银行紫金农村商业银行校园招聘60人笔试参考题库附答案解析.docx VIP
- 2026江苏辖区农村商业银行紫金农村商业银行校园招聘60人笔试备考题库及答案解析.docx VIP
- 2026年度江苏辖区农村商业银行紫金农村商业银行校园招聘60人笔试参考题库附答案解析.docx VIP
- TCWEA25-2024 水利水电工程设备监理规范.pdf VIP
- 2026江苏辖区农村商业银行紫金农村商业银行校园招聘60人笔试模拟试题及答案解析.docx VIP
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)