领域模型训练数据安全预防型治理的模式转型.pdfVIP

  • 0
  • 0
  • 约3.07万字
  • 约 10页
  • 2026-01-26 发布于福建
  • 举报

领域模型训练数据安全预防型治理的模式转型.pdf

王强狄小华领域模型训练数据安全预防型治理的模式转型

DOI:10.19685/11-2922/n.2025.06.008

领域模型训练数据安全预防型治理的模式转型

王强,狄小华

(南京大学法学院,南京210093)

摘要:随着预防性法治理念的深入人心,新兴技术领域预防型治理已从理论原则逐步转化为实践新范式。领域模型训练

数据是指模型使用者为实现领域模型的特定功能而使用的训练数据。领域模型的广泛应用依托于行业内具有私有、敏感

和高价值等属性训练数据的输入,这一过程不可避免地增加了领域模型训练数据安全风险。预防型治理模式能够满足领

域模型训练数据安全治理需要,但其治理措施有超限之嫌。基于此,领域模型训练数据安全预防型治理急需摆脱“严监管”

和“公权力扩张”之困局,在比例原则指导下确立“存疑从有”的治理原则,构建“数据收集利用最小化”的治理机制,运用“契

合伦理”的动态治理工具,以保障领域模型私有训练数据安全,为人工智能的稳步发展提供有力保障。

关键词:领域模型;训练数据安全:比例原则:预防型治理

中图分类号:D912文献标志码:A文章编号:2096-9783(2025)06-0081-10

一、问题的提出用现有研究将其定义为“依托生成式人工智能基础模

型,依托专业知识及专门性的使用需求,通过对基础

2025年《国务院关于深实施“人工智能+”行动模型作增加组件、精调、蒸馏、编辑等处理形成的模

的意见》指出:“到2027年,率先实现人工智能与6大型;暂不包括不通过基础模型直接基于专业知识训练

重点领域泛深度融合,新代智能终端、智能体等形成的同类模型。[6”领域模型的学习能建在海

应用普及率超70%,智能经济核心产业规模快速增量数据的基础之上,若要提高其在行业内的适用性和

长,人工智能在公共治理中的作用明显增强,人工智精准度,则需以模型预期目的为目标,精准投喂私有

能开放合作体系不断完善。[”领域模型作为种多数据,即区别于通用大模型能够获取的,具有高价值、

领域适用的新兴技术,具备在特定场景中的高效应高敏感度和具备私有属性的数据。私有数据不仅包

用、处理专用任务的技术能力以及持续学习和自主更括个人私有属性数据,还包含企业、政府、公共机构等

新的特点,成为数字经济发展的新质产[2]。当前持有的具有一定私有属性的数据,这些数据具有区别

医疗、法律、科研、公共安全等领域模型层出不穷,而于般公开数据的访问属性和安全特性。以医疗

领域模型的运用高度依赖于领域内“私有数据”的精业为例,通用人工智能训练数据并不包含医疗卫生领

准输与预训练。例如,以健康医疗数据为基础的智域临床实践数据,其预训练数据多为已公开医学资

慧医疗、以金融领域相关数据为基础的算法交易和风料,以此为基础的大模型并不“智能”,无法运用于临

险管理、以多元生物数据为基础的人工智能算法模型床实践。若想实现AI辅助诊疗,则需要在通用人工

助物领域研发等[3-4]。尽管AI模型展现出多智能的基础之上,在训练数据集中添加电子病历资

领域融合优势和惊成能,例如,OpenAI联合料、影像数据、用药方案、健康数据、疾病基因数据等

创始SamAltman发称,OpenAI每天约成临床实践数据。领域模型智能化程度取决于训练数

1000亿字的内容,[5]但其打破时空限制、持续赋能数据质量,倘若此类训练数据存在合法性、安全性等风

字经济的核心基石,始终离不开海量、高质量私有训险,这些风险将贯穿于领域模型使用的全过程,并在

练数据的持续“喂饲”。不同阶段产生不同后果,如数据收集阶段的侵权风

领域模型的含义较多,结合本的研究内容,借险、数据使用阶段的泄露风险、生成数据的违

文档评论(0)

1亿VIP精品文档

相关文档