生成式人工智能的数据安全风险及其应对策略.pdfVIP

下载本文档

2
0
约6.35千字
约 3页
2024-11-17 发布于福建
举报
版权申诉

生成式人工智能的数据安全风险及其应对策略.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

科技论坛

生成式人工智能的数据安全风险及其应对策略

郑士芹

【摘要】

本文深入探讨了生成式人工智能（AI）在数据安全方面的挑战和应对策略。分析了数据隐私泄露、数据篡

改和模型操纵、自动化攻击以及模型逆向工程等主要风险，并提出了相应的安全措施，包括加强数据加密和匿名化处理、

持续的安全监测和评估、数据和模型的访问控制、使用安全训练技术以及遵循法律和伦理指导原则。通过案例“HealthAI”，

本文具体演示了这些策略在实际应用中的效果。

【关键词】

生成式人工智能；数据安全；隐私保护

引言其中，表示生成数据和原始敏感数据之间的余弦

随着人工智能（AI）技术的迅猛发展，生成式AI已成为相似度。

该领域的一个重要分支。这类技术，尤其是生成对抗网络为了更具体地分析隐私泄露风险，我们以某医疗数据集

（GANs）和其他深度学习模型，已在多个领域显示出其强为例。数据集包含患者的年龄、体重、血压和胆固醇水平等

大的能力，从图像和语音生成到数据增强和模式识别[1]。然信息，见图1。

而，随着其应用的广泛化，数据安全和隐私保护成为不容忽

视的挑战。这些挑战不仅涉及个人隐私泄露和数据滥用，还

包括对AI系统本身的安全威胁，如模型操纵和逆向工程。

一、生成式人工智能的数据安全风险

（一）数据隐私泄露风险

生成式人工智能（如GANs,GenerativeAdversarial图1患者年龄体重信息

Networks）在训练过程中需要大量的数据，这些数据通常包观察原始数据，年龄范围20-79岁，平均48.6岁，体重

含敏感信息。由于生成模型的目的是学习并模仿数据分布，50-99千克，平均73.3千克。训练生成式模型学习年龄体重

存在数据隐私泄露的风险[2]。生成式模型，如GANs，由生成分布，使其能生成相似新数据。分析生成的模拟数据，关注

器（G）和判别器（D）组成。生成器尝试生成逼真数据，特定健康状况模式。若存在，表明模型捕捉到敏感信息，有

而判别器的任务是区分真实数据和生成的数据。训练过程隐私泄露风险。应用生成式AI系统需要额外安全措施保护隐

中，生成器逐渐学习数据集的分布特征。这一过程中，如果私。

处理不当，敏感信息可能会被模型学习，从而在生成的数据通过观察生成的数据及其分布，如图2：

中被泄露。

数据集和对应的敏感特征集的生成式模型目标可用公式

表示：

其中，G（z）是生成器产生的数据，而D（x）是判别

器的输出，表示x是真实数据的概率。

度量隐私泄露的一种方法是计算生成数据与原始敏感数图2对比分析

据之间的相似度。使用余弦相似度作为度量标准：图2显示，模型有效学习了年龄和体重特征，能捕捉相

关敏感信息。

（二）数据篡改和模型操纵

作者简介：郑士芹，北京信息职业技术学院，副教授。

CEMAGAZINEPAGE28

科技论坛

数据篡改指的是在数据输入、传输或存储过程中，未二、数据安全应对策略

经授权修改数据内容。在生成式模型中，如果输入数据被篡（一）加强数据加密和匿名化处理

改，模型生成的结果可能会产生严重偏差[3]。在GAN中，篡1.数据加密

改的数据可能导致生成器产生错误或有偏见的输出。数据加密是将数据转换成另一种形式或代码，以便只有

考虑GAN模型：

您可能关注的文档

文档评论（0）

乡村振兴、双碳、储能、绿色金融 + 关注: 实名认证

服务提供商

新能源知识科普（本账号发布文档均来源于互联网公开资料，仅用于技术分享交流，相关版权为原作者所有。如果侵犯了您的相关权利，请提出指正，我们将立即删除相关资料）。

咨询作者（20人已咨询）已休息

1亿VIP精品文档

更多 >

生成式人工智能的数据安全风险及其应对策略.pdfVIP