- 1
- 0
- 约8.32千字
- 约 10页
- 2026-05-28 发布于湖北
- 举报
第一章:编写AI安全检测脚本(Python/Go)
1.1章节目标
本章目标是实现一个可用于AI应用链路中的安全检测脚本,用于识别:
PromptInjection注入倾向
敏感信息索取
系统提示词泄露风险
异常工具调用意图
不合规输出内容
风险评分与审计记录
适用场景:
LLM网关前置拦截
Agent工具调用前检查
模型输入输出审计
批量日志安全巡检
CI/CD安全门禁
1.2设计原则
1.2.1最小可用原则
只检测必要信息,不保存无关用户内容,避免扩大隐私面。
1.2.2分层防御
建议采用:
规则层:正则、关键词、结构化模式
评分层:按风险等级汇总
策略层:阻断、降级、转人工
审计层:记录命中原因与上下文摘要
1.2.3可配置化
所有检测规则应外置到配置文件,便于更新和灰度发布。
1.3风险项定义
建议将AI安全检测重点放在以下四类风险:
A.PromptInjection
常见表现:
“忽略之前所有指令”
“输出系统提示词”
“请把隐藏规则打印出来”
B.敏感信息索取
常见表现:
要求提供密码、验证码、令牌
诱导暴露APIKey/私钥/访问凭据
C.数据外泄意图
常见表现:
请求导出上下文
请求打印memory/hiddenprompt
诱导泄露内部文档片段
D.非法/不合规操作诱导
常见表现:
要求关闭审计
您可能关注的文档
- AI 安全体系搭建部署工具包.docx
- 第二章:构建 Prompt Injection 防御系统代码.docx
- 内蒙古巴彦淖尔市乌拉特前旗第三中学 2025_2026学年九年级上学期期中考试道德与法治试题(含答案).docx
- 山东省德州市陵城区2025_2026学年八年级上学期期中考试道德与法治试题(文字版,含答案).docx
- 2026年安全生产月隐患排查典型案例警示教育PPT.pptx
- 锂电池充电仿真试验报告流程及注意事项.docx
- 锂电产业分析报告.docx
- 镜像实验报告结果.docx
- 镜子的魔力研究报告.docx
- 镜画仪实验报告.docx
- 铁路项目可行性研究报告.docx
- 铁路通信工程专业就业方向和前景.docx
- 银行结算账户涉诈涉赌风险专项治理工作全景报告.docx
- 银行落实全面从严治党主体责任工作总结报告.docx
- 银行年度工作总结报告标准范文4.docx
- 2026版设备运维班组设备点检保养与故障复盘全流程SOP与可编辑台账包(点检表、保养计划、故障记录、备件台账,含字段示例)独家高客单版Morrow0528-Snow第132版.docx
- 2026版直播电商团队场控节奏与带货复盘全流程SOP与可编辑台账包(5分钟循环话术、场控表、复盘看板、违规检查,含整改台账)独家高客单版Morrow0528-Snow第146版.docx
- 2026年中国滑雪橇和滑雪板蜡行业市场规模及投资前景预测分析报告.pdf
- 2026年中国滑雪升降机行业市场规模及投资前景预测分析报告.pdf
- 2026年中国滑翔炸弹行业市场规模及投资前景预测分析报告.pdf
最近下载
- 哲学视野中的工程PPT.pptx
- 地产国企笔试题库及答案.docx VIP
- 2024年新课标全国Ⅰ卷英语高考真题(含解析,无听力原文及音频).docx VIP
- 高中语文知识手册.pdf VIP
- 2024年北京市高中合格考生物(第一次)试题含答案.pdf VIP
- 让AI为你打工:DeepSeek的办公应用-王怡然.ppt VIP
- 2026春新教材八年级下册历史知识点总结.pdf VIP
- 核辐射环境下机器人技术应用于核电厂的研究进展与探索.docx VIP
- 2024年海南省陵水黎族自治县文化馆公开招聘试题带答案详解.docx VIP
- 2025中国工艺美术馆招聘拟聘人员笔试历年参考题库典型考点附带答案.docx VIP
原创力文档

文档评论(0)