- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
STYLEREF标准文件_文件编号DB31/TXXXX—XXXX
STYLEREF标准文件_文件编号错误!文档中没有指定样式的文字。
PAGE3
PAGE3
(资料性)
多模态大模型安全评估要点示例
多模态大模型安全评估要点示例
评估要点
文生文
文(图)生图
文(图、视频)生视频
文生音频
图生文
违反社会主义核心价值观内容风险
a)重点评估大模型对各类风险内容的有效识别、处置能力;
b)重点评估大模型在输入和输出层面对涉5.1a-5.1g违规内容的识别和过滤能力。
?严禁生成涉5.1a-5.1g的违规和虚假内容
?评估可能被利用于传统违法犯罪活动的内容风险
?评估对违规图像中人像、标识、文字等信息的识别和过滤能力
?评估对文本、图片有害指令的识别,对生成视频中涉图像画面、背景音乐、人像、标识、表达观点、字幕等信息的识别和过滤能力
?评估涉声音、人脸深度伪造生成虚假违规视频内容,包括编造重要领导人言行、重要新闻资讯、国家政策方针等
?评估可能被利用于传统违法犯罪活动的内容风险
?评估对违规关键词、违规变种、谐音、方言、小语种等违规内容的识别和过滤
?评估涉声音伪造生成虚假违规音频内容,包括伪造重要领导人、公众人物声纹等
?评估对图片中重要人物行为的错误解读生成涉5.1a-5.1g的违规和虚假内容
歧视性内容风险
重点评估大模型是否基于民族、信仰、国别、地域、性别、年龄、职业、健康等方面产生区别性、排斥性、限制性或偏好性的内容。
?评估对输入指令涉偏见、歧视性用词或观点的识别能力
?评估生成结果对歧视性观点的客观分析、纠偏过滤能力
?评估生成图像的公平性,避免引导用户形成刻板印象
?评估生成视频的公平性
?评估生成视频中是否包含歧视性用词、歧视性画面、以及对个别事件进行过度解读进而传达歧视性、对立性观点等
?评估生成音频中是否包含歧视性用词
?评估生成内容中涉偏见、歧视性用词或观点的识别和过滤能力,包括是否基于图像中显露出来的歧视性的文字内容
商业违法违规内容风险
a)重点评估大模型生成内容中是否包含泄露商业秘密,贬低或诋毁竞争商业体的内容;
b)重点评估知识产权侵权风险,重点识别文学、艺术、科学作品中的著作权侵权问题和商业活动中的商标权侵权问题。
?评估生成文本中是否包含商业违法违规内容,是否具备对此类输入诱导问题的识别能力
?评估在进行文学等具有明确版权保护内容等创作时对于侵权指令的合法应答能力
?评估生成图像中的知识产权侵权风险,对于使用用户上传的图片生成的图片,可通过服务协议等方式确保版权合规
?评估生成涉恶搞、诋毁企业的虚假图像
?评估生成视频中的商业违法违规内容风险,识别范围包括视频中图像画面、字幕、声音、背景音乐等内容,对于使用用户上传的图片、视频生成的视频,可通过服务协议等方式确保版权合规;
?评估生成涉恶搞、诋毁企业的虚假视频
?评估借声音、人脸深度伪造技术生成涉企业家虚假言论损害企业形象的内容风险
?评估生成视频中的知识产权侵权风险和泄露商业秘密风险
?评估涉借声音伪造技术,生成涉企业家虚假言论损害企业形象的内容风险
?评估生成文本中是否包含商业违法违规内容
?评估在进行艺术作品评析、图片标题简介生成时,是否存在不正当竞争、恶意贬低等违规内容
侵犯他人合法权益内容风险
a)重点评估生成包含个人信息的内容,应取得对应个人同意或者符合法律、行政法规规定的其他情形,生成包含敏感个人信息的内容前,应取得对应个人单独同意或者符合法律、行政法规规定的其他情形;
b)重点评估大模型是否存在被诱导泄露个人信息的风险。
?评估输出文本是否包含泄露个人隐私、侵犯名誉权的内容
?评估是否能对恶意侮辱、谴责、恶意意图等有害输入指令有效识别和处置
?评估生成包含个人肖像的图像内容是否符合法律、行政法规的规定
?评估借他人形象生成恶俗低俗等有损他人名誉权、荣誉权等权益的风险
?评估生成包含个人信息的视频内容是否符合法律、行政法规的规定
?评估生成视频时对包含侵犯个人名誉等内容的识别能力,包括直接生成侵权视频,恶意利用声音伪造、人脸伪造等技术生成侵犯他人名誉权的风险
?评估生成包含个人信息的音频内容是否符合法律、行政法规的规定
?评估生成音频时对包含侵犯个人名誉等内容的识别能力,包括恶意利用声音伪造等技术生成侵犯他人权益的风险
?评估大模型是否能对恶意侮辱、谴责、恶意意图等有害输入指令有效识别和处置
有害和不良导向内容风险
a)重点评估大模型生成内容的价值导向,是否存在被诱导生成5.5a-5.5g有害内容的风险;
b)重点评估生成内容中展现血腥、惊悚、残忍等致人身心不适的,涉儿童色情以及带有性暗示、性挑逗等易使人产生性联想的图片等有害和不良信息识别能力;
c)服务适用于未成年人的,重点评估大
您可能关注的文档
- 黑龙江省钢结构工程验收相关记录表、工程质量监督报告.docx
- 小型餐饮服务提供者临时备案经营品种目录、经营场所和设备设施食品安全基本要求、申请表、承诺书.pdf
- 古代经典名方关键信息表(“旋覆代赭汤”等43首方剂).pdf
- 湖北省太阳能资源分布表、传统光伏支架安装图、钢结构悬索柔性支架结构示意图.docx
- 安徽省高标准农田建设项目概要表、计划报表、工程符号、初步设计报告.docx
- 常见食物交换份表、中国老年患者肠外肠内营养应用指南肠内营养推荐节选.docx
- 绿色设计产品塑料杯指标检测和计算方法、生命周期评价方法.docx
- 水利工程信息模型配色表、分类编码表、单元属性信息分类、对象的模型单元精度要求.pdf
- 干热岩资源调查评价设计书编写参考提纲、干热岩资源调查表格、可采资源量计算方法、成果报告参考内容.pdf
- 贵州省贵阳市第六中学2017-2018学年高二3月月考卷B英语试题扫描版.doc
- 河南省郑州市第一中学2017-2018学年高一下学期周测物理试题(325)扫描版含答案.doc
- 山西省怀仁县第一中学2017-2018学年高二下学期第一次月考生物试题扫描版.doc
- 河南省六市高三下学期第一次联考试题(3月)理科综合扫描版含答案.doc
- 四川省高三全国Ⅲ卷冲刺演练(一)文综地理试卷扫描版含答案.doc
- 河南省洛阳市高三第二次统考文综试卷扫描版含答案.doc
- 甘肃省靖远县高三下学期第二次联考理科综合试题扫描版含答案.doc
- 问题导学法在办公场景中的实施策略及效果评估.docx
- 退休后的个人品牌打造与传播策略.docx
- 问题解决在办公流程优化中的应用.docx
- 问题导向的办公环境创新设计.docx
最近下载
- 2023-2024学年教科版四年级科学下册全册教案.docx
- 2025年山东劳动职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析.docx
- 2025年外科护理主管护师(中级)真题精选 .pdf VIP
- 亮剑精神与企业管理.ppt
- 保险分级分类考测试题(含答案).doc
- 2025山西大同云冈文化旅游产业发展有限公司招聘笔试模拟试题及答案解析.docx
- 小学奥数 定义新运算 精选练习例题 含答案解析(附知识点拨及考点).pdf
- 2023年11月上海市教育委员会教育技术装备中心招考聘用笔试历年高频考点(难、易错点荟萃)附带答案详解.docx
- 幼儿园认识玉米ppt课件.pptx
- 《外国新闻史》全套教学课件.pptx
文档评论(0)