AI风险库：人工智能风险的综合元审查、数据库和分类（中文版）.docx

下载文档

0
0
约13.43万字
约 127页
2024-12-12 发布于山西
举报
版权申诉
保障服务

AI风险库：人工智能风险的综合元审查、数据库和分类（中文版）.docx

1、本文档共127页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

人工智能风险存储库：人工智能风险的综合元审查，数据库和分类

彼得·斯莱特里12，亚历山大·K。Saeri12，EmilyA.C.格伦迪12，杰斯格雷厄姆3，迈克尔诺特尔23，里斯托乌克45，詹姆斯道6，索鲁什普尔6，斯蒂芬卡斯珀7，和尼尔汤普森1。

1麻省理工学院麻省理工未来科技学院2就绪研究3昆士兰大学心理学院4未来生命研究所5鲁汶大学6和谐智能7麻省理工计算机科学与人工智能

电子邮件：psala@.

摘要

人工智能（AI）带来的风险引起了学术界、审计师、政策制定者、AI公司和公众的极大关注然而，缺乏对人工智能风险的共同理解可能会阻碍我们全面讨论、研究和应对这些风险的能力本文通过创建一个人工智能风险存储库来解决这一差距，作为一个共同的参考框架。这包括从43个分类中提取的777个风险的动态数据库，可以根据两个总体分类进行过滤，并通过我们的网站和在线电子表格轻松访问，修改和更新。我们通过对AI风险的分类法和其他结构化分类进行系统性审查，然后进行专家咨询来构建我们的知识库我们使用最佳拟合框架合成来开发我们的AI风险我们的高层次人工智能风险因果分类法根据其因果因素对每种风险进行分类：（1）实体：人类，人工智能;（2）意向性：有意，无意;（3）时间：部署前;部署后。我们的人工智能风险中级领域分类法将风险分为七个人工智能风险领域：（1）歧视毒性，（2）隐私安全，（3）错误信息，（4）恶意行为者滥用，（5）人机交互，（6）社会经济环境，以及（7）人工智能系统安全，故障，限制。这些进一步分为23个子

域。据我们所知，人工智能风险存储库是首次尝试严格整理、分析人工智能风险框架并将其提取到可公开访问、全面、可扩展且分类的风险数据库中。这为更协调、一致和完整的方法来定义、审计和管理人工智能系统带来的风险奠定了基础

读者指南

这是一份很长的文件。以下是使用本文档及其相关材料的几种方法，具体取决于您的时间和兴趣。

两分钟的约定

浏览简单语言摘要（第。（3）第三章。

10分钟交战

阅读简单的语言摘要（p。（3）第三章。

阅读AI风险格局的见解（p.56），和关键受众的影响（p。57）。

决策者、模型评估者

阅读简单的语言摘要（p。（3）第三章。略读人工智能风险领域的详细描述（第100页）。33）。阅读AI风险格局的见解（p.56）和政策制定者和/或审计员分节的影响，主要受众（第57页）。

研究人员

阅读简单的语言摘要（p。（3）第三章。阅读图1（p.15）来理解我们用来识别相关文档并开发两种新的人工智能风险分类法的方法;有关我们如何开发分类法的更多细节，请参阅最佳拟合框架综合方法（第15页）。19）。

阅读AI风险格局的见解（p.56），和学术部分的影响，为关键观众（p。59）和skim限制和未来研究的方向（p。60）。

简单的语言摘要

●

●人工智能（AI）带来的风险令许多利益相关者

●许多研究人员试图对这些风险进行

●现有分类不协调、不一致

●我们审查并综合先前的分类，以生成一个AI风险存储库，包括一篇论文、因果分类法、领域分类法、数据库和网站

●据我们所知，这是第一次尝试将人工智能风险框架严格地策划，分析和提取到一个可公开访问，全面，可扩展和分类的风险数据库中

人工智能（AI）带来的风险引起了包括政策制定者、专家、AI公司和公众在内的广泛利益相关者的极大关注这些风险跨越各个领域，并以不同的方式表现出来：人工智能事件数据库现在包括3,000多个人工智能系统已经造成或几乎造成伤害的真实案例。

为了更清楚地了解这一系列复杂的风险，许多研究人员试图对它们进行识别和分类。从理论上讲，这些努力应该有助于简化复杂性、识别模式、突出差距并促进有效的沟通和风险预防。在实践中，这些努力往往缺乏协调，范围和重点各不相同，导致许多相互冲突的分类系统。即使不同的分类系统使用类似的风险术语（例如，“隐私”）或关注类似领域（例如，“存在风险”），它们可以指不一致的概念因此，仍然很难理解人工智能风险的全部范围

在这项工作中，我们建立在以前的努力，通过将其不同的观点结合到一个全面，统一的分类系统中来分类人工智能风险在这个合成过程中，我们意识到我们的结果包含两种类型的分类系统：

●AI风险原因的高级分类（例如，AI风险何时或为何发生）

●人工智能的中级危害或伤害（例如，人工智能是在有限的数据上训练的，或用于制造武器）

由于这些分类系统如此不同，很难将它们统一起来;高级别的风险类别，如“责任扩散”或“人类错误地创造了危险的AI”，不会映射到更窄的类别，如“滥用”或“嘈杂的训练数据”，反之亦然。因此，我们