算法偏见背后的数据选择、信息过滤与协同治理.pdfVIP

算法偏见背后的数据选择、信息过滤与协同治理.pdf

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

本期话题IBENQIHUATI

算法偏见背后的

数据选择、信息过滤与协同治理*

口文1吴小坤邓可晴

【摘要】算法驱动的人类智能系统与人工智能系统交互中,数据选择与信息过滤是不容忽

视的关键环节,一方面与算法运行的不透明性有关,另一方面也受到人机协同的

信息过滤影响。算法偏见已经造成了现实生活中信息圈层之间的分化,并可能延

续甚至加剧社会发展多个方面的失衡。因此,有必要审慎地看待算法偏见的影响

要素,透视技术本身及其应用过程中的潜在风险和问题,从而为应对人工智能嵌

入社会系统过程中所带来的阶段性偏见提供思路。

【关键词】信息社会算法偏见数据选择信息过滤协同治理

2024年3月召开的全国两会中,“人工智能+”以用户为基础的个性化信息过滤与协同过滤也潜在

作为新质生产力的重要引擎首次被写入政府工作报地影响着信息流向与互动结果,这些结果正在加剧

告。当前,人工智能技术已渗透到社会生产和生社会不同年龄、不同收入等级、不同行业背景的群

活的方方面面,AI大模型和算法深度嵌入社会各体之间的知识鸿沟。如何减少算法偏见,在算法设

领域,成为社会运行的基础设施与经济发展的根本计和实施中平衡个性化推荐与公平性,从而确保推

驱动力之一。然而,在这个看似依赖真实数据进行荐系统服务的公正性和多元性,是我国现阶段社会

客观呈现的系统背后,却隐藏着一个不容忽视的问发展的一大挑战。

题一一算法偏见。这种偏见并非凭空产生,而是深

植于数据选择、信息过滤与算法模型的方方面面。一、差异化数据库与有偏的数据选择

比如,抖音、快手或微信视频号等基于推荐系统的

平台上,信息的过滤正在加剧圈层之间的区隔。即作为结构化信息存储方式,数据库使算法能够

便在家庭内部,子代和亲代之间在算法的作用下,高效地检索、更新和处理数据。算法开发在很大程

刷到的内容也大相径庭,并且这种隔阅随着刷短视度上依赖现有的数据库,同时也持续生成新的数据

频的时间和频次增加而不断扩大。究其原因有二:资源。长期以来,数据库的差异和质量的参差不

其一,数据选择是算法构建的基石,决定了算法的齐使得算法开发者难以避免有偏的数据,其后果

性能和输出。现实中的数据往往并非完全客观,而导致算法输出了部分错误的结果。因此,克服数

是承载着采集环境、文化和人类决策的痕迹,这使据质量所带来的算法偏见是一项重要的任务。为

得算法引入可能对某些群体或特定背景敏感。过度此,我们首先需要弄清基础数据的偏差隐含着哪些

依赖某一类信息源可能导致算法对其他声音的忽主要问题。

视,从而加深社会分歧和认知闭环。因此,如何客1.数据多样性和丰富度缺乏

观对待不同来源的数据,避免过滤中的偏见成为一人工智能算法的快速发展与数据库的丰富度、

个呕须解决的问题。其二,在算法运行的过程中,多样性和规范化紧密相关。尤其在一些面向数据应

*本文系国家社科重大课题“人工智能技术背景下算法传播的中国本土理论体系建构研究”(23ZD215)的阶段性成果

102024年第06期

出版CHINAPUBLISHINGJOURNAL

BENQIHUATI本期话题

用的算法开发早期阶段,数据的多样性、可获取性被运用到算法上的主观性。基础数据的价值偏见分

和丰富程度等对算法的运行效果产生影响。尽管在为两类:[311一是固有的价值偏见,其中包括社会

商业和政策的推动下,越来越多的数据资源被开放经济偏见、文化偏见、历史偏见与性别偏见;二是

出来,用于企业赛事、商业开发、政府或公益活动算法机器学习的过程中形成的价值偏见,主要包括

等,然而,相较于需求的增长,可用的数据资源仍标记偏见与确认偏见。

然是有限的。尤其是大模型时代到来,将数据资源第

文档评论(0)

教师资格证、公共营养师持证人

本人专注ppt制作、办公模板编辑六年有余,可以根据客户需求做出高品质ppt、办公表格等模板,以及文案等。

领域认证该用户于2024年07月07日上传了教师资格证、公共营养师

1亿VIP精品文档

相关文档