- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
卷首语
2025/6上 总第423期观察与评论
构建高质量数据集驱动人工智能向“智”而行
在生成式人工智能掀起技术浪潮的当下,人工智能正在以前所未有的速度渗透到社会生活的方方面面。在这
一过程中,构建更加完善、精准、多元的数据集已然成为推动人工智能向更高层次迈进的核心议题。当前,有关部
门已经开始行动。例如,国家数据局等17部门联合印发的《“数据要素×”三年行动计划(2024—2026年)》提出
“推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集”。
然而,当前构建高质量数据集的工作存在以下几个方面的困境。
第一,在数据供给方面,公共数据开放程度低、标准不统一,企业间数据壁垒森严。例如,在医疗领域,患者
隐私保护与数据共享难以平衡,导致人工智能医疗诊断模型缺乏足够的临床数据支撑;在工业领域,各企业生产数
据格式各异,难以实现整合利用,限制了智能制造人工智能系统的发展。
第二,在技术方面,数据合成技术尚不成熟,难以满足大模型对数据数量和多样性的需求,同时缺乏高效的
“人工智能+数据”平台,产业链协同困难。
第三,在数据治理方面,数据发展政策细则缺失,数据治理与隐私保护机制不完善,数据安全的法律法规存在
漏洞,产权界定模糊,影响了数据的有序流通和使用。
要想成功破局,关键在于多方协同发力。
首先,解决数据供给方面的问题。有关部门应发挥引领作用,推动公共数据开源开放,完善数据流通政策,打
破数据孤岛;加大财政投入,设立专项基金,引导社会资本参与,支持数据产业发展;加快完善数据隐私保护的法
律法规,明确数据产权与交易规则,提升数据使用的合规性与安全性。
其次,解决技术方面的问题。一方面,高校需加强数据科学和人工智能专业建设,有针对性地设置课程与实训
项目,培养既懂数据技术又熟悉行业需求的复合型人才;另一方面,建设国家级数据要素平台迫在眉睫。需要通过
整合全国数据资源,提供强大的算力支持,为人工智能模型训练打造坚实的数据基础。
最后,解决数据治理方面的问题。企业要持续加强联邦机器学习、差分隐私等技术的研发与应用,在确保数据
安全的前提下实现数据价值最大化;有关部门需推动企业、高校、科研机构等主体协同合作,构建产学研深度融合
的数据生态体系。
目前,对于发展人工智能行业来说,构建高质量数据集既是挑战,又是机遇。如果能构建起坚实的数据底座,
人工智能必将突破现有局限,释放更大的创新活力,为经济社会发展注入强劲动力。
E-commerceinChina1
文档评论(0)