联邦学习技术金融应用白皮书.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
联邦学习技术金融应用 白皮书 目 录 一、 研究背景 2 (一)概述 3 (二)标准情况 6 二、 联邦类型 8 (一)数据视角 8 (二)参与方视角 11 (三)架构视角 15 (四)建模视角 17 三、 联邦学习建模流程 20 (一)联邦数据探查 20 (二)联邦模型训练 23 (三)联邦模型推理 23 四、 安全与审计 25 (一)安全性分析 25 (二)审计功能 34 五、 金融应用要求及案例 38 (一)应用性能指标 38 (二)应用案例 42 六、 展望与结论 59 附录: 联邦学习算法应用实现 69 名词术语 1. 特征(feature ):数据提供者提供用于训练或计算的指标。 2. 标签 (label):模型使用者提供的用于训练模型的目标数 据。 3. 联邦算法 (federated algorithm ):联邦参与方使用的机 器学习算法,一般由非联邦的机器学习算法演化而来。 4. 联邦模型 (federated model ):联邦参与方通过与其它联 邦参与方共同训练生成的模型。 5. 联邦参与方 (federated learning participant ):提供 联邦学习数据或作为建模发起者的组织或机构。联邦参与 方角色有时候亦可分为Guest 和Host。 Guest: 一般是任务的发起方,在纵向联邦的场景中,一般 为带有标签Y 的一方,除了提供数据样本和标签外,还会 负责任务的发起和主要调度等。 Host: 也是数据提供方之一,纵向联邦场景中,一般是没 有标签的一方,仅提供数据和协同训练推理 6. 联邦协调方 (federated learning coordinator ):为联 邦参与方的活动提供协调、辅助等支撑功能的组织或机构, 主要完成联邦过程中的辅助计算,不存储数据,有时候也 成为Arbiter。 一、研究背景 近年来,数字经济蓬勃发展,已经成为带动中国经济增长的 核心动力。2020 年4 月,中共中央国务院发布了《关于构建更加 完善的要素市场化配置体制机制的意见》,首次将数据与土地、 劳动力、资本、技术等传统要素并列为生产要素。2021 年12 月, 中国人民银行发布《金融科技发展规划(2022—2025 年)》明确 提出从强化数据能力建设、推动数据有序共享、深化数据综合应 用、做好数据安全保护方面充分释放数据要素潜能。数字经济时 代,数据成为新的关键生产要素,成为了社会基础性战略资源, 蕴藏着巨大潜力和能量,必将成为提升金融行业赋能实体经济的 有力抓手。 随着大数据技术的快速发展,人们每天的活动产生了大量的 数据,这些数据被众多的企业收集和使用,数据在空间和时间里 面流动产生了价值。在价值产生的过程中,需要对数据进行保护。 但是数据往往分布在不同的企业、机构,形成了一个个数据“孤 岛”。例如,在机构间,尤其政府部门,很多数据没有充分共享。 又比如银行和税务,希望通过“银税合作”来获取客户的风险评 估信息。在企业内部也是如此,集团化的企业公司越来越大,子 公司、分公司,就连部门内部的系统都可能是自己分别开发的, 数据之间完全孤立。为了挖掘数据中蕴藏的巨大价值,消除行业 数据孤岛现象,让数据相互之间协作起来,必然是未来发展趋势。 数据在为人们的生活带来了种种便利的同时,也使得大家对 于个人的数据隐私和安全产生了担忧,这俨然已经成为世界性的 问题。各国针对这个情况,纷纷立法进行规范,例如:欧盟提出 了《通用数据保护条例》(General Data Protection Regulation, GDPR),该法案已于2018 年起正式生效;我国也在近几年陆续颁 布了《中华人民共和国数据安全法》和《中华人民共和国个人信 息保护)》等法令法规,用以加强数据监管和隐私保护。可见, 对用户数据隐私和安全管理的日渐收紧已经成为了必然的趋势。 这就对企业利用数据开展业务提出了一个挑战。如何才能在遵循 法规的要求下,既充分发挥数据的价值,同时又不会影响到用户 的数据隐私和安全,尤其是对于依赖外部数据的企业,如何能够 利用合作伙伴的数据价值,又不会见到原始数据,造成数据泄

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档