《联邦学习场景应用研究报告（2022年）》.docxVIP

下载本文档

169
0
约3.46万字
约 68页
2022-03-02 发布于北京
举报
版权申诉

《联邦学习场景应用研究报告（2022年）》.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

联邦学习场景应用研究报告（2022 年）目录一、联邦学习简介 1 (一) 数据隐私安全及孤岛问题 1 (二) 联邦学习定义 1 (三) 联邦学习主要作用 2 (四) 联邦学习技术优势 2 二、联邦学习发展历程 3 (一) 传统隐私保护 3 (二) 联邦学习 4 (三) 安全联邦学习 5 三、联邦学习进阶 6 (一) 主要技术原理 6 (二) 联邦学习的分类 8 (三) 联邦学习模型 15 (四) 联邦学习能力 17 (五) 联邦学习流程 18 四、安全联邦学习 19 (一) 可信计算环境 20 (二) 多方安全计算 21 (三) 同态加密 21 (四) 差分隐私 22 (五) 安全性 23 (六) 性能 25 五、应用场景 27 (一) 政务开放 27 (二) 医疗应用 28 (三) 金融应用 38 (四) 数字广告 56 (五) 物流行业 62 六、展望 63 (一) 政策引导、持续释放行业红利 63 (二) 凝聚共识、加速应用场景探索 64 (三) 标准建设、加强平台互联互通 64 图目录图 1 传统机器学习和联邦学习的对比 3 图 2 联邦学习的两种架构模式 7 图 3 横向联邦学习数据分割示例 9 图 4 纵向联邦学习数据分割示例 10 图 5 迁移学习数据分割示例 11 图 6 联邦学习参与方的数据网络结构 13 图 7 VTE 数据分析示例 33 图 8 隐私保护的跨国川崎病研究 34 图 9 医学影像学深度分析引擎技术架构 35 图 10 FedCIE:电子病历结构化联邦学习框架 37 图 11 全业务信贷风控流程示意图 40 图 12 银行联邦反欺诈方案示意图 43 图 13 基于隐私计算的营销风控平台级解决方案 45 图 14 应用隐私计算后的营销风控场景表现 46 图 15 银保营销方案示意图 50 图 16 银保营销方案示意图 55 图 17 联邦学习 AI 联合建模应用于广告投放场景 59 图 18 多方数据融合反作弊模型 60 表目录表 1 不同隐私保护计算技术的安全能力范围 25 表 2 隐私保护的不同技术路线 26 一、联邦学习简介 (一)数据隐私安全及孤岛问题数据孤岛普遍存在于所有需要进行数据共享和交换的系统之间，包括不同部门之间的数据信息能不能共享、不同公司之间的数据信息能不能共享，以及不同产业之间的数据能不能共享等等。在 2019 年中国互联网协会对外公布的《中国网民权益保护调查报告》显示，在 2019 年，七成左右的网民个人身份信息和个人网上活动信息均遭到泄露。78.2%的网民个人身份信息(姓名、学历、家庭住址、身份证号及工作单位等)被泄露；63.4%的网民个人网上活动信息(通话记录、网购记录、网站浏览痕迹、IP 地址、软件使用痕迹及地理位置等)被泄露。近半数的网民个人通讯信息(即时通讯记录、手机短信等)被泄露。2019 年因个人信息泄露导致诈骗信息、诈骗消息等原因，导致网民总体损失约 805 亿元。 2021年以来，关于用户隐私泄露、数据违规的负面事件频发，公众对于数据安全和隐私保护越发关注。《数据安全法》《个人信息保护法》等相关法律法规的颁布和实施也从法律层面为数据安全和个人隐私提供了根本保障，同时也促进了以联邦学习为代表的隐私行业的飞速发展。 (二)联邦学习定义联邦学习（Federated Learning）本质是一种分布式机器学习框架，它做到了在保障数据隐私安全及合法合规的基础上，实现数据共享，共同建模。它的核心思想是在多个数据源共同参与模型训练时，不需要进行原始数据流转的前提下，仅通过交互模型中间参数进行模型联合训练，原始数据可以不出本地。这种方式实现数据隐私保护和数据共享分析的平衡，即“数据可用不可见”的数据应用模式。 (三)联邦学习主要作用随着信息化社会的发展，各行业积累了大量的数据，这些数据掌握在不同的实体手中，受技术、安全和监管等的限制，无法有效的分享融合，形成一个个独立的数据孤岛；而互联网和移动互联网时代的发展，加速了数据的碎片化。数据里面蕴含着重要模式（Pattern），如人类生物特征、喜好、金融信用等等。通过机器学习技术可以挖掘数据中蕴藏的这些模式，这些经过大量数据训练出来的机器学习模型已经应用在各行各业，例如医疗行业的临床辅助诊断、新药物研发、精准医疗；安全行业的人像识别、声纹识别等等。在这些应用中，模型的精度至关重要，而模型的精度核心依靠训练数据，只有经过大量数据的训练，才可能获得好模型。另一方面，由于法律政策监管、数据隐私安全等方面的顾虑，各数据所