01联邦学习的介绍:Why And How Federated Learning

2024-01-08 18:58

本文主要是介绍01联邦学习的介绍:Why And How Federated Learning,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是联邦学习

联邦学习可以在不直接访问训练数据的情况下构建机器学习系统。数据保留在原始位置,这有助于确保隐私并降低通信成本。

联邦学习:将模型下传到用户侧进行模型训练,而无需将用户侧数据上传进行集中训练;

传统的机器学习:将用户数据上传集中,然后进行模型训练。

为什么需要联邦学习

  • 隐私问题(我不想分享我的自己的照片),联邦学习可以不将你的数据共享出去。

  • 监管需要(HIPAA,GDPR等),保护用户私有数据,使用联邦学习可以将模型下发到用户侧进行训练。

  • 解决数据孤岛问题,如:互联网企业、银行间数据不可能共享,模型使用联邦学习可以在各家企业、银行的私有数据上进行训练。

  • 工程障碍,数据量太大,网络连接昂贵,速度慢或不可靠等,采用联邦学习可以避免这些问题。

联邦学习能做什么

1.智能手机

机器学习具有改善智能手机用户体验的巨大潜力。应用程序可以学习发现好的宝贝照片,并主动提供与朋友和家人分享。他们可以更容易地编写更有可能收到快速回复的电子邮件。通过准确地建议下一个短语,无论语言如何,他们都可以更快速,更轻松地撰写短信。

但是,除了将这些数据从连接速度较慢的设备中取出的实际挑战之外,某些数据的个人方面(人们输入的内容,他们旅行的地点,他们访问的网站)使其成为问题。用户不愿意共享这些敏感数据,拥有它会使技术公司面临安全风险和监管负担。这些特性使其非常适合联邦学习。用例非常引人注目,谷歌的研究人员通常会将其发明归功于此,三星工程师也提出了重要的想法。

2.卫生保健

医疗行业为开发有效的治疗方法和预测结果提供了巨大的经济激励。但是,将机器学习应用于这些问题所需的培训数据当然非常敏感。实际和潜在隐私侵犯的后果可能很严重。

通过将培训数据保存在患者或提供者手中,联合学习有可能协作构建拯救生命并产生巨大价值的模型。总部位于巴黎的Owkin是我们在研究期间与之交谈的最雄心勃勃的联邦学习用户之一。它们提供了一个平台,使医疗保健提供商能够就各种医疗保健问题进行合作。

3.工厂预测性维护

假设制造商想要为他们销售的设备开发预测性维护模型。该模型需要培训数据 - 但是为了获得该数据而对于制造商来说,测试许多涡轮机直到它们失败为止。如果制造商的客户要发送这样的数据,那么制造商的成本会降低。更重要的是,实际客户体验的失败将比制造商在工厂实验中看到的更能代表现实世界的使用。简而言之,从客户那里获得的培训数据会更便宜,更好。

4.分散数据的聚合分析

一个用户在多家银行借贷,但是多家银行数据不通,通过联邦学习的聚合分析可以分析出用户是否在多家银行借贷,从而避免风险。

5. URL输入建议

Firefox实施的联邦学习系统,是改进Firefox URL栏中显示的部分建议。

Firefox URL栏显示用户键入搜索查询时的建议。这些建议的一部分由搜索引擎直接提供。其他由Firefox本身生成,例如基于用户的历史记录,书签或打开的选项卡。我们尝试使用我们的项目优化历史记录和书签建议。

6. 汽车维护预测

汽车跑5000-10000公里就需要换机油、机滤等,这个公里数是经验的,不是非常准确。通过联邦学习,可以比较精确地知道你的汽车该进行保养维护了。具体做法是,在汽车中放置一个预测模型,通过对天气、环境、污染、驾驶习惯等进行本地学习,再将学习结果传到服务器,服务器收到成百上千万的汽车上传模型的结果,最后学习到了一个比较好模型,再下传到汽车中,就能比较好地预测出你的汽车将在什么时候维护了,这就是汽车预测性维护,比较准确地进行维护和保养。

7. 可穿戴医疗设备

可以想象一下,有一个漂亮的腕表,可以记录你的行动、心率、睡眠周期、饮食等数据。使用联邦学习,可以放置一个健康模型在里面进行学习,并将学习模型参数上传(个人的这些健康数据不上传)。通过对成千上万人的学习,可以比较好地预测出你的健康状态,给出你睡眠、饮食建议等,使你活得更健康。

更多信息,请访问Federated Fearning For Firefox/

如何进行联邦学习

下面给出一些公司的解决方案:

1. OpenMend

从技术角度来看,OpenMined将联邦学习的原理与同态加密和区块链智能合约等尖端技术相结合,使协作模型能够以完全分散的方式实现深度学习应用。

OpenMined架构基于四个基本构建块:

Capsule

用于生成公钥和私钥的PGP服务器,以保证Sonar神经网络的不同组件的完整性。

Sonar

OpenMined平台的核心,Sonar是一个联邦学习服务器,运行在区块链上,用于控制深度学习应用程序不同部分的执行。该库与Capsule通信以生成PGP密钥,并将最终的,经过培训的结果发送回Data Scientist。它还与矿工沟通,收集Gradients并相应地分发Bounty。

Mine

该组件分布在用户的各个数据存储库中。Mine与Sonar相互作用以探测新的神经网络。上传到矿山的数据越多,它与Sonar的相关性就越高。

Syft

包含神经网络的库,可以在加密状态下进行训练(这样矿工就无法窃取他们下载的神经网络进行训练)。它构建在PyTorch之上

更多信息,请访问 OpenMined Github

2. TensorFlow_Federated(TFF)

TensorFlow Federated(TFF)是一个开源框架,用于机器学习和分散数据的其他计算。TFF的开发旨在促进联邦学习(FL)的开放式研究和实验,这是一种机器学习方法,在这种方法中,共享的全球模型在许多参与的客户中进行培训,这些客户将他们的培训数据保存在本地。例如,FL已被用于训练移动键盘的预测模型,而无需将敏感的键入数据上载到服务器。

TFF使开发人员能够在其模型和数据上模拟所包含的联邦学习算法,并尝试新颖的算法。TFF提供的构建块还可用于实现非学习计算,例如对分散数据的聚合分析。TFF的界面分为两层:

1)Federated Learning(FL)API

该层提供了一组高级接口,允许开发人员将所包含的联合培训和评估实现应用于现有的TensorFlow模型。

2)Federated Core(FC)API

该系统的核心是一组低级接口,通过在强类型函数编程环境中将TensorFlow与分布式通信运算符相结合,简洁地表达新的联合算法。这一层也是我们建立联邦学习的基础。

更多信息,请访问 Tensorflow Federated

3. Cloudera Federated

Cloudera 提供一个交互式联合学习原型,Turbofan Tycoon ,它是Cloudera Fast Forward Labs的研究原型,随着cloudera的联邦学习报告而建立。它使用逼真的涡轮风扇数据来显示使用联邦学习预测模型的好处。

更多信息,请阅读An introduction to Federated Learning

4. WeBank

Federated AI Technology Enabler(FATE)是由Webank的AI小组发起的一个开源项目,旨在提供一个安全的计算框架来支持Federated AI生态系统。

更多信息,请访问WeBank

结论

联邦学习的明显好处是在大量设备上分配知识质量,而无需集中用于优化和训练模型的数据。该方法还能够在保持训练数据集的隐私的同时提高集中式机器学习模型的质量。但是,联邦学习并非没有问题。与任何其他软件架构一样,分散化在工作协调,管理或监控等领域引入了挑战。如果不出意外,联邦学习将是传统的集中式监督和半监督学习架构的一个补充,而不一定是替代。

这篇关于01联邦学习的介绍:Why And How Federated Learning的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/584475

相关文章

MySQL中慢SQL优化的不同方式介绍

《MySQL中慢SQL优化的不同方式介绍》慢SQL的优化,主要从两个方面考虑,SQL语句本身的优化,以及数据库设计的优化,下面小编就来给大家介绍一下有哪些方式可以优化慢SQL吧... 目录避免不必要的列分页优化索引优化JOIN 的优化排序优化UNION 优化慢 SQL 的优化,主要从两个方面考虑,SQL 语

C++中函数模板与类模板的简单使用及区别介绍

《C++中函数模板与类模板的简单使用及区别介绍》这篇文章介绍了C++中的模板机制,包括函数模板和类模板的概念、语法和实际应用,函数模板通过类型参数实现泛型操作,而类模板允许创建可处理多种数据类型的类,... 目录一、函数模板定义语法真实示例二、类模板三、关键区别四、注意事项 ‌在C++中,模板是实现泛型编程

Python实现html转png的完美方案介绍

《Python实现html转png的完美方案介绍》这篇文章主要为大家详细介绍了如何使用Python实现html转png功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 1.增强稳定性与错误处理建议使用三层异常捕获结构:try: with sync_playwright(

Java使用多线程处理未知任务数的方案介绍

《Java使用多线程处理未知任务数的方案介绍》这篇文章主要为大家详细介绍了Java如何使用多线程实现处理未知任务数,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 知道任务个数,你可以定义好线程数规则,生成线程数去跑代码说明:1.虚拟线程池:使用 Executors.newVir

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,:本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

JAVA SE包装类和泛型详细介绍及说明方法

《JAVASE包装类和泛型详细介绍及说明方法》:本文主要介绍JAVASE包装类和泛型的相关资料,包括基本数据类型与包装类的对应关系,以及装箱和拆箱的概念,并重点讲解了自动装箱和自动拆箱的机制,文... 目录1. 包装类1.1 基本数据类型和对应的包装类1.2 装箱和拆箱1.3 自动装箱和自动拆箱2. 泛型2

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

四种Flutter子页面向父组件传递数据的方法介绍

《四种Flutter子页面向父组件传递数据的方法介绍》在Flutter中,如果父组件需要调用子组件的方法,可以通过常用的四种方式实现,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录方法 1:使用 GlobalKey 和 State 调用子组件方法方法 2:通过回调函数(Callb

Python进阶之Excel基本操作介绍

《Python进阶之Excel基本操作介绍》在现实中,很多工作都需要与数据打交道,Excel作为常用的数据处理工具,一直备受人们的青睐,本文主要为大家介绍了一些Python中Excel的基本操作,希望... 目录概述写入使用 xlwt使用 XlsxWriter读取修改概述在现实中,很多工作都需要与数据打交

java脚本使用不同版本jdk的说明介绍

《java脚本使用不同版本jdk的说明介绍》本文介绍了在Java中执行JavaScript脚本的几种方式,包括使用ScriptEngine、Nashorn和GraalVM,ScriptEngine适用... 目录Java脚本使用不同版本jdk的说明1.使用ScriptEngine执行javascript2.