文献阅读--Federated Learning with Unreliable Clients: Performance Analysis and Mechanism Design

本文主要是介绍文献阅读--Federated Learning with Unreliable Clients: Performance Analysis and Mechanism Design,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文讲述了在联邦学习中,如何确定上传异常梯度的 Unreliable Clients,并提出了DeepSA算法,用来屏蔽Unreliable Clients上传的本地模型参数。除此以外,本文还推算了在异常场景下中心模型损失函数收敛的上界,并得到了最佳本地训练epoch的数量。

创新点:使用卷积神经网络鉴别异常参数(通过观察发现针对同一用户,其第k轮的数据及其领域几轮的数据具有相关性,这样的相关性可以被卷积层识别并呈现相关度)

目录

  • 收敛分析
  • 如何鉴别 Unreliable Clients ?
    • 二分类DNN模型的训练方式
      • 为什么要添加卷积层?
  • 实验设置

我们先来看一下存在 Unreliable Clients 的联邦学习场景:

在这里插入图片描述
注:在本文的联邦学习框架中,各 client 在本地进行多轮epoch 的训练,再上传本地模型参数,而不是上传梯度。

本文把 abnormal behaviors 分成了两种:
1.intentional:此种行为的 malicious clients 蓄意破坏中心模型的性能,因此可能会上传反向梯度
2.unintentional:这种情形下的 clients 收集到的本地数据可能很不准确(含有噪声)。

上述 abnormal behaviors 情况下,上传的 abnormal parameter可以表示为:
在这里插入图片描述
α ∈ [ − 1 , 1 ] α ∈ [−1, 1] α[1,1] n n n表示噪声。

收敛分析

先定义符号:
在这里插入图片描述

F ( w T ˉ ) F(\bar{w^{T}}) F(wTˉ) 为中心模型在一共训练 T T T 轮的情况下的损失函数, F ( w ∗ ) F(w^{*}) F(w) 是使损失函数最小的 w ∗ w^{*} w

本文给出的收敛上界如下:
在这里插入图片描述
在这里插入图片描述
从上述的收敛情况,我们可以得到以下结论:
1.本地训练次数 τ \tau τ 会影响收敛情况,在没有 unreliable client 的情况下,本地训练次数 τ \tau τ 越大,系统(中心模型)的收敛情况越差。
2. 参与者个数越多,异常行为出现的越少,系统的性能会越好。
3. 存在一个最佳 τ \tau τ ,可以使得系统达到最佳收敛——损失函数最小。

如何鉴别 Unreliable Clients ?

和别的方法一样,这里引入了异常检测,通过构建一个二分类的异常检测 DNN 模型。首先,利用 normal 数据训练一个DNN模型(就当作训练好了),然后,用 测试数据作为 DNN 模型的输入,如果DNN接受了这个输入,则为 normal 数据,否则为 abnormal 数据。

二分类DNN模型的训练方式

在 Fl 框架中,server端在第 k k k 轮聚合,收集到的参数可以表示为:
在这里插入图片描述
所以对应的检测结果可以表示为:

在这里插入图片描述
其中,0表示异常,1表示 normal 。
所以,从第1轮到第k轮的检测结果可以表示为:
在这里插入图片描述
注意:每一个 o o o 都是一个向量,因此,上式是一个由0和1组成的二维矩阵,而这个二维矩阵的输入,即参数矩阵,第 k k k轮到第 k − d k-d kd 轮的所聚合的参数可以表示为:
在这里插入图片描述
以往的异常检测算法是直接对某一轮的参数进行异常检测,但是本文的算法还考虑了过去几轮参数,即进行了纵向比对。

同样啊,这个 O d O^d Od 矩阵可以看作是一个 ( U ∗ 1 ∗ d ∗ s w ) (U*1*d*s_w) (U1dsw) 的多维矩阵。 s w s_w sw 表示每个本地模型所有参数的个数。

本文提出的 DNN二分类鉴别器如下图:
在这里插入图片描述
k k k轮到第 k − d k-d kd 轮的所聚合的参数 ( U ∗ 1 ∗ d ∗ s w ) (U*1*d*s_w) (U1dsw) 的多维矩阵作为 DNN 模型输入,输出是第k轮的结果,只要满足上部的DNN或下面的卷积层中有一个1,就判定为normal。中间的是

为什么要添加卷积层?

这也是本文的异常检测模型优于其他AE类型模型的巧妙之处,针对添加了噪声的异常参数w,卷积层可以检测出 noised 和 normal parameter 的低关联性,从而更加有效。并且通过实验观察到,每一个 sub-vector 和前后相邻的 sub-vector (即 第n轮和 第 n±1轮的 w w w)的有非常强的联系,这样的联系可以被卷积层很好地发掘。
在这里插入图片描述
当检测到在某轮更新时出现 abnormal client时,设计一个安全的聚合算法如下:
在这里插入图片描述

实验设置

本文模拟了三种 abnormal behavior,如下:
在这里插入图片描述
we set the total number of clients M = 50 and the total learning iterations T(kτ ) = 300. We run each experiment for 20 times and record the average results.

这篇关于文献阅读--Federated Learning with Unreliable Clients: Performance Analysis and Mechanism Design的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/234581

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

软件架构模式:5 分钟阅读

原文: https://orkhanscience.medium.com/software-architecture-patterns-5-mins-read-e9e3c8eb47d2 软件架构模式:5 分钟阅读 当有人潜入软件工程世界时,有一天他需要学习软件架构模式的基础知识。当我刚接触编码时,我不知道从哪里获得简要介绍现有架构模式的资源,这样它就不会太详细和混乱,而是非常抽象和易

【阅读文献】一个使用大语言模型的端到端语音概要

摘要 ssum框架(Speech Summarization)为了 从说话人的语音提出对应的文本二题出。 ssum面临的挑战: 控制长语音的输入捕捉 the intricate cross-mdoel mapping 在长语音输入和短文本之间。 ssum端到端模型框架 使用 Q-Former 作为 语音和文本的中介连接 ,并且使用LLMs去从语音特征正确地产生文本。 采取 multi-st

简单的Q-learning|小明的一维世界(3)

简单的Q-learning|小明的一维世界(1) 简单的Q-learning|小明的一维世界(2) 一维的加速度世界 这个世界,小明只能控制自己的加速度,并且只能对加速度进行如下三种操作:增加1、减少1、或者不变。所以行动空间为: { u 1 = − 1 , u 2 = 0 , u 3 = 1 } \{u_1=-1, u_2=0, u_3=1\} {u1​=−1,u2​=0,u3​=1}

简单的Q-learning|小明的一维世界(2)

上篇介绍了小明的一维世界模型 、Q-learning的状态空间、行动空间、奖励函数、Q-table、Q table更新公式、以及从Q值导出策略的公式等。最后给出最简单的一维位置世界的Q-learning例子,从给出其状态空间、行动空间、以及稠密与稀疏两种奖励函数的设置方式。下面将继续深入,GO! 一维的速度世界 这个世界,小明只能控制自己的速度,并且只能对速度进行如下三种操作:增加1、减

Axure元件库Ant Design中后台原型模板:提升设计与开发效率的利器

企业对于中后台产品的设计与开发需求日益增长。为了提升用户体验和开发效率,设计者和开发者们不断寻求更加高效、统一的解决方案。Ant Design,作为阿里巴巴开源的一套企业级UI设计语言和React组件库,凭借其丰富的组件和统一的设计风格,已成为众多项目的首选。而在Axure中使用Ant Design元件库,更是为中后台产品的原型设计带来了极大的便利。 Ant Design简介 Ant D

【UVA】11400-Lighting System Design(动态规划)

这道题感觉状态式不是很好推。。。 WA了好几次是因为排序的时候出问题了。 这道题出在线性结构里了,先说一下最长上升子序列吧。 dp[i]代表了以array[i]结尾的时候,最长子序列长度。 推导的时候,以起点递增的顺序进行推导。 #include<cstdio>#include<cstring>#include<iostream>#include<algorithm>#i

AI文献综述神器,有这一款就够了!

我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。 当前的AI辅助文献综述的工具有很多,如果说功能最强大的,娜姐无疑要推SciSpace了。 SciSpace利用强大的AI算法,理解并建立研究论文之间的联系,可以大大提升文献综述的质量和效率。并且其功能还在不断更新和完善。        1 强大的语义搜索功能 传统的关键词搜索可能会遗漏相关文献,Sc

天然药物化学史话:“四大光谱”在天然产物结构鉴定中的应用-文献精读46

天然药物化学史话:“四大光谱”在天然产物结构鉴定中的应用,天然产物化学及其生物合成必备基础知识~ 摘要 天然产物化学研究在药物研发中起着非常重要的作用,结构研究又是天然产物化学研究中最重要的工作之一。在天然药物化学史话系列文章的基础上,对在天然产物结构研究中起绝对主导作用的“四大光谱”分析技术,即红外光谱、紫外光谱、质谱、核磁共振波谱在天然产物结构鉴定中的应用历史进行回顾与总结,并对其发展