本文主要是介绍联邦学习FL+激励机制+区块链论文阅读1,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Mechanism Design for an incentive aware blockchain enabled federated learning platform
激励感知的区块链FL平台的机制设计
论文资源已免费上传
现有不足:
1)无法监控被分配训练任务的工人的行为,为了使理性工作者正确地工作,需要特殊的硬件/密码,这阻碍了具体实现。
2)将区块链加入FL进行货币激励,但尚未讨论任何严格的奖励政策设计。
本文设计:
在参与者理性行为的情况下实现期望目标。关键思想是为FL引入重复竞争,以便任何理性的员工都能遵守协议并实现利润最大化。
从理论上阐明了基于竞争理论的激励相容性,竞争理论是经济学中基于拍卖的博弈论。
(重复的模型更新竞争:在某一轮中,工人都会选择上一轮工人提交的顶级的k个模型更新,并用它们更新自己的模型。工人的报酬由下一轮工人投票决定。选择实现最佳模型的动机是,他们的模型更新将有更多的机会在下一轮投票中被投票,这意味着将获得更多的奖励。)
系统模型
1 参与者
2系统模型
(1)用户注册,管理员注册参与者,参与者必须提供其以太坊地址(addr),以及注册为请求者获工作者。
(2)任务发布,任何请求者可以通过智能合约发布ML任务。请求者必须指定模型描述,参数以及奖励。
(3)任务加入,发布的任务通过以太坊发送给所有注册工人,每个工人决定是否加入此任务。
(4)任务开始,请求者选择模型更新轮数和工人数量,智能合约随机选择工人(如果加入的工人数量为0或更少,则该任务将自动终止,押金将退还给请求者),请求者不应事先向工人透露训练轮数,但需要在第N轮结束时透露。
(5)模型更新。请求者生成用于安全存储本轮模型更新的密钥,连同上一轮密钥一起发送给工人(用每个工人的公钥逐一加密并),被接收后,每个工人用私钥解密,检索前一轮中的模型,并更新模型,更新的模型通过智能合约提交给区块链。
(6)奖励分配,在模型更新的提交阶段,e轮中的每个工作人员投票给k个模型(一个模型只投一票)。基于累计投票,智能合约按照且奖励工人(没有给出具体分配比例)。在最后一轮中,奖励平均分配给工人。
(7)任务完成,在最后一轮中,奖励平均分配给工人。工人诚实计算的动机会降低。为了避免这种情况,请求者需要在N轮结束后显示,让最后的工人必须不知道他们是否在最后一轮。
3 改进点
具体的分配比例
最佳轮数如何设置
这篇关于联邦学习FL+激励机制+区块链论文阅读1的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!