技术标准|隐语技术标准的 What Why How

2024-02-28 17:28
文章标签 技术标准 隐语

本文主要是介绍技术标准|隐语技术标准的 What Why How,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 “隐语”是开源的可信隐私计算框架,内置 MPC、TEE、同态等多种密态计算虚拟设备供灵活选择,提供丰富的联邦学习算法和差分隐私机制

开源项目

github.com/secretflow

gitee.com/secretflow

 

本文根据蚂蚁集团隐语 SPU 研发负责人 谭晋,在1月20日北京「隐语开源社区嘉年华」的演讲分享整理。

各位老师、各位同学、大家下午好,非常高兴有机会在这里跟大家汇报隐语技术标准的相关工作。

隐语为什么要做技术标准化?

其实这是一个行业普遍的问题而不仅仅只是隐私计算的问题,很多行业都希望把标准化建立起来。隐私计算对标准化的诉求也相对强烈,主要是因为隐私计算的技术栈非常复杂,以 MPC 为例,需要从最简单的门电路一直搭到数据分析和机器学习的算法。

相对于明文的各种基建,隐私计算基建还比较有限。明文有丰富的数据库、操作系统、调度基建等,但在隐私计算方面这些是缺失的。其次是安全协议复杂,如果没有透明可观测的技术标准,我们很难验证安全性,同时会导致合作困难,如果各干各的就很难搭建公有基础设施,进而阻碍创新。此外,标准化的缺失一定程度上也存在安全隐患,因为无法用标准化的方式把问题暴露出来,因此我们希望“减少轮子”,促进共建,促进创新,用标准化的手段保障安全。

我们讲技术标准化难以回避的问题是互联互通,我理解它的本质也是要实现技术的标准建设。它就像是标准化的北极星,用一个方向牵引隐私计算标准化的路径。

但由于隐私计算技术还在高速演进的发展阶段,比如每一年都会有新的协议、新的联邦学习算法出现,我理解任何不确定性都是标准化所面临的重要挑战,此外由于部分技术可能还处在 Paper 和 POC 的阶段,依然还需要时间与实践的验证。用标准指导实践,让实践检验标准,它们之间是相辅相成的关系。

因此,隐语所推进的技术标准,是希望结合隐语所提供的技术去打造一个开放的体系,将隐语的技术逐步标准化并实现快速迭代。同时,隐语做的很多部分都和互联互通有着互补的关系,我们希望相关技术标准成熟之后也可以回归到互联互通的大家庭中。

隐语如何做技术标准化

我理解的标准化是没有捷径的,隐语会根据技术框架逐层实现模块化与标准化。比如在隐私计算技术框架中,下面需要有网络层,这一层明文中有非常多的标准化工作,我们要尽量拥抱它;接下来是协议层,每年有很多的安全协议出来,安全模型众多,迭代速度也非常快,这一层我们需要拥抱变化;上面是调度层,其中会有很多并行的调度策略和跨域调度管理;再上面是编译层,涉及大量编译工作,有非常多层的 IR,隐语在这方面已积累了一定的技术沉淀,后续需要进一步推进标准化的工作;最后是算法层,由于算法种类非常多,因此统一也会面临很大的挑战。

由此可见,隐私计算技术框架的每一层都有各自的特点,如有些层目前存在标准化的缺失,有些层需可扩展,有些层则是需要自描述。接下来我以算法层举例,看一下隐语在算法层的标准化思路。

在典型的建模管线中,我们把数据导入到隐私计算平台,数据首先经过数据分析组件,比如相关系数,方差膨胀因子等;接下来会经过数据处理,比如分箱、归一化等;然后数据被拆分,拆成训练集、预测数据集,训练出来的模型会和预测数据一起预测出结果并进行模型评估,评估模型的好坏。我们可以看到算法层的种类、参数都会非常多。实际上在实现的过程中,隐私计算面对不同的场景会有很多变数,每一家的侧重点也不太一样。另外,组件理论上可组合性很强,替换任何一个组件都可以正常工作,又会导致边界约束比较困难。

我们的思路是试图做一个自描述的标准,实现算法组件的可扩展。我们用灵活的通用数据交换格式去描述所有的边,这样所有的点都是自描述的,所有的边都是标准化的。通过配套的数据和管线标准化,理论上我们可以支持无限多的算法组件,甚至可以支持跨引擎的黑盒互联互通。

隐语 spec 都是经过隐语框架实践的。以上图隐语 SecretPad UI 操作界面来示意,上面有非常多的算法组件,鉴于我们是结合实践的标准,因此会有一个开放的 SDK 并且支持代码的反射。也就是说用 Python 写一个算法及其参数,就可以自动反射出组件实例。配合上隐语前端的自动渲染,就实现了“所见即所得” ,即在后端写一个 Python 算法,前端就可以自动拖拉拽。同时,我们也做了系统化的防呆和边界检查,让整个类型系统变得更加安全。值得一提的是,目前隐语的 30+ 组件都以隐语组件标准形式接入,同时这个数量还在不断增长。

隐语技术标准 Roadmap

隐语会根据技术框架逐层实现模块化与标准化。如在协议层,我们将关注安全分级和多种安全模型,同时推进硬件加速实践;在调度层,关注各种跨域的调度策略,推进使用权跨域管控和并行管线加速;在算法层,关注自描述行与可扩展性,同时提供配套的数据和管线标准化等等。

技术标准的分层随着时间的推移可能会发生一些变化,但是我理解即便是技术栈发生变化,我们的一些规则也是不会变的。隐语技术标准会以实践为先,实现快速迭代,同时支持扩展,积极地拥抱变化。当然,我们也会把所有的技术标准向社区开放,欢迎大家的指导和共建。

隐语希望结合自身技术实践与行业共建优势,通过开放的隐语框架,推进相关技术标准的沉淀与演进。「隐语技术标准 SIG」,以特别兴趣小组的形式在隐语开源社区推进,希望能够解耦隐私计算技术栈各层模块,提高算法、协议和调度层的扩展和协作能力,以促进隐语生态伙伴之间的横向协同与链接,推动隐私计算技术的发展及应用。

此外,我们的SIG小组还包括行业生态、隐私安全算法、TEE、加速硬件等,同样欢迎相关的企业与专家学者的加入。

这是我今天的分享,谢谢大家!

🤝 欢迎添加隐语小助手微信,后台回复“技术标准”即可获取 隐语技术标准 SIG【申报表】或咨询更多信息!

分享视频

👉 演讲视频观看

隐语技术标准化:what、why、how_哔哩哔哩_bilibili未来隐语会根据技术框架逐层实现模块化与标准化。以标准指导实践,以实践检验标准,通过前沿技术探索与工业化打磨实践,积极支持业内标准共识涌现,同时不断推进自身技术框架及相关标准的规范与演进。, 视频播放量 1213、弹幕量 0、点赞数 1、投硬币枚数 0、收藏人数 0、转发人数 1, 视频作者 隐语SecretFlow, 作者简介 公众号:隐语的小剧场,隐私计算行业交流群:SecretFlow01,相关视频:MOOC2 第8讲 应用实践丨隐语PSI介绍及开发实践,MOOC2 第6讲 概述丨隐语架构概览,可信执行环境:现状、挑战与机遇——夏虞斌教授,黑客教你抓娃娃技巧,百发百中,基于隐语实现国密算法 TPRE(门限代理重加密),Cheetah猎豹及其在隐语中的实现,隐语框架整体架构设计及MPC算法开发实践教程,MOOC2 第17讲 应用实践丨 隐语SSXGB/SGB介绍及开发实践,MOOC 第3讲:「隐私计算基础理论」同态加密技术及其应用,隐语上手实践icon-default.png?t=N7T8https://www.bilibili.com/video/BV1ww411E76s/

 🏠 隐语社区:

github.com/secretflow

gitee.com/secretflow

www.secretflow.org.cn (官网)

👇 欢迎关注:

公众号:隐语小剧场

B站:隐语secretflow 

邮箱:secretflow-contact@service.alipay.com

这篇关于技术标准|隐语技术标准的 What Why How的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/756129

相关文章

重磅分享 | 2023年信息安全技术标准、国家政策、国标及安全领域报告大合集(250份)

重磅分享,2023年信息安全技术标准、国家政策、国标及安全领域报告大合集,共200多份。 1、国家政策法规(28份) 2、重点行业政策(33份) 3、地方政策规章(72份) 4、国家技术标准(44份) 5、重点领域报告(66份) ***************详细资源列表*************** 1、国家政策法规\1 未成年人网络保护条例.pdf 1、国家政策法规\10 商用密码检

《装配式混凝土建筑技术标准》免费下载

【资源介绍】 资源名称:《装配式混凝土建筑技术标准》 资源分类: BIM标准,装配式标准 其他简介:《装配式混凝土建筑技术标准》免费下载 【资源下载】 链接:https://pan.baidu.com/s/1piPVVRRy2nIHqBuCPYxJ2A 提取码:47yh 【资源截图】 【免责申明】 本站提供的资源下载链接均来自互联网,仅供学习研究之用,不得用于商业,请在24小时

隐私计算实训营学习八:隐语SCQL的开发实践

文章目录 一、SCQL使用集成最佳实践1.1 SCQL使用流程1.2 SCQL部署1.3 SCQL使用示例 二、SCQL工作原理三、使用SecretNote上手体验SCQL 一、SCQL使用集成最佳实践 1.1 SCQL使用流程 SCQL使用: SCQL 开放 API 供⽤户使⽤/集成。可以使⽤SCDBClient上⼿体验(类似与Mysql Client的命令行工具);也可以基

隐私计算实训营学习六:隐语PIR介绍及开发指南

文章目录 一、隐语实现的PIR总体介绍1.1 PIR的定义和种类1.2 隐语PIR功能分层 二、Index PIR-SealPIR介绍三、Keyword PIR- Labeled PSI介绍四、隐语PIR后续计划 一、隐语实现的PIR总体介绍 1.1 PIR的定义和种类 PIR(Private Information Retrieval PIR)隐匿查询:用户查询服务端数据库中

第四讲:隐语SecretFlow安装部署

SecretFLow安装 环境要求: Python>=3.8; 操作系统:CentOS7,Anolis8,Ubuntu 18.04/20.04,macOS11.1+,WSL2; 资源:>=8核16GB 安装包:SecretFLow, SecretFLow-Lite(不包含深度学习依赖库) 安装方式:docker镜像;pypi;源码 SecretFLow部署-仿真模式,快速验证 单机仿真:

【隐私计算实训营——004上手隐语SecretFlow和SecretNote安装部署】

1. SecretFlow安装 1.1 环境要求 Python>=3.8操作系统 Ubuntu18+ 资源:>=8核16GB安装包 secretflow-lite 安装方式 docker(推荐) 2. SecretFlow部署模式 SecretFlow使用Ray作为分布式计算调度框架。 Ray集群由一个主节点和零或若干个从节点组成。 3 仿真模式 3.1单机仿真 我们通过

探秘开源隐语:架构深度剖析与隐私计算技术之旅

1.隐语架构 隐语(SecretFlow)作为蚂蚁集团开源的可信隐私计算框架,其架构设计具有多层次的特点,虽然具体分层名称可能会根据实际描述略有差异,但我们可以依据已有的技术和信息对其进行结构化的拆解: 硬件层(或称TEE层/TCS层): 这一层主要涉及到硬件层面的安全保障,尤其是对于可信执行环境(Trusted Execution Environment, TEE)的支持,比如蚂蚁集团推出

第4讲 上手隐语SecretFlow安装部署

学习感受 通过课程,了解了SecretFlow的安装、仿真模式与生产模式的使用。 学习链接为: 上手隐语SecretFlow安装部署 笔记 生产模式与仿真模式的不同 安全增强每个参与方都是独立的 Ray集群所有参与方都要执行代码 KUSCIA 屏蔽不同机构间基础设施的差异,为跨机构协作提供丰富且可靠的资源管理和任务调度能力。 secretnote 像jupyter一样写代码,不能

多屏互动技术标准DLNA与Airplay

多屏互动技术从早期的DLNA发展开始, DLNA(Digital Living Network Alliance) 是一个由微软、诺基亚等众多公司组成联盟共同开发的,旨在把移动设备、PC上的多媒体通过wifi无线网分享到电视大屏幕上去的技术标准。       苹果公司一开始也加入DLNA联盟,但后来又退出了, 我想大概是因为苹果是一家追求完美的公司,DLNA技术只支持视频、音乐、照片的

第三篇 - 概述- IAB受众和技术标准 - IAB视频广告标准《数字视频和有线电视广告格式指南》

第三篇 - 概述- IAB受众和技术标准​​​​​​​  - 我为什么要翻译介绍美国人工智能科技公司IAB技术标准系列(2) 本文目录 一、IAB技术实验室简介 二、概述及IAB受众 三、资源- IAB倡导的相关视频广告技术标准 四、案例分享-介绍一家数字化营销服务公司 - SproutSocial 五、数字营销工兵观察 六、资料来源及推荐阅读 一、IAB技术实验室简介 随