隐私计算实训营学习六:隐语PIR介绍及开发指南

2024-04-01 05:20

本文主要是介绍隐私计算实训营学习六:隐语PIR介绍及开发指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、隐语实现的PIR总体介绍
    • 1.1 PIR的定义和种类
    • 1.2 隐语PIR功能分层
  • 二、Index PIR-SealPIR介绍
  • 三、Keyword PIR- Labeled PSI介绍
  • 四、隐语PIR后续计划

一、隐语实现的PIR总体介绍

1.1 PIR的定义和种类

PIR(Private Information Retrieval PIR)隐匿查询:用户查询服务端数据库中的数据,但服务端不知道用户查询的是哪些数据。
在这里插入图片描述
分类:

  1. 按服务器数量分类:单服务器方案(Single Server)、多服务器方案(Multi-Server)。
  2. 按查询类型分类:Index PIR、Keyword PIR。

隐语目前支持的PIR方式:

  1. Single Server Index PIR : SealPIR。

  2. Single Server Keyword PIR:Labeled PSI。

1.2 隐语PIR功能分层

隐语PIR实现位置: 实现位置主要在SPU的代码库。 下层依赖YACL的密码库,上层secretflow层有相应的调用接口(pir_setup、pirquery及基于内存的pir_mem_query)。
在这里插入图片描述
隐语PIR预处理调用接口pir_setup: 提示pir_setup 单方任务,可以使用的secretflow单机模拟配置,或者直接调用spu的python接口。

'''
pir_setup 数据预处理,参数说明:
input_path:服务端数据文件路径,建议绝对路径
key_columns:Key对应的列名
label_columns:Label对应的列名,多列,用逗号分隔
oprf_key_path:服务端ecc密钥文件,32B,二进制文件
mum_per_query:每次查询的id数量
label_max_len:Label数据拼接后填充到固定的长度大小
'''
reports = spu.pir_setup(server='bob',input_path='/path/B_PIR_DATA.csv',key_columns='id',label_columns=['register_date','age'],oprf_key_path='/path/oprf_key.bin',setup_path='/path/setup_path',num_per_query=1,label_max_len=18,
)

隐语PIR调用接口pir_query:

#pir_query双方执行查询任务, 参数说明:
'''
客户端配置input_path:查询id对应的csv文件路径Key_columns:Key对应的列名output_path:PIR查询结果输出的文件路径
#服务端配置oprf_key_path:服务端ecc密钥文件,32B,二进制文件setup_path:预处理阶段结果输出路径
'''
# client
alice_config = {'input_path':/path/A_PIR_ID.csv’,'key_columns’: id','output_path':/path/sf_pir_out.csv’,
}
# server
bob_config = {'oprf_key_path':/path/oprf_key.bin,'setup_path':/path/setup_path’,
}
query_config = {alice: alice_config,bob: bob_config,
}
reports = spu.pir_query(server='bob’,config=query_config,
)

二、Index PIR-SealPIR介绍

Index PIR-SealPIR: 隐语实现的Index PIR基于SealPIR,SealPIR基于BFV的同态方案,SealPIR主要用到的多项式为密文加法、明文乘密文、密文替换。
在这里插入图片描述
SealPIR基于同态密码实现Index PIR的基本原理: 客户端将查询向量(0,1向量)使用同态算法进行加密,加密后发送给服务端,服务端使用该数据进行累积得待查询数据加密结果,返回給客户端;客户端解密得到带查询数据。
存在问题:请求的消息报文太大,包含了n个密文向量。
在这里插入图片描述
SealPIR主要贡献:
1、多个数据pack到一个HE Plaintext同态明文多项式:查询的db_index转换为plaintext_index。 原始数据B1、B2、B3pack到明文多项式P1,B4、B5、B6pack到P2,用户查询B4情况下,需要将数据库的查询index转换为多项式的查询index P2,服务端返回P2的加密值,客户端同态解密得到明文多项式,再依据pack的偏移找到B4的偏移系数拼接为明文数据。
在这里插入图片描述

2、查询向量压缩到一个密文:显著减少通信量,server端可通过计算expand得到查询密文向量。 客户端查询向量压缩将原始n个密文压缩到同态明文多项式,对该明文多项式加密得到查询密文,服务端得到查询密文使用expand扩展算法得到具体n个密文向量,再使用n个向量进行同态乘得到结果。
在这里插入图片描述

3、支持多维查询:多维查询将数据转换为 n ∗ n的矩阵,减少expand计算量。
在这里插入图片描述

4、支持多个查询:使用cuckoo hash支持同时进行多个查询。
在这里插入图片描述

PIR实现位置:
在这里插入图片描述

三、Keyword PIR- Labeled PSI介绍

Keyword PIR:隐语实现的基于Labeled PIR方案。 基本原理使用两个差值多项式,包括一个匹配多项式和一个Lable差值多项式,在匹配多项式P(key)为0情况下对应的差值多项式Q(key)的值对应三个带查询值。
在这里插入图片描述

Keyword PIR也使用了BFV的方案: 明文编码方式使用BatchEncode,每个位置上的数据支持基于位置的加法和乘法。
在这里插入图片描述
在这里插入图片描述

1、减少乘法次数和计算量: 客户端通过窗口机制减少发送密文个数,发送2的次方倍数。服务端可以通过分区将每个bin划分为若干个子集,每个子集对应一个差值多项式,降低相应的多项式次数。
在这里插入图片描述

2、使用extremal postage stamp bases减少通信量。
在这里插入图片描述

3、Paterson-Stockmeyer算法,减少密文乘法。
在这里插入图片描述

隐语label PIR的主要工作:

  1. 以微软的开源代码功能为核心;
  2. OPRF采用隐语的实现:支持的ecc曲线包括:FourQ, Secp256k1, SM2;
  3. Label的自动填充;
  4. 增加了服务的预处理结果保存功能:可以支持离线和查询(多次)两个阶段。

服务端预处理setuo阶段流程:

  1. 参数选择:对cuckoo hash、同态多项式明文、密文进行参数选择;
  2. 对服务端数据进行prf计算:prf得到256bit,前128bit根据截取用于匹配,后128bit作为对称算法密钥加密label;
  3. 根据prf前128bit截断后将数据插入Simple Hash;
  4. 对Simple Hash每一行分别划分bin bundle,并计算相应的差值多项式matching polynomial和label polynomial;
  5. 将插值多项式系统packing到同态算法明文。

在这里插入图片描述

客户端和服务端(query)阶段-流程:

  1. 客户端向服务端请求参数;
  2. 执行oprf协议;
  3. 计算查询值的同态密文幂集合;
  4. 使用同态私钥解密服务端返回的同态密文;
  5. 满足匹配条件时,使用oprf的后128bit解密得到label。
    在这里插入图片描述
    Lable PIR的主要参数: ItemParams每个元素在明文多项式对应的系数;TableParams包括cuckoo hash个数和表大小;QueryParams查询次数;SEALParams同态参数包括多项式次数(明文模/密文模)。
    在这里插入图片描述
    PIR实现位置:
    在这里插入图片描述

四、隐语PIR后续计划

在这里插入图片描述

这篇关于隐私计算实训营学习六:隐语PIR介绍及开发指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/866297

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设