满足Local Differential Privacy(LDP)的五种编码的介绍


Local Differential Privacy(LDP)可以在收集用户的敏感数据时,保护用户的隐私信息。神奇的LDP,定义是任意两个输入 v 1 , v 2 v_1,v_2 v1,v2输出同一个值 y y y的概率的比值在 e ε e^\varepsilon eε界里 :

如果一个算法 A A A满足 ε \varepsilon ε-local differential privacy( ε \varepsilon ε-LDP),其中 ε ≥ 0 \varepsilon\geq0 ε0,当且仅当对于任意的输入 v 1 , v 2 v_1,v_2 v1,v2,有
∀ y ∈ R a n g e ( A ) : P r [ A ( v 1 ) = y ] ≤ e ε P r [ A ( v 2 ) = y ] , \forall y\in Range(A): Pr[A(v_1)=y]\leq e^{\varepsilon}Pr[A(v_2)=y], yRange(A):Pr[A(v1)=y]eεPr[A(v2)=y],
其中 R a n g e ( A ) Range(A) Range(A)表示算法 A A A的所有可能输出的值。

LDP的基本应用是频度估计(即,从n个数据里,统计每个值的出现次数),它可以归结为下面的3个步骤:

  1. Encode即编码,由每个用户执行:
    – 输入一个值 v v v;输出一个编码后的值 x x x,即 x = E n c o d e ( v ) x=Encode(v) x=Encode(v)
  2. Perturb即扰动,由每个用户执行:
    – 输入一个编码后的值 x x x,输出扰动后的值 y y y,即 y = P e r t u r b ( x ) = P e r t u r b ( E n c o d e ( v ) ) y=Perturb(x)=Perturb(Encode(v)) y=Perturb(x)=Perturb(Encode(v)),后面简记为 y = P E ( v ) y=PE(v) y=PE(v)
  3. Aggregate即收集,由收集者(Aggregator)执行:
    – 将所有用户扰动后的值 y y y收集,输出处理后的信息,如频度估计。
    在这里插入图片描述
    本文将介绍17-USENIX-Locally Differentially private Protocols for Frequency Estimation1中所描述的满足LDP的五种编码方法,对它们的比较主要是两个指标:
  4. 隐私保护程度 ε \varepsilon ε
  5. 频度估计(frequency estimation)的方差 V a r ( c ~ ( i ) ) Var(\tilde{c}(i)) Var(c~(i))

1. Basic RAPPOR 简化版

规定输入 v v v的值是有限的,为 d d d个。不失一般性,我们 v v v 1 1 1 d d d的整数,即 v ∈ [ 1 , d ] , v ∈ N v\in[1, d],v\in N v[1,d],vN

  1. Encoding: 将输入的整数转化成长度为 d d d 的01串,对应位取 1 1 1,其余位取 0 0 0,即 E n c o d e ( v ) = B 0 Encode(v)=B_0 Encode(v)=B0,其中 B 0 B_0 B0是长度为 d d d的01串,并保证 B 0 [ v ] = 1 , B 0 [ i ] = 0 , i ≠ v B_0[v]=1,B_0[i]=0, i\neq v B0[v]=1,B0[i]=0,i=v。如 d = 5 , v = 3 d=5, v=3 d=5,v=3,则 B 0 = 00100 B_0=00100 B0=00100;
  2. Perturbing: (Rapper是有两次扰动的,此处简化仅考虑一次)01串 B 0 B_0 B0的每一位分别以 p p p(一般来说, p ≥ 1 2 p\geq \frac{1}{2} p21)的概率保持,以 q = 1 − p q=1-p q=1p的概率反转,产生扰动后的01串 B 1 B_1 B1,即:
    P r [ B 1 [ i ] = 1 ] = { p , i f B 0 [ i ] = 1 , q = 1 − p , i f B 0 [ i ] = 0. Pr[B_1[i]=1]=\left\{ \begin{array}{cr} p, &if B_0[i]=1, \\ q=1-p, &if B_0[i]=0. \end{array} \right. Pr[B1[i]=1]={ p,q=1p,ifB0[i]=1,ifB0[i]=0.
  3. Aggregation: 收集者可以收集到所有用户(设有n个)扰动后的01串 B 1 B_1 B1,按位估计出原始的个数。记第 i i i位为 1 1 1的用户个数为 c ( i ) c(i) c(i),依此可以估计出扰动前 B 0 B_0 B0中第 i i i位为 1 1 1的用户个数 c ~ ( i ) \tilde{c}(i) c~(i),扰动前的第 i i i 位为 1 1 1的有 p p p的概率保持,为 0 0 0的有 q = 1 − p q=1-p q=1p的概率反转:
      p ⋅ c ~ ( i ) + q ⋅ ( n − c ~ ( i ) ) = c ( i ) ⇒   p ⋅ c ~ ( i ) + ( 1 − p ) ⋅ ( n − c ~ ( i ) ) = c ( i ) ⇒   c ~ ( i ) = c ( i ) − ( 1 − p ) ⋅ n 2 p − 1 . \begin{aligned} &\ p\cdot\tilde{c}(i)+q\cdot(n-\tilde{c}(i))=c(i) \\ \Rightarrow&\ p\cdot\tilde{c}(i)+(1-p)\cdot(n-\tilde{c}(i))=c(i) \\ \Rightarrow&\ \tilde{c}(i)=\frac{c(i)-(1-p)\cdot n}{2p-1}. \end{aligned}  pc
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值