隐私计算的范畴及应用

自从中国在2019年党的十九届四中全会上,首次将数据列为生产要素,而数据要素本身是含有敏感信息的,流通过程中面临着数据滥用、信息泄露、信息可被反推等隐私安全问题,因此隐私计算的技术就逐渐被大家关注起来。

政策法规

  • 2017年颁布的《网络安全法》和2021年颁布的《数据安全法》等基础法律法规明确了数据跨境流动应当进行安全评估。
  • 2021年8月,全国人大通过的《个人信息保护法》立足于数据产业发展和个人信息保护的需求,建立了个人信息合法处理的规则。
  • 2022年颁布的《数据出境安全评估办法》则进一步明确了数据出境的具体流程和要求,提出应对数据跨境流动采用分层分类管理的治理规则

个人的疑惑

  • 基于“数据要素”,《数据安全法》,《个人信息保护法》等的颁布,我个人从2021年开始关注“隐私计算”相关的技术,曾先后调研过联邦学习、安全多方计算、差分隐私、同态加密、零知识证明等相关的技术方向。
    • 这里的”隐私计算“,更多是从”数据共享“的角度考虑技术的适用性
  • 同时也关注到微众银行发行的 WeDPR(一系列即时可用的场景式隐私保护解决方案),也包括一些密码算法组件,诸如不经意传输、数字签名、零知识证明ZKP、可验证随机函数VRF等。

    • 这里的”隐私计算“,更多是从区块链的加持角度考虑技术的适配性,详细也可以参考 reference[5]

鉴于上述两种不同的路线,我在2022年初很长的一段时间内,都很迷惑”隐私计算”的范畴,未能看清技术路线及市场应用。

以下是从“隐私计算联盟”发布的《隐私计算白皮书2022》中挖掘的一些资料,逐渐理清了我的思路。

隐私计算

  • 在2001年,国外提出了“隐私增强技术(Privacy Enhancing Technologies, PETs)”的概念;
  • 在2016年,国内《隐私计算研究范畴及发展趋势》中正式提出了“隐私计算”一词。
  • 在“隐私计算联盟”发布的《隐私计算白皮书2022》中,将隐私计算的发展历程划分为以下4个阶段: image

狭义隐私计算

  • 狭义的隐私计算技术,是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,诸如安全多方计算、联邦学习、TEE机密计算、差分隐私、零知识证明、同态加密等这些核心的技术的使用或融合等,保障数据在流通和融合过程中的“可用不可见”等。

广义隐私计算

  • 随着全球范围内对于数据安全的不断重视,隐私计算的应用需求逐渐扩展到了包括数据采集、处理、发布、销毁等全生命周期的所有计算与操作。
  • 隐私计算已经转向了更为全面、完整的保护隐私信息的技术体系,产生了广义隐私计算的概念。

  • 广义隐私计算技术,作用于数据的处理、发布阶段,可以实现多方数据融合计算过程的“可用不可见”,“可控可计量”;
  • 区块链、可验证计算、访问控制、内容真实性验证及溯源等辅助融合技术为各阶段的验证、追溯、审计提供了有效保障;
  • 基于数据限制发布、数据失真的技术主要作用于数据发布的前序阶段,能有效降低原始数据中包含的隐私信息泄露风险。

采用密码学技术对数据进行脱敏

  • 密码学技术可用于数据脱敏,对敏感信息进行数据的变形,实现敏感隐私数据的可靠保护。
  • 数据脱敏规则,包括随机值、数据替换、对称加密、平均值、偏移和取整等,常常多规则配合使用。
  • 根据场景,可以分为静态和动态脱敏:
    • 静态数据脱敏是指对完整数据集进行大批量、一次性的整体脱敏,多采用ETL技术进行脱敏处理;
    • 动态数据脱敏是指对外部申请访问的敏感数据进行实时脱敏处理,多采用中间件技术对外部的访问申请和返回结果进行即时变形转换处理。

隐私计算的应用场景

联合营销

image

  • 此方案为银行拓展了通信运营商、互联网渠道商的高价值外部数据,实现了优质新客拓展、潜客精准投放、高价值客户线下运营三大经典金融场景的有机串联,补充了以往仅靠自身数据无法补全的客户画像缺失碎片;

智能医疗

  • 聚焦医疗数据分析和患者隐私保护的需求,采用隐私计算技术基于医疗大数据建立预测模型,实现医疗数据智能分析判断和智能化疾病风险评估,助力于疾病智能筛查与预防体系建立,加快医疗行业数字化转型;
  • 典型企业,如上海的翼方健数,及杭州的诺威科技。

智能反诈:基于全匿踪联邦学习的电信反欺诈

  • 在不暴露交集和非交集用户任何个人信息的前提下,实现电信网络诈骗风险预警模型构建;
  • 应用方式:(1) 电信反诈骗:在保证不泄露身份的前提下共享运营商+公安的电诈黑名单,提供给银行作为黑名单使用;(2)对转账用户进行诈骗识别:通过运营商受电诈的名单库及受电信诈骗的模型,分析转账者的风险。

三要素核验:

  • 需求:通过查询公安、社保、征信部门的数据库,核验用户姓名、身份证号、手机号等信息的正确性;
  • 当前状况:传统的三要素核验,大都基于 API 接口的形式,金融机构核验时会以日志的形式记录于服务器中,造成数据泄露。
  • 基于隐私计算的三要素核验:对隐私求交模块进行优化,使之在隐私求交之后,不返回交集内容,只是返回是否有交集,不暴露查询的内容。

Reference

  1. WeDPR-Lab是什么
  2. 《隐私计算白皮书2022》
  3. 行业观察-华泰证券深度报告:数据要素是数字经济的核心主线
  4. 数据要素的江湖才刚刚开始
  5. 拿什么保护你,我的”区块链“

results matching ""

    No results matching ""