解读隐私计算的“可用不可见”

2020-12-6 16:36| 发布者: 一灯| 查看: 320| 评论: 0

摘要: 隐私计算或者说是隐私保护计算，是从技术角度实现了数据流通与隐私保护之间平衡的最优解。隐私计算做到了数据的“可用不可见”，既实现了数据价值的流通与共享，又实现了数据的隐私保护。“可用不可见”是隐私计算的 ...

隐私计算或者说是隐私保护计算，是从技术角度实现了数据流通与隐私保护之间平衡的最优解。隐私计算做到了数据的“可用不可见”，既实现了数据价值的流通与共享，又实现了数据的隐私保护。“可用不可见”是隐私计算的精髓所在。数据的“可用不可见”，看似简单质朴，实则蕴含着大道理、大智慧。今天我就来解读下何为“可用不可见”。

1、商业角度

从商业角度理解，“可用”的目的是要解决商业问题，能为数据源和需求方带来价值，“不可见”是实际商业模式可运行、可落地的基本游戏规则，不遵从这个游戏规则，大家就难以开展商业合作。因此，“可用不可见”从商业角度理解，是让数据共享与协作可以成为商业事实、发挥数据要素价值的一种商业准则。在这个商业规则指引下，数据源可以安全的实现数据价值变现，需求方可以借助外部数据解决自身的业务问题，从而事实上完成了基于数据合作的商业闭环。

2、技术角度

从技术角度来看，“可用”是指对原始数据和隐私数据要进行加密等必要的技术处理动作，在计算环节要通过加密传输去完成数据的虚拟融合。“不可见”指的从技术角度屏蔽了敏感信息和隐私数据，为不可分享或者不能的数据加上一层安全的“防护罩”，以实现事实上对隐私数据的保护，也就是不明文泄露、不直接明示。所以，“可用”和“不可见”都是指借助技术上的处理来实现跨机构之间数据的“可算不可识”。

3、原理角度

名义上的提法是原理角度，实际上我指的“可用不可见”的具体内容。

先说说“可用”。

首先，要明确“可用”是对谁而言的。当然，“可用”的主体应该是业务方，业务方或需求方才有资格对数据源说对方提供的数据有没有价值、有多大价值。

其次，“可用”的内容后或对象是什么？“可用”的对象特指机构间达成合作的那部分需要加密保护的数据，当然业务方最终想要的并不一定是这部分加密后数据，而是基于这部分加密数据与自身数据完成联合计算后的结果，或者说是加密数据能带给业务方的价值，毕竟很多情况下业务方要的是数据的价值和结果，而非数据本身。

再者，“可用”是一种商业上的共识，是业务方对数据能带来价值的认可，是双方在数据安全协作方式上的认同，这是双方建立合作关系的基础。

还有，“可用”是有标准和要求的，而且不同机构对“可用”的标准认定还有可能不同，比如A机构认为一个计算任务5分钟完成是可接受的，B机构可能任务需要在1分钟内完成才算过关。最后，“可用”不代表“易用”，要达到商业上的易用，隐私计算要做的事情还有很多，除了算力需要提升，安全性保障、易解释性、透明性等都是从“可用”到易用需要解决的问题。

再来说一下“不可见”。

第一个问题：对谁可见，对谁不可见？这个涉及到数据的获取与访问权限，当数据源与业务方建立合作时，双方要约定可合作的数据内容，当然还包括哪些数据需要密文传输和计算。在数据操作权限上，可以设置哪些是具备“可见”资格的人，也屏蔽掉没有资格或不希望TA看到的人。比如，在联合建模场景下，参与建模的双方只能看到自己本地的数据，无法看到对方的数据。

第二个问题：哪些数据是不可见的？从大的原则上讲，数据源侧不愿意或不方便对外开放的数据都可以让它们“不可见”，或者在与业务方合作时对业务方进行加密处理。通常来说，在隐私计算领域，“不可见”指的是原始数据和敏感信息不离开本地数据库、不脱离私域，在联合计算时用密文进行传输和计算。当然，联合计算时所传输的中间参数不能倒推出原始值，也是一种数据“不可见”。

第三个问题：如何做到“不可见”？要做到“不可见”就需要隐私计算的相关技术。目前实现数据的“不可见”有三种技术路径，密码学、联邦学习和TEE（可信执行环境），MPC（多方安全计算）、差分隐私、同态加密等都在密码学范畴内，联邦学习作为分布式机器学习框架主要面向的是联合建模的场景，TEE是在类似安全屋的硬件可信环境下实现明文数据间的计算。

第四个问题：如何验证“不可见”？数据到底能不能被对方看得到，这是需要证明的事情。隐私计算厂商往往能自证安全，将各种Paper上的专业文章、已经验证过的技术进行工程化和商业化。为了增强说服力，还需要去找各种权威测评与认证机构做背书，比如工信部信通院的多方安全计算测评认证、银检中心的安全认证等。这些认证都是为了提升在行业客户面前的说服力。

那么，“可用”与“不可见”到底是什么关系？在笔者看来，两者之间是存在先后关系和因果关系的。先有“不可见”为基础，才能实现数据的“可用”，没有“不可见”的前提条件，后面的“可用”就不成立。所以，“不可见”是前提和手段，“可用”是结果和目标。从业务的角度理解，“可用”是商业模式的可实现，“不可见”是用技术手段来支撑商业的可落地。“可用”和“不可见”不能空口无凭、自说自话，两者同样都是需要被验证的。

4、法律角度

“可用不可见”只是从技术上实现的数据的安全与合规，但不一定合法，不具有法律效应。合规未必合法，合法也未必合规。隐私计算本身作为一种技术或工具，是具有中立性的，无所谓对错。就像一把刀，好人拿它来切水果，坏人可能用它来杀人，但不能因为坏人拿它来杀人了就说这把刀是一把“作恶的刀”。隐私计算是新生事物，业内目前对于隐私计算的合法地位尚无明确说法。

合法和合规还是有区别的。以金融业为例，合规（Compliance Troubles）是指商业银行的经营活动与法律、规则和准则相一致。从巴塞尔银行监管委员会关于合规风险的界定来看，银行的合规特指遵守法律、法规、监管规则或标准。广义的合法，是指不为法律所禁止，与“违法”相对。狭义的合法，指符合法律规定。因此，“可用不可见”是商业语言，而非法律语言。

总而言之，“可用不可见”是数据要素时代实现数据安全流通的重要模式，是体现隐私计算精髓的关键词。隐私计算的“可用不可见”实现了数据所有权与使用权的分离，是对数据安全监管政策的遵从和妥协，也是推进数据要素市场化的关键技术与武器。

收藏分享邀请

上一篇：大健康领域的商业模型：消费贡献理念的实践下一篇：从0到1，搭建经营分析体系

解读隐私计算的“可用不可见”

最新评论

相关分类