聚云动媒 首页 运营 数据运营 查看内容

解读隐私计算的“可用不可见”

2020-12-6 16:36| 发布者: 一灯| 查看: 165| 评论: 0

摘要: 隐私计算或者说是隐私保护计算,是从技术角度实现了数据流通与隐私保护之间平衡的最优解。隐私计算做到了数据的“可用不可见”,既实现了数据价值的流通与共享,又实现了数据的隐私保护。“可用不可见”是隐私计算的 ...

隐私计算或者说是隐私保护计算,是从技术角度实现了数据流通与隐私保护之间平衡的最优解。隐私计算做到了数据的“可用不可见”,既实现了数据价值的流通与共享,又实现了数据的隐私保护。“可用不可见”是隐私计算的精髓所在。数据的“可用不可见”,看似简单质朴,实则蕴含着大道理、大智慧。今天我就来解读下何为“可用不可见”。


1、商业角度

从商业角度理解,“可用”的目的是要解决商业问题,能为数据源和需求方带来价值,“不可见”是实际商业模式可运行、可落地的基本游戏规则,不遵从这个游戏规则,大家就难以开展商业合作。因此,“可用不可见”从商业角度理解,是让数据共享与协作可以成为商业事实、发挥数据要素价值的一种商业准则。在这个商业规则指引下,数据源可以安全的实现数据价值变现,需求方可以借助外部数据解决自身的业务问题,从而事实上完成了基于数据合作的商业闭环。


2、技术角度

从技术角度来看,“可用”是指对原始数据和隐私数据要进行加密等必要的技术处理动作,在计算环节要通过加密传输去完成数据的虚拟融合。“不可见”指的从技术角度屏蔽了敏感信息和隐私数据,为不可分享或者不能的数据加上一层安全的“防护罩”,以实现事实上对隐私数据的保护,也就是不明文泄露、不直接明示。所以,“可用”和“不可见”都是指借助技术上的处理来实现跨机构之间数据的“可算不可识”。


3、原理角度

名义上的提法是原理角度,实际上我指的“可用不可见”的具体内容。

先说说“可用”。

首先,要明确“可用”是对谁而言的。当然,“可用”的主体应该是业务方,业务方或需求方才有资格对数据源说对方提供的数据有没有价值、有多大价值。

其次,“可用”的内容后或对象是什么?“可用”的对象特指机构间达成合作的那部分需要加密保护的数据,当然业务方最终想要的并不一定是这部分加密后数据,而是基于这部分加密数据与自身数据完成联合计算后的结果,或者说是加密数据能带给业务方的价值,毕竟很多情况下业务方要的是数据的价值和结果,而非数据本身。

再者,“可用”是一种商业上的共识,是业务方对数据能带来价值的认可,是双方在数据安全协作方式上的认同,这是双方建立合作关系的基础。

还有,“可用”是有标准和要求的,而且不同机构对“可用”的标准认定还有可能不同,比如A机构认为一个计算任务5分钟完成是可接受的,B机构可能任务需要在1分钟内完成才算过关。最后,“可用”不代表“易用”,要达到商业上的易用,隐私计算要做的事情还有很多,除了算力需要提升,安全性保障、易解释性、透明性等都是从“可用”到易用需要解决的问题。


再来说一下“不可见”。

第一个问题:对谁可见,对谁不可见?这个涉及到数据的获取与访问权限,当数据源与业务方建立合作时,双方要约定可合作的数据内容,当然还包括哪些数据需要密文传输和计算。在数据操作权限上,可以设置哪些是具备“可见”资格的人,也屏蔽掉没有资格或不希望TA看到的人。比如,在联合建模场景下,参与建模的双方只能看到自己本地的数据,无法看到对方的数据。

第二个问题:哪些数据是不可见的?从大的原则上讲,数据源侧不愿意或不方便对外开放的数据都可以让它们“不可见”,或者在与业务方合作时对业务方进行加密处理。通常来说,在隐私计算领域,“不可见”指的是原始数据和敏感信息不离开本地数据库、不脱离私域,在联合计算时用密文进行传输和计算。当然,联合计算时所传输的中间参数不能倒推出原始值,也是一种数据“不可见”。

第三个问题:如何做到“不可见”?要做到“不可见”就需要隐私计算的相关技术。目前实现数据的“不可见”有三种技术路径,密码学、联邦学习和TEE(可信执行环境),MPC(多方安全计算)、差分隐私、同态加密等都在密码学范畴内,联邦学习作为分布式机器学习框架主要面向的是联合建模的场景,TEE是在类似安全屋的硬件可信环境下实现明文数据间的计算。

第四个问题:如何验证“不可见”?数据到底能不能被对方看得到,这是需要证明的事情。隐私计算厂商往往能自证安全,将各种Paper上的专业文章、已经验证过的技术进行工程化和商业化。为了增强说服力,还需要去找各种权威测评与认证机构做背书,比如工信部信通院的多方安全计算测评认证、银检中心的安全认证等。这些认证都是为了提升在行业客户面前的说服力。


那么,“可用”与“不可见”到底是什么关系?在笔者看来,两者之间是存在先后关系和因果关系的。先有“不可见”为基础,才能实现数据的“可用”,没有“不可见”的前提条件,后面的“可用”就不成立。所以,“不可见”是前提和手段,“可用”是结果和目标。从业务的角度理解,“可用”是商业模式的可实现,“不可见”是用技术手段来支撑商业的可落地。“可用”和“不可见”不能空口无凭、自说自话,两者同样都是需要被验证的。


4、法律角度

“可用不可见”只是从技术上实现的数据的安全与合规,但不一定合法,不具有法律效应。合规未必合法,合法也未必合规。隐私计算本身作为一种技术或工具,是具有中立性的,无所谓对错。就像一把刀,好人拿它来切水果,坏人可能用它来杀人,但不能因为坏人拿它来杀人了就说这把刀是一把“作恶的刀”。隐私计算是新生事物,业内目前对于隐私计算的合法地位尚无明确说法。


合法和合规还是有区别的。以金融业为例,合规(Compliance Troubles)是指商业银行的经营活动与法律、规则和准则相一致。从巴塞尔银行监管委员会关于合规风险的界定来看,银行的合规特指遵守法律、法规、监管规则或标准。广义的合法,是指不为法律禁止,与“违法”相对。狭义的合法,指符合法律规定。因此,“可用不可见”是商业语言,而非法律语言。


总而言之,“可用不可见”是数据要素时代实现数据安全流通的重要模式,是体现隐私计算精髓的关键词。隐私计算的“可用不可见”实现了数据所有权与使用权的分离,是对数据安全监管政策的遵从和妥协,也是推进数据要素市场化的关键技术与武器。




最新评论