2020年4月9日,国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》将数据定义为继土地、劳动力、资本、技术之后的第五大生产要素。在经济学中,能作为生产要素,至少要满足以下三个要求:一、它是进行社会生产经营活动所需的基本资源;二、它可以被用来进行市场交换;三、它可以形成价格与体系。
由此,我们可以看到数据的巨大价值。
但数据的挖掘和利用都会触碰到一个敏感地带——数据安全,尤其是在金融级数据安全方面,银行等金融机构在数据获取、存储、挖掘,以及使用方面的原则性极强,数据安全问题就变得更为敏感。
近期,腾讯公司发布《腾讯隐私计算白皮书2021》(以下简称《白皮书》),深入探讨隐私计算作为在数据融合应用过程中保障数据安全合规的关键技术路径、商业模式、应用场景、技术变革、产业趋势、法律问题及合规痛点,并从技术、应用、法律等视角对隐私计算的发展进行了展望。行业相关专家就隐私计算的问题做了深入的交流和探讨。
数据如此重要,却又如此敏感而脆弱
在现实商业环境中,包括银行在内的企事业单位都将数据地位大幅度拔高。比如,银行数字化转型战略中提到的ABCDMIX(AI、区块链、云计算、大数据、移动互联、物联网,以及5G、量子计算等尚未商用的前沿技术)里,大数据(D)独占一席位,而大数据又与其他六项在不同程度上保持着紧密的联系,比如,“大数据是人工智能的粮食”。
数据是如此重要,但利用起来却十分困难,想要达标“生产要素”,还有相当一段距离。其核心难点之一就在于隐私安全问题是数据治理的巨大挑战。
在银行业,这种挑战则更为艰巨。
数字化转型是银行的核心战略,在合法合规的前提下,跨越数据共享到隐私安全之间的鸿沟则是转型之路上大的障碍之一。
因为数据敏感而脆弱。
数据是脆弱的。中国电力科学研究院总公司人工智能应用研究所大数据应用室技术负责人,高级工程师张玉天表示,“数据本身易被复制窃取,归属权和使用权往往具有一致性。”这种数据特性本身就给隐私安全带来巨大挑战。
数据也是敏感的,尤其是在银行业。中国民生银行直销银行产品二中心总经理廖鹏近年来一直在关注金融隐私保护方面的技术应用。他表示,近年来,伴随着大数据和云计算的快速发展,客户的终端行为数据被广泛使用。因为商业银行所持有的客户身份信息和资产信息的隐私级别非常高,因此,银行在实践中会非常注重数据的安全和合规使用。
这里所说的“最小化采集,非必要性不采集”的原则是数据合法合规的基本原则,但在数据行业,这一原则又在数据共享和隐私安全之间形成天堑,阻碍了数据价值输出。
在数据与隐私安全之间“搭桥”成为大数据价值挖掘的重要一步。这,需要技术,也就是穿透数据共享与隐私安全阻碍的金融搭桥术。
商业价值大化和用户隐私保护大化之间的最优解
腾讯数据部总经理蒋杰认为,大数据的发展方向之一是:寻求商业价值大化和用户隐私保护大化之间的最优解。
那么,如何才能找到这个最优解呢?核心要点还是在于解决数据的敏感性和脆弱性。
关于数据的敏感性,廖鹏认为,银行业的态度和理念有利于数据行业的发展。他指出,银行对于隐私数据的采集和应用始终采取的是审慎、严谨、严守合规的态度,安全使用数据,保护客户隐私。按照“最小化采集,非必要性不采集”的原则,保持审慎谨慎的合规的经营理念。
关于脆弱性,张玉天认为隐私计算将为数据治理和运营带来解决方案。他指出,通过隐私计算技术来实现数据归属权和使用权的分离,从而让其他人也可以拥有数据的使用权,达到共享效果,最终达成的目的是多数据源协同利用,丰富数据维度,充分挖掘数据价值。
腾讯数据平台部总监陈鹏也认为,隐私计算可以在数据共享的合规性方面起作用。他指出,金融领域的数据共享合作,以往受限于法律合规性,无法挖掘数据要素的经济价值。隐私计算技术,不仅可以做到数据的“可用不拥”效果,满足法律法规对数据协作的合规要求,还可以为数据协作的各方提供更加安全的数据保障。
什么隐私计算?联邦学习技术是炒作出来的?
究竟什么是隐私计算?
《腾讯隐私计算白皮书(2021)》这样解释,“隐私计算(Privacy Computing)是一种由两个或多个参与方联合计算的技术和系统,参与方在不泄露各自数据的前提下通过协作对数据进行联合机器学习和联合分析。”
《白皮书》显示,隐私计算的应用是灵活的隐私保护技术。“隐私计算的参与方既可以是同一机构的不同部门,也可以是不同的机构。在隐私计算框架下,参与方的数据明文不出本地,在保护数据安全的同时实现多源数据跨域合作,可以破解数据保护与融合应用难题。常见的实现隐私计算的技术路径包括联邦学习、安全多方计算、可信计算等,此外,区块链也是隐私计算的重要补充。”
在隐私计算的诸多技术路径中,联邦学习被认为是当前最为成熟,且应用落地最多的一种技术。
简单地理解,联邦学习是在双方,甚至多方数据不出库的前提下,通过横向或纵向数据建模的方式得出数据结果输出。这样的做法,通俗地理解,就好像是在解算多元一次方程。虽然,我们不知道X是多少,也不知道Y和Z是多少,但联邦学习就是可以得出X+Y+Z=100的结论来,而这个100就是数据价值输出,也就是我们想要的结果。
中国电信云计算分公司大数据和AI研发总监温森茂表示,“因隐私安全问题的爆发导致数据供需双方的直接连接被斩断,联邦学习技术则被迫从幕后走到台前,又因其成本确实不高而被广泛接受。,该技术是当前最值得考虑的隐私计算技术,不存在炒作和泡沫。”
数据治理的未来
腾讯高级执行副总裁卢山认为,“数字治理的探索是一项系统性工程,仅仅依靠单一技术无法满足当前和未来复杂的治理需求,需要技术、法律等多种手段相结合的综合治理,才能更好地适应数字社会发展需要。”
适应数字社会发展方面,腾讯数据平台部副总经理刘煜宏在解读《白皮书》时给出了四个趋势研判:
第一,法律法规会进一步完善。隐私计算在接受约束的同时也会配合与驱动法律法规完善,这是整个隐私计算做产品化商业化的前提。
第二是应用场景方面。目前在金融、医疗比较多,后面会在其他行业进一步拓展,并改变数据应用的模式,有可能会加速基于数据协作协同的业务创新。
第三,通用型的平台和产品是一个趋势。过去是比较单一的产品,后面会转向多种产品和多种技术的融合,形成一个通用的隐私计算平台,以提供多种技术路径,满足多种需求,并提供更多的安全等级。
第四,多技术融合是隐私计算的大势所趋。隐私计算与云计算融合,以及软硬件协同,是各类企事业单位形成竞争力的重要抓手。