近日,谷歌、Facebook、微软和Twitter四大互联网巨头联手宣布了一个“数据传输大计”,旨在号召不同平台间数据的无障碍传输。可移植性和互操作性是云技术创新和竞争的核心,如果真能得以实现,这无疑是一个伟大历程的开端!
今天,谷歌、Facebook、微软和Twitter联合宣布了一项名为“数据传输计划”(Data Transfer Project)的新标准,旨在打通数据传输壁垒,成为在不同平台之间移动数据的新方式。谷歌表示,该计划允许用户“将数据直接从一个服务传输到另一个服务,无需下载和重新上传。”
该系统的当前版本支持照片、邮件、联系人、日历和任务的数据传输,这些数据从谷歌、微软、Twitter、Flickr、Instagram、Remember The Milk和SmugMug的公开API获取。这类转移很多可以通过其他方式来完成,但是参与者希望这个项目能够成为比传统API更稳健、更灵活的替代方案。微软呼吁更多的公司参与进来,并补充说:“可移植性和互操作性是云技术创新和竞争的核心。”
不需要上传和下载,直接在服务器间传输
同时还有一份描述其范围的白皮书。大部分代码库包含“适配器”(adapter),可以将私有API转换为可互操作的传输,比如,使得Instagram的数据可传输至Flickr,反之亦然。在这些适配器之间,工程师们还构建了一个系统来给传输中的数据加密,为每次传输发出前向密钥。值得注意的是,该系统专注于一次性传输,而不是许多API支持的连续互操作性。
“可移植性的未来将需要更具包容性、灵活性和开放性。”白皮书写道。 “我们对这个项目的希望是,它将在任何两个面向公众的产品界面之间建立连接,以便直接导入和导出数据。”
到目前为止,大部分编码都是由谷歌和微软工程师完成的,他们长期以来一直在修改更强大的数据传输系统。根据Google Takeout产品经理Greg Fair的说法,这个想法源于对下载后管理数据的可用选项感到沮丧。如果没有明确的方法将相同的数据导入到不同的服务中,像Takeout这样的工具只能解决问题的一半。
“当人们拥有数据时,他们希望能够将数据从一种产品转移到另一种产品,而他们却不能,”Fair说。 “这是一个我们无法单独解决的问题。”
一个完整的开源应用程序生态系统
大多数平台已经提供了某种数据下载工具,但这些工具很少与其他服务连接。 欧洲新的GDPR法规要求工具提供给定用户的所有可用数据,这意味着它比从API获得的数据更全面。 除了电子邮件或照片,还可以找到许多用户无法收集的位置历史记录和面部识别配置文件等棘手的数据。 有一些项目试图利用这些数据 (如Digi.me) 建立一个完整的应用程序生态系统 。但在大多数情况下,它最终会被放在用户的硬盘上。下载工具作为证明用户确实拥有他们的数据,但是拥有你的数据和使用它已经变成完全不同的事情。
该项目被设想为一个开源标准,许多参与其中的工程师说,如果该标准成功,治理方面的更广泛转变将是必要的。“从长远来看,我们希望有一个由行业领袖、消费者团体和政府团体组成的联盟,”Fair说。“但在我们有一个合理的临界量(critical mass)之前,这不是一个有趣的对话。”
对于数据共享项目来说,这是一个微妙的时刻。Facebook的API曾是剑桥分析公司 (Cambridge Analytica) 丑闻的中心,该行业仍在准确地评估应该向多少用户提供自己的数据。谷歌一直在与自己的API丑闻作斗争,因第三方电子邮件应用程序处理Gmail用户数据不当而受到强烈抗议。在某些方面,拟议中的联盟将是一种管理这种风险的方式,将责任分散给更多的群体。
数据安全与隐私和巨头的数据垄断问题
尽管如此,剑桥Analytica事件的阴影仍然对企业愿意分享的数据量造成了限制。当我向Facebook询问这一工程对数据隐私造成的影响时,后者强调,将API级别数据的控制在公司手中时非常重要的。
“我们总是首先考虑用户数据的保护,”负责Facebook数据下载产品的David Baser说。“API的一个好处是,作为数据提供者,我们能够关闭数据管道,或者对其使用加上限制条件。如果使用数据下载工具,数据就离开了我们的控制,就真的失控了。这时如果有人想将这些数据用于不良目的,Facebook真的无能为力。“
与此同时,科技企业现在面临着比以往更加严重的反垄断问题,这类问题的核心都与数据访问有关。科技巨头们的竞争对手很少。当这些巨头面临关于联邦监管和技术垄断的新问题时,共享数据可能是最难以自控的问题之一。
对于那些因数据隐私丑闻而陷入困境的公司来说,想通过这个项目来补救是不大可能的,不过来自开放技术研究所所长 Kevin Bankston 等外界人士的推动比以往任何时候都更加重要,对Facebook而言尤其如此。“我的主要目标是确保开放的价值不会被遗忘,”Bankston说。“如果你担心这些平台的功能过于强大,那么提高数据的便携性可能是一种平衡的方式。”