大数据模糊了涉密与非涉密数据的界限,颠覆了数据垃圾无秘密的传统认识,打破了以客观存在为基础的定密习惯。因此,稍有疏忽便有可能引发泄密事件,保密工作者应高度警惕。
大数据暗藏“窃密通道”
从非涉密数据中发现涉密信息。大数据基本理论告诉人们:“如果将海量的碎片化数据汇聚到一起,积少成多,形成大数据,然后通过数据分析,就可挖掘出隐藏在大数据表象背后的重要价值。”这一理论启示人们:如果将海量多元的非涉密数据通过大数据技术进行关联分析,在碎片化的信息之间建立某种整体联系,就可挖掘出隐藏在非涉密数据背后的重要价值。而这种“价值信息”因具有价值属性很可能涉及秘密范畴,从而使大数据具备了从非涉密数据中发现涉密信息的能力。比如,早些时候曝光的“棱镜”“X关键分”等美国网络监控计划已经充分表明,美国情报机构早已与“八大金刚”等网络巨头紧密合作,对全球通信系统和互联网进行大数据采集、挖掘和分析,从中搜集他国国家秘密和情报信息。因此,如果将非涉密数据置于一种失管失控的状态,就容易被不法分子轻易获取并从中发现有用情报。
使数据垃圾显现涉密价值。大数据基本理论告诉人们:“数据的价值并不仅限于特定的用途,它可以为了同一目的而被多次使用,也可以用于其它目的;判断数据的价值需要考虑到未来它可能被使用的各种潜在方式,而非仅仅考虑其目前的用途。”比如,在英国学者舍恩伯格所著《大数据时代》一书中,有一则关于“莫里的导航图”案例,就是运用数据垃圾再利用的典型案例。该案例讲述的是年轻的航海家马修·方丹·莫里利用库房里存放的航海书箱、陈旧的地图和图表,以及多年前海军上尉写的大量航海日志制作全新航海图的故事。虽然莫里能够接触到的航海日志都是陈年旧货,内容上也无章可循,但莫里和他的助手硬是把看似垃圾的航海日志绘制成表格并重新利用,成功创建了一张全新的更安全、更有效的航海图,取得了空前成功。由此可见,大数据再利用技术能够使所谓的数据垃圾释放新的能量,重现新的价值,这种价值一旦具有涉密属性,就会使数据垃圾显现涉密价值。
提前感知涉密事项的趋势与未来。基于相关关系分析基础上的预测是大数据的核心。A增长的同时B也增长,A降低的同时B也降低,在拥有海量A数据的基础上,就可以利用大数据技术捕捉B的现在和预测B的未来。舍恩伯格在《大数据时代》中提到,麻省理工学院两位经济学家通过一个软件在互联网上每天收集50万种商品的价格信息,然后把大数据和好的分析法相结合,就能比官方数据提前一步发现通货紧缩趋势。这种趋势涉及国家经济发展大局和未来走向,提前一步发现就是相当于掌握了核心机密。由此可见,大数据预测功能使人们有能力提前一步感知到涉密事项的发展趋势和未来状态,这一功能如果被不法分子利用,就可能演变为一种新型的窃密手段。
堵住大数据“窃密通道”刻不容缓
改变对待非涉密数据和数据垃圾的传统处理方式。大数据时代,非涉密数据、数据垃圾与涉密数据一样,具有特有的价值和可能的涉密属性。这就启示保密工作者不能再像以往一样把眼光局限在涉密数据上,而应在紧盯涉密数据的基础上,清醒地认识到非涉密数据以及数据垃圾存在的泄密风险。要充分认识到,包括数据坟墓、数据孤岛、数据垃圾、由涉密数据解密形成的非涉密数据、自然形成的非涉密数据在内的所有数据,都有其基本价值和潜在价值,都有可能是挖掘涉密信息,感知涉密事项趋势和未来的基础原料。保密工作者在处置非涉密数据和数据垃圾时,再也不能把非涉密数据绝对性地界定在涉密范畴之外,使其脱离了保密视线,也不能一味地把数据垃圾当作废弃物抛弃;相反,要采取有效措施,防范非涉密数据或数据垃圾成为失密泄密的新源头。
打破涉密数据以时长作为解密条件的传统标准。无论是《中华人民共和国保守国家秘密法》,还是《中国人民解放军保密条例》,对于秘密的管理都是以时长作为涉密信息定解密的一条主要标准。然而,在大数据背景下,涉密数据不仅具有基本价值,还具有潜在价值,仅仅依靠时间来判断涉密数据是否仍有使用价值和保密需要是远远不够的,因为保密期限的届满并不能完全代表涉密数据已经没有任何使用价值。因此,要打破涉密数据以时长作为解密条件的传统标准,引入价值判断这一新标准,将两者有效结合起来。在传统时长标准的前提下,组织专业的大数据公司和数据科学家,依托科学合理的应用模型,审核即将到期解密的涉密数据,判断涉密数据的有用性和价值残留,在此基础上,再来确定涉密数据是否按期解密。
严格把控大数据的共享共用。2015年8月,国务院常务会议通过《关于促进大数据发展的行动纲要》,提出要推动政府信息系统和公共数据互联共享,深化大数据在各行业创新应用。由此可见,在大数据时代,非涉密数据共享共用,充分挖掘数据价值将成为数据运用的新常态。但同时要看到,大数据模糊了涉密与非涉密数据的界限,并能运用预测功能从非涉密大数据中感知秘密的未来,这就要求将非涉密数据控制在一定的知悉范围内,防止过度扩散。这样做,又不可避免地会在一定程度上对数据运用产生反作用力。可见,恰当地平衡好两者的关系是必须解决的问题。保密工作者要认识到非涉密数据共享共用不是无原则滥用,共享是有条件的,共享共用的数据必须是非涉密或公开后带来的风险隐患是在可控范围内;而保密是无条件的,数据的共享共用必须确保其涉密内容的绝对安全。要做到既不因为数据共享共用而降低保密要求,也不能片面追求绝对安全而阻碍了大数据应有作用的发挥。