中国IDC圈4月28日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。28日上午,在数据中心联盟、中国智慧城市产业技术创新战略联盟协办的地方大数据产业发展论坛上中国信息通信研究院高级工程师 韩涵做了精采演讲。
以下是韩涵演讲实录:
韩涵:感谢今天到会的各位领导,也感谢数据中心联盟的孙明俊秘书长,很高兴有这个机会跟大家分享一下我们之前做的一个研究报告,就是大数据的社会经济价值分析及地方大数据发展的问题思考。因为我们单位也是工信部大数据“十三五”发展规划的牵头编制单位。因此,我们在规划编制过程当中走访了很多大数据企业,也和各个地方的领导们进行了一些交流。所以,这些研究的一些结果也是基于我们整个规划的一个编制过程。
主要分为三个方面:第一,大数据作为经济要素的一个价值分析。第二,地方发展大数据,以及大数据产业和政府大数据治理应用等方面的一些主要的困境和分析。第三,数据资源利用的基本问题思考。
首先,从世界范围之内,大数据就已经是国家的战略高度,我们国家2015年发布了大数据的行动纲要。纵观2015年,近三年国家在信息技术领域发布的相关文件,2015面对信息技术的文件频率的发布,尤其在数据资源领域连续发布了大数据领域国务院的文件,可以看到已经把大数据提升到国家战略的高度。同时,全国范围之内,大数据产业又在蓬勃发展,据我们信通院统计,目前有23个省出台了74项大数据相关的政策文件,而各个地方也在积极的建设大数据的产业园区。
同时,我们认为大数据为什么能够提升到国家战略这样一个层次?首先,它符合这一届政府整体来说深化改革,提升政府治理能力的这样一个初衷。然后,通过数据开放,以及打破部门之间的壁垒来实现整个国家的行政体制改革的一些推动作用。另外,大数据也符合当前促进经济转型升级,通过新一代的技术手段促进传统产业的融合发展的这样一个理念。所以,从政治跟经济两个方面大数据都非常重要。
另外,我们简单看一下大数据对国家经济的这样一个分析,首先通过国家生产函数进行建模,主要是通过看数据资源,通过比如开放共享,或者流通交易,流到网络和虚拟空间当中的数据流量,然后简单的估算对咱们国家信息产业,以至于国家GDP的主要作用。然后,这里信息的增长量主要来自于网络上的流量。用户增长量主要来自于网民的数量,经过这样一个简单的测算,我们可以看到当数据流量增长10%的时候可以拉动新兴产业的投资增长1.1%。
然后,我们再次比对一下国家从2016年开始信息产业产值以及跟国家GDP之间的关系。我们可以进行下一步的估算,大数据对信息产业产值的拉动增长作用来估算对于国家GDP的增长作用。然后,在正常的情况下可以看到,信息产业的产值是20%,因此我们得出来的结论,用2013年的数据来看,经过开放数据信息汇对于我国开放数据进行测算,2013年我们国家完全进行了数据开放共享,将对GDP提升0.17%。如果按照这个趋势发展,到2017年的时候这个比例又接近2%。这个比例已经相当的可观,也就是实现了完全的数据开放,到2017年的时候将带来国家GDP增长2%这样一个大的数据。
另外,对比一下麦肯锡、欧盟、澳大利亚Laateral Economics、英国莎士比亚独立报告,麦肯锡的结果和我们的结果是比较接近的。另外,我们看一下信息的开放共享和经济增长之间的关系。具体是由于国家经济增长导致了信息量的增长还是信息量的增长真的可以推动经济的增长?这个因果关系之间还是需要一个实际数据来支持。因此,我们用了Granger的因果关系做了一个假设,比较小的就是具体的假设,它的意思就是信息的增长对经济增长是比较明显的,也就是从我们今天开始推动数据资源的流动,可能两到三年之后,落实到国家经济增长当中的作用比较明显。
大数据之所以能够促进国家经济增长的分析,首先它具有外力的效应,除了大数据本身对本行业的促进作用,大数据本身这个产业的产值,由于它和传统产业的结合,会带来其他产业,比如网络基础设施等的增加,实现外力效应,实现GDP的增长。另外,大数据连接生产者和消费者带来新的增长需求。这也是麦肯锡的一个测算报告,有了大数据之后,有了电商之后,新的消费能够占到30%几,而对于传统消费的替代60%几,所以还是有了大量的新的市场跟消费的产生。另外,大数据的同时也降低了社会资源的垄断,打破了一些行业壁垒,比如现在比较流行的打车软件,使得叫车服务变得更加便利,降低成本,这是福利效应的体现。所以,使劳动者花同样的价钱获得了更高的服务。大数据通过连接不同的领域,增强了信息的活力,这是连接效应的体现。可以看到大数据从上面以及有下方来看,都是对经济体现有重大的价值。
第二,分析一下地方大数据发展面临的基本困境。相信地方的领导有一些比较深的体会。首先,数据采集方面,当前咱们国家信息系统都是纵强横弱,所以,落实到数据采集的环节,往往都是纵向需求压到最基层的服务,横向也是一样,而基层既要承担交通委、卫计委的任务,还要承担县委的任务,所以他们的人员不足,在这样的情况下,往往基层数据采集的数量很难保证,或者没有统一的标准,材料的数据包各个部门都是完全一样的,但是各个部门之间需要的标准是不一样的。所以,这个在咱们国内有一个口号,叫做“顶上千根,线下面一根针”。所以这样数据的采集质量很难提升。另外,属地化的问题,所以目前我们从横向的层面,地域的管理者很难拿到全部的数据。后面也包括一些历史的珍贵数据不够重视,比如长江三峡近来的时候当时一些地貌和一些比较细节的数据居然没有保存下来。还有一些实时的数据,还有一些静态数据获取特别困难。
数据开放的问题,这个也是大家关注度高的一个方面。这个方面的问题也是非常清晰的,主要是数据开放的机制和动力不足。目前国外来说,很多比较先进的地方进展到黑名单的一个状态,就是负面清单。咱们国家在比较先进的几个地方,包括今天上午分享的几位地方领导,比较好的做法一直是白名单,所以,推进了更高的数据资源可以开放,发挥更大的社会经济价值,我们也提了一些建议。首先,从内部的发布机制,初期采集有限的白名单逐步向黑名单发展。第二,公示机制,第三方评估发布结果及排名。然后是KPI的机制,最后是数据资产化的管理机制,数据整个采集的全生命周期都应该作为一种珍贵的资产进行管理,我们国家从2004年中办24号文,《关于加强信息资源开发利用的指导意见》就已经提出这个先进的概念,迄今为止已经有十余年的时间,真正实现数据资产化管理还是一个比较漫长的道理。
数据共享的问题,这个问题比数据开放更难一些,因为涉及到很多部门内部的实际利益。当前我们国家的普遍做法是数据开放共享平台。然后,我们工信部怀部长在2008年的时候就已经从电子政务国标委的组织当中发布了关于电子政务相关的国家标准和共享开放平台的方式实现部门数据的共享。但是,这样有一个很大的问题,其实这种方式数据是不落地的,某一个数据集向另外一个部门提供需求,并没有一个统一的空间融合所有部门的数据,而很多新的数据和数据资源的价值在一开始很难预料到,这个需要数据先融合汇聚,后挖掘它的价值,这也是数据共享问题当前很难解决的一个核心。
这个我们也做了一些建议。建立数据的分级和分类机制,对于不涉及秘密和敏感信息,建议在政府内部全面共享,对于不宜全面共享的数据,可以按照数据的级别进行正向共享,对于不太敏感的数据,我们希望用户以融合型、大平台的方式实现数据内部的共享,并且设置负责人制度,专门负责这个事情。
统筹汇聚的问题,当前咱们国家的智慧城市、数据平台、信息平台非常多,在各个层级,县一级,市一级都有,不同部门都有,所以数据统筹是一个很大的问题。但是,我们也可以比如说先做一些逻辑的集中,然后把现有的这种信息平台和数据库能够实现连接,这样也能够实现数据资源比较有效的一个整合和汇聚。然后,以资料评审做一个抓手,逐步实现数据资源的汇集和信息资源平台的连接。
数据流通交易的问题,这个是更便市场化的问题,但是当前在各个地方和数据交易相关的机构或者平台建设非常火爆。当前咱们国家事实上数据交易领域还是属于两个极端。一方面大量的数据黑市存在,很多比较猖獗的人不停的贩卖数据,使得个人信息泄露。另一方面大量的数据冻结在数据库当中,根本无法流动,尤其是一些国有的数据资源,这样使得一些合法机构难以获得稳定的数据资源,也使得规范正当渠道的数据获取变得非常困难。所以我们希望数据像管道和阀门一样在有序的状态之下流动,速度是快的,像水流一样。
当前各个地方建立的数据交易组织比较多,但是目前还有一些处于探索阶段,有一些问题难以得到根本性的解决,比如政府数据资产到底是不是应该被交易等等的问题还处在一个探索的初期阶段。所以,这个问题也是当前面临的一些挑战,先行先试的范围和边界在什么地方。
最后,我们认为数据是具有资产属性的,我们平时说责权利,我们看看数据的责权利怎么划分?国外把数据认定为是一种资产,美国、英国的政府部门已经在文件当中写到数据是资产的位置。而我们国家从2004年中办34号文就已经提出信息资源作为生产要素的这一个非常先进的理念和2015年大数据行动纲要其实是一脉相承。所以,数据作为一种资产化的属性在世界范围之内已经被认可了。
数据的权利归属问题,首先看看欧洲和美国两大主要经济体的做法。他们都普遍认为公共的信息资源是归全民所有的。所以,开放是一种义务,美国说是政府数据是全民的有价资产,英国是通过开放数据授权,广大使用者均可以获得,这也是全民所有的概念。第二,我们认为个人还是应当对自己的数据享有安全的控制权。从财产权来说,个人的数据等同于其他有价的数据资产,人格权来说,个人数据也应该等同于肖像权,所以我们认为数据主体应该对个人数据有完全的控制权利。但是,我们说虽然个体对数据有控制权,但是一些大型的公司,互联网公司通过自身信息系统的改造对于自身用户数据的处理也获得很大的数据资源,我们也承认对这些数据资源的所有权利。承认企业对于这些数据的所有权利,同时也是提升企业利用这种数据来创造这种财富价值的一种保障,更多的鼓励企业充分的挖掘大数据的价值,同时也是抑制了黑市的交易。
对于咱们国家比较复杂的情况来说,我们国家的机构可以分为政府、事业单位、国企,以及其他企业跟个人。同时,我们国家覆盖的数据范围包括关系国家安全的数据,关系商业秘密的数据,个人隐私的数据等,这个情况是比较复杂的。另外,刚刚我们讲的网信办的相关的管理,根据网信办的内部的指导意见,我们国家公共的信息资源责任主体也是包括富有公共职能的政府部门、事业单位,以及金融政府部门授权的企业单位,这些部门都掌握国家公共的信息资源。所以,数据的界定单位是很难界定清楚的,他们在自己承担成本为国家的数据在维护。
另外,我们国家的《个人信息保护法》还不是很完善,所以个人数据、企业数据、公共数据的边界很难靠法律的层面界定。数据的权利属于谁?一种是政府+公共的数据,我们称之为公共的数据资源,对于公共的数据资源,我们按照国际的惯例,认为应该是全民所有的,非公共的数据资源我们认为是企业跟个人私有的。如何来划分中间的那条红线,我们也是参考了当前国内外的一些典型做法,大致给出了几条原则。
第一,用法律或者行政手段及公共财政采集的数据,或者通过政府特许经营的权利采集的数据,这条把我们国家大量的跟公共信息资源相关的与不同性质的企业掌握的这部分数据都涵盖在内了,尤其政府特许经营,包括国有企业,包括垄断行业的数据。
第二,数据来源的业务部门属于公共事务的领域。经过这两个基本的原则,我们可以大致把之前复杂的单位性质和数据权限划分成这样的两种类型,公共数据资源和非公共数据资源。公共数据资源是不是一定要开放?这个到不一定是完全的开放,我们给出了原则,不公开对民众公共利益产生不良影响。根据这种划分方法,大致给出了这样的一个细分准则,对于不含有国家安全、商业秘密和个人隐私的公共数据资源应当以政府的手段开放共享,不含有安全隐私的非公共数据资源应当以市场部门的手段进行流通交易,这样把政府和市场进行了划分。我们看一下数据的利益如何划分?首先,数据作为一个资产的角度,评估它的价值和方法有三种,成本法,市场法,就是参考市场当中其他数据的价值,通过市场手段直接溢价。
第三,收益法,评估这个数据未来产生的收益。美国为代表的方式是低成本的模式,美国的数据开放收取一些打印、装订非常低廉的费用,主要通过对数据的开放,繁荣大数据产业,促进税收,靠税收反哺信息系统的投入。欧洲的政府是采取补偿的模式,并且政府的这些数据政府部门也是可以通过加工利用可以为用户提供一定的成本。这个结果,从数据的经济价值来看,美国模式的经济价值远远高于欧洲。所以,我们国家当前采取美国模式的道路也是有它一定的合理性。
回到刚才划分的空间,数据带来的利益应该如何划分?公共数据资源,适用于成本法,由国家财政给予补贴。包括建设成本、运维成本,尤其是运维成本,很多一次性投入之后,后续的成本没有人来承担。还有历史与现实的差价,升级系统的成本等。非公共数据适用于市场法,由市场手段获取收益。而含有安全隐私的公共数据资源应该以成本法来评估数据在政府部门内部共享的这种成本,然后给予财政补贴,而非公共的数据资源如果有安全隐私就不应该对外获取收益了。这种成本法对政府补贴也给出两个基本原则。第一,鼓励基础的数据开放,对于基础数据资源我认为开放还应该是有义务,然后向民众实现更大范围之内的开放。第二,我们也是鼓励免费的开放服务,采用低收费,或者免费的模式。
第四数据的责任。首先,保护个人信息和个人隐私,这个在世界范围之内都是这样的。我们国家有相关的法律和部门规章来保护用户的个人隐私。发达国家往往有专人审查的隐私官的制度。初期一般是模糊期,需要进行探索,同时由白名单开始,由正面清单开始,经过一段时间的探索,逐步实现负面清单或者是黑名单这样的一个制度。然后,同时有一些免责的法律条款,这样一些地方法律也开始现行了。另外,数据全生命周期的责任,从采集、清洗、融合、分析、销毁等。
数据中心联盟迄今为止有170多家单位,也有地方的政府部门在参与。我们希望借助联盟这样一个平台加强产业界和政府之间的交流和沟通,目前我们联盟内部设立了大数据委员会,包括大数据工作组和大数据征信工作组,对接不同的行业资源,另外有一个区域联络的委员会,力图实现政府跟企业之间的桥梁作用。联盟内部的170多家单位,包括三大运营商,也有当前国内大的这些所有的互联网公司,以及还有一些国外的企业作为一些观察员。我们区域联络委员会来说,它的主要职能就是从数据中心、云计算和大数据信息技术的领域加强产业界跟政府之间的沟通。目前委员会的委员也包括主要的IT企业和地方政府的相关领导,已经有一系列委员会的成立。未来可能会希望更大范围之内的来实现产业跟政府之间的桥梁作用,也会开设一些公开课或者人才培训,还有对接企业跟政府之间的双份诉求,也可以协助咱们相关政府部门开展一些信息上报的工作。迄今为止我们也给工信部和网信办都上报了多篇内容。以上就是我今天的分享,谢谢大家!