大数据225

大数据”是“数据”的质变

从大数据与技术发展的关系角度来看,数据是以电子设备为载体的,二进制字段的表达。与数据有关的操作首先是计算机底层的技术问题——即通过一定的代码算法,实现数据的获取、使用、存储等。伴随着计算机与数据库等技术的不断发展,加之网络的出现,网络计算能力越来越强、数据获取范围越来越广、数据的使用用途也越来也多。所以“大数据”并不仅仅意味着数据量的“大”,更意味着数据的价值变“大”了。早在2001年,麦塔集团(META Group)(后被Gartner收购)分析师道格·莱尼(Doug Laney)提出大数据管理的3个方向——即时处理的速度(Velocity)、格式的多样化(Variety)与数据量的规模(Volume)。在此基础上,Gartner、IDC等国际咨询机构又提出了数据准确性(Veracity)、数据可视性(Visualization)与合法性(Validity)等要求。     

从大数据与信息的关系角度来看,大数据指的是规模和格式前所未有而又相互关联的大量数据,搜集自网络空间和实体世界,技术人员通过高速、多方分析后,可以从中挖掘出甚至超出原有数据量级的信息量。这意味着,只有在大数据环境下才能够出现天量的信息。而对于这些信息载体进行再次或者多元的“大数据”分析,将会爆发出更多的数据与信息。因此,有学者提到,大数据时代的技术和现实变革是围绕着数据的“量”和“价值”展开的。     

从大数据与网络空间的关系角度来看,海量的数据和相互之间的结构性、非结构性关联,使得大数据充分地扩展了网络空间。经过几十年的发展,人类社会早已经将自己的社会活动拓展到网络空间。网络空间不再是虚拟的角落。人类一方面利用大数据进行分析、拓展网络空间,一方面也在不断向网络空间贡献数据。     

从大数据与社会效用的关系角度来看,诸多国家逐渐意识到大数据存在十分重要的战略价值。在国家战略层面,我国率先倡议网络空间治理的多个宏观原则——“尊重维护网络空间主权、和平利用网络空间、依法治理网络空间、统筹网络安全与发展”。这些原则映射到网络空间治理的微观层面就是大数据治理。在商业战略层面,大数据的发展让社会步入了数字经济时代。大数据所特有的基于数据分析、挖掘、获取和交易所产生的经济利用广阔前景和巨大的辐射力,是商业竞争中各参与主体竞相争夺的重要资源。     

“大数据”是劳动对象也是劳动的结果     

目前来看,数字经济中的“大数据”运用的商业模式主要分为两大类:第一类,以大数据为标的物的直接交易。这类交易指的是把狭义上的“大数据”——即数据集作为交易的标的物。第二类,以大数据分析之后的数据与信息为标的物的间接交易。这种交易指的是采用各项分析方法对数据进行挖掘、分析,产生大量的统计结果、主体偏好、决策参考等信息,基于这些信息的再利用、重组与拓展,形成商业决策和商业行为,例如利用行为画像的精准营销,基于大数据统计的投资决策等等。     

与农耕经济时代以土地作为重要的生产资料、工业经济时代以石油等能源作为重要的生产资料类似,数字经济时代以大数据作为最基础也是最重要的生产资料。这两种商业模式中,前者所指称的“大”数据是交易对象,后者所谓的“大数据”是劳动的对象。但是我们需要敏锐地观察到,大数据能够成为生产资料的最重要原因是:数字经济的本质——信息经济。在大数据时代,信息的载体是数据。对于数据的分析与挖掘,其实质是生产各类信息产品。这就好比在土地上进行劳作,生产出来的是各种农业产品;对石油等能源材料进行劳作,生产出来的是各种工业产品。     

数字经济时代的特点还在于,信息的流转具有循环性质,即人类不仅通过数据劳动获取信息;而且自身也在不断提供信息以被数据化。在前数字经济时代,信息的载体是口口相传或者文字记录。对于那些带有智力成果属性的信息采用了知识产权的方法加以确权;对于那些带有劳动服务性质的信息(例如请私家侦探进行的调查)采用了合同等方式加以确权。而在数字经济时代,数据与信息的特性导致数据的多重属性——同样的一个数据,有时候是劳动的对象和交易的对象,有时候是劳动的结果。这就是数据权属难以被确定的一个深层次原因。而目前,各国立法大多存在着数据与信息两词的互用,本质上是没有理解大数据作为数字经济“生产资料”这一判断。     

作为生产资料的“大数据”的特点     

“大数据”的形成方式和使用方式决定了其与一般生产资料的不同,其拥有无形性、外部性、多次使用性等特点。     

(1)无形性。数据是以计算机等电子设备为载体的二进制表述,脱离于计算机数据无法存在。网络空间中的大数据也都需要存储在物理设备中。因此,无形性是大数据最基本,也是最显著的特征。同样具有无形性的知识产权是对于信息权属的拟制。正是大数据的无形性,造成了权属理解上的难度。     

(2)外部性。数据存在于电子设备和网络中。由于数据控制的原因,数据往往存在被泄露或者失窃的风险;同时,出于使用的原因,数据可能会被主动公开。两种情况都会对非数据控制人或者数据权利与义务人产生溢出效应。例如用户在全网的各类行为数据会被商业主体免费获取。     

(3)多主体使用与复用性。一方面,数据可以为一个数据控制者多次使用,数据的存在具有复用性;另一方面,数据可以同时或者非同时地为多控制主体使用。例如消费者在电子商务平台的一般消费数据可以同时被平台、平台商家、监管部门等使用。

相关阅读:

什么叫大数据时代  

大数据杀熟是什么  

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 11:39:36
云资讯 构造云原生数据战略三大核心因素 亚马逊云科技2022 re:Invent全球大会发布多项新功能
亚马逊云科技指出了构建云原生数据战略的三大关键构成:建立面向未来的云原生数据基础设施;实现高效、跨组织的数据一体化融合;借助教育和工具,使数据普惠化。 <详情>