互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。

 

500-333文章照片-大数据征信与数据流通-韩涵

中国信息通信院高级工程师韩涵

其中在28日下午举行的“大数据征信与数据流通”分论坛上,中国信息通信院高级工程师韩涵博士做了精彩的演讲。

以下是韩涵的演讲实录:

给大家分享的题目是建设规范的数据流通环境,在座的各位嘉宾有参加昨天上午的论坛,有看到我们单位发布的数据流通行业公约,这个报告以这个公约作为起点,给大家讲一讲我们如何关注数据流通行业,以及对于行业发展的思考。一个是我国大数据产业链调查结果,第二是数据流通行业存在的问题和思考,最后是我们的建议是行业自律的方式改变我们产业发展环境。开幕式当天放过的PPT从产业的视角、从数据资源的脉络里将大数据的产业链分成生产流通应用的环节。生产环节包括数据采集加工清洗等主要模块,在数据流通我们认为主要是包括数据的转移共享置换交易等这样的行为,而这个数据应用是大数据与各行各业的结合。在数据生产和加工这块有很多典型的企业,大家都不陌生,在数据流通环节全国有若干个数据交易中心的平台,在数据分析应用环节有专业数据公司和行业内部对大数据应用的企业。

大数据并不是只对大数据本身的产业发挥作用,因为根据调查结果2015年大数据产业产值是一百亿的规模,相对全国信息技术的产业来说是非常小的。但是我们认为大数据能够带来多种行业的变革,包括对一产二产三产的影响,他的路径是从第三产业向第二第一产业逆向融合渗透的方式,比如今天比较火的工业未来可能向农业有深入,我们为了了解大数据产业链上各个单位的情况进行了一轮比较广泛的市场调查,调查的企业上百家收回了完整的调查问卷53份,主要是以数据流通产业链的链条为基础,覆盖了上中下游的各种企业。参与调查的单位主要是企业为主,53家单位48家是企业,事业单位和科研院所比较少,覆盖的范围从信息通信电子商务金融教育培训交通等等都有,这次是一个抽样性的市场调查,范围还是比较广泛的。这个市场调查之前在互联网上公布,这个企业是自主申报的,并不是我们挑选的企业,这次市场调查结果反映大数据对各行各业的影响,各个企业看到了我们对大数据的市场调查给予我们非常高效的反馈。

根据这个结果我们可以看到当前企业掌握数据资源总量非常大,根据昨天的饼图,在1Pb以上的紫红色的部分已经接近了一半,当前企业数据资源总量是相当大的规模,另外技术型的企业,做数据分析建模数据服务和设计的企业,这个是大于数据交易和采集类的企业,技术型企业是市场主流,数据交易和流通是非常活跃的,交易还是主要的方式,企业数据来源调查结果有80%的企业认为企业数据来源第一项是数据交易,高于数据收集和置换的方式,数据的结构来看,最大的比例是结构化的数据,有85%的企业认为搜集到的数据包含结构化的数据。可以看到这个柱状图里对于准结构化的,比如文档和网络的数据以及社交媒体的数据的差距已经不是很大了,这也说明非结构化的数据逐渐的产生了他的价值。我们再看这个市场规模,这个问题非常敏感,根据我们市场调查,年度交易额五百万以上的数据,占到34%,这个数据交易市场规模是有一定的规模效应。另外这个收费模式,主要还是向买方收费为主,仅向买方收买45%,买卖双方收费10%。同时,我们看到对于大部分的企业来说专门成立了数据流通部门,和其他相关企业进行数据的转移交易交换的行为设立专门部门,61%的企业设立了专门部门,大家对数据流通的重视程度非常高。收费模式现在主要是按照数据量计费最大规模,占64%,按照数据处理难度使用的时间和数据获取难度有一些考虑,除了数据量以外兼顾数据成本的投入。

当前还有数据权属问题91%的企业掌控了数据使用权而不是收益权和处置权。使用权是主要的形式,数据流通主要方式66%是API接口方式,而不是托管数据交易,不是直接把数据资源上传,监管方式是主流。数据流通过程中,企业已经在逐步考虑采用多种方式保护客户隐私,目前的企业将保护客户隐私放在第一位置。第一是数据管控上下游环节有明确的要求,这不仅是在本企业内部,第二是分类管理,区别对待个人信息数据和非个人信息数据,将个人用户问题放在非常重要的考虑点上。第三是脱敏,个人信息匿名化,第四是数据授权,这一块还不到50%,这是企业自主提交的选择题,明确授权的不到50%说明授权是难解决的问题。

在数据流通行业存在的一些问题和我们初步的思考。数据流通仍然面临流向难以管控授权难以界定的问题,流向管控方面,我们经过调查,有83%的企业都认为无法确保数据在允许的范围内流动是当前主要的问题,我们也和BAT的大企业交流,大家认为内部管理容易,企业上下游管理更肯定,在数据安全方面,大家认为最主要的问题是难以界定数据授权信息,什么样的授权认为用户真正授权过了什么时间点用户的授权有效了,这个但是比较难以界定。同时对于数据安全保护制度欠缺,有一些困惑点。

大家普遍认为对当前的诉求,第一是缺乏法律法规,有80%的企业这是很大的问题,第二是缺乏产品技术的标准,67%的企业认为标准问题非常重要,这也是各个论坛最长提及的问题,大数据问题,法律法规标准才是产业发展急需互换的东西。

数据流通,另外一个调查问卷,大家最大的数据是公共服务数据通道建立,大家认为目前最大的问题,排名前两个问题是金融市场标准不规范和孤岛严重,最大的问题还是数据开放的事情,也可以体现出来信息孤岛是十几年还没有解决的问题。可以看到当前数据流通交易市场在国内是两个极端状态,一种是完全无法掌控在黑市状态下数据猖獗的流动,这样使得个人信息安全外协,也使得数据资产所有权问题难以界定,另外有价值的数据资源,在数据库中沉积着不能使用。这是正当合法业务的开展受到很大的阻碍,尤其是数据流通的成本增加了很多,我们倡导数据和阀门一样在有管控的状态下进行合理的流动。和国外相比,我们的数据流通起步很晚但是很活跃,国内的企业都是2000年之后才真正进入这个行业,应用范围是比较普世性的平台而不是关注某一个应用。目前国内的企业不同意数据二次转售。当前国内的数据交易所是探索阶段,很多核心问题没有解决,现在有些交易所交易的数据使用权,有些是所有权还有数据收益权,这些如何保障是很大的问题,大量的数据是政府数据,这一块能不能作为市场化的手段交易,也是很难界定的。

我们建议以行业自律的方式改变企业的发展环境。昨天上午的主论坛,54家企业参与共同推定制订了数据流通行业公约,这也是一个非常大的启示,目前82%的企业认为建立这个公约是非常重要紧迫的事情。所有的调查单位认为公约最应该包含的内容是明确法律法规和标准规范,这是产业界共同的呼吁。数据流通行业公约的制订对促进行业发展规范加强企业自律有重要的意义。今天在座很多专家是公约发起单位的成员,也见证了昨天上午的发布仪式。这个公约是比较开放的,因为是从产业自律作为出发点,未来我们也是积极的征集第二批企业,我们这个公约是完全在互联网上,靠大家自发申请加入没有找相关企业,有如此之多企业参与说明我们在数据流通行业中这样一种行业自律的氛围,大家都有这种迫切的需求,希望从正向的角度建立阳光透明的数据流通的行业。

除了公约以外,真正在调查当中大家最紧迫的需求还是法律法规方面,我们认为第一步应该颁发上位法,什么样的数据可以开放流通,政府开放白名单,这个机制只有很少的地方政府法规有所涉及。第二是个人信息保护法律体系,解决行业数据中最主要的问题,这是必须的,法制办的立法已经在考虑范围内了,但是还需要两三年的出台时间。第三,尝试反垄断的法律法规,这也是从行业整体权益上统筹考虑,使得整个大数据产业和数据流通行业真正繁荣起来,实现市场化的机制。

另外是标准的制订,数据流通行业需要制订标准规范,对于细分领域的人需要制订细分标准规范,包括数据应用范围授权的要求和流程,交易的类型方法定价指导审计办法等等,针对不同的领域电信金融广告交通医疗征信等应该有不同的标准细则,这个在数据流通未来行业公约下一步的工作,希望由企业牵头成立细分领域细化的标准规范,在行业内部起到典型的带头作用。这一块是非常迫切的互换对于具体细分行业有深入研究和积累的企业牵头做这项工作。在征信的行业,我们做了一些尝试和试点,在工信部指导下,我们和电信运营企业和征信机构建立一个研究机构,试图从征信行业建立一套比较细的关于数据流通行业标准规范,目前已经有成熟的研究报告并且在做企业试点。除了三家运营企业,还有几家征信机构也参与了这个研究和试点工作。未来下一步在推进标准符合化的审查服务,因为这个工作思路是公开的公约,公开的标准,目前具体流通细则都是在产业界,由产业界最有影响力企业牵头研讨制订,和标准规范形成一一对应关系,具体方式包括线上的文档资料的初审主要包括安全管理规范保密协议和文档等相关材料,还有技术辅助的手段和扫描工具,以及现场审查部分,最终通过法规制度层面技术层面双重保障,来认证咱们的相关企业是否满足公开发布的标准。

工作的开展是把数据中心联盟作为一个平台,数据中心联盟由工信部指导,中国通信标准化协会下属的联盟,中国通信标准化协会是中国通信委员会的单位,目前整个联盟成员超过170家,包括所有电信运营企业、互联网企业、IT企业,主要是软件计算为主,我们在数据联盟中有大数据委员会,一个大数据征信工作组,非常希望大家关注这个联盟和大数据委员会的相关活动。通过大数据峰会的活动会逐步展开,不断推动产业链的完善。谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2019-07-17 17:26:44
5G 大家说 中国信通院张翔:全面创新的5G射频和性能测试解决方案
目前信通院具备了整个5G的端到端的OTA测试解决能力,我们利用真实的基站,利用信道模拟运维,我们可以做到上下行完全互异的信道。 <详情>
2019-07-03 09:34:16
云安全 2019可信云大会丨吴江伟:云服务安全能力标准解读
总体来说我国目前云计算安全处于初步发展阶段,未来的发展空间巨大。云计算安全系列标准需要制定与优化。云计算安全服务可信也持续发展,包括资源服务可信、产品功能可信, <详情>
2019-06-30 14:50:33
云资讯 《云计算发展白皮书(2019年)》即将发布 解读五大技术趋势 披露三大开源现状
白皮书结合最新的市场数据,从产业规模、市场热点、技术特点等方面系统、全面地分析了云计算的发展现状和趋势。 <详情>
2019-06-11 11:22:36
国内资讯 2019大数据产业峰会|中国信通院王妙琼:时序数据库性能测试基准解读
时序数据库的功能标准主要是六大块内容:功能、兼容能力、安全性、管理能力、容错能力、扩展性。这些内容综合了互联网、物联网、工业互联网这些场景里通用的需求,也保留了 <详情>
2019-06-05 11:59:00
国内资讯 2019大数据产业峰会|中国信通院王卓:第八批大数据产品能力评测解读
大数据产品能力评测促进了大数据软件产业发展成熟,现有的评测体系包含多项多方面评测,既有已经展开的评测也有未来计划开展的评测,测评项不只包含基础能力还有相应的性能 <详情>