大数据时代,我想没有人会不知道数据的重要性,对于企业来说,数据可以帮助决策者更加了解市场,辅助制定发展方案。不过,大数据的技术与商业模式还处于探索阶段,企业若是不得其法的话很可能会带来负效果。

01

数据可能存在偏差

统计学家NateSilver表示:没有毫无偏差的数据,偏差是数据的自然状态。企业中的绝大多数数据都是存储在数据库中的结构化数据,这些数据通常是在原始数据阶段被收集,然后从非结构化格式转换为结构数据存储起来,数据的结构通常是由应用程序(包括数据库)或技术人员的个人习惯来确定的。

02

例如,在基于活动的成本计算分析中,如果应用只能捕获开始和结束时间,不能捕获活动的全过程,那么对于活动的分析几乎是不可能实现的。因此,数据的上下文预先确定或失真就意味着捕获和存储的原始数据不仅是模糊的,而且还有可能是有偏差的。

数据管理昂贵且耗时

虽然企业一直想要通过有质量的数据来获取洞察,但是数据质量的获取和管理是十分昂贵的,数据的创建、存储、处理、共享、聚合、清理、复制等操作都是需要时间和金钱的。根据MITHowardRubin博士的研究:金融服务部门的92%的业务成本是与数据有关的。

03

即使数据质量得到了改善,整个数据的生命周期中也还是需要管理的,因为数据质量会以每年7%的速率下降。数据管理是一场马拉松,而不是冲刺,所以如果企业需要高质量的数据,那么数据管理计划应该被提升到企业级持续改进计划的层面。

数据可能会约束创新

数据只是在揭示过去的事情,但是并不能改变未来。《GettingChangeRight》的作者SethKahan曾说过:只依据数据来做决定就像是只利用后视镜来驾驶汽车。如果企业在困难时期,想要利用过去的决定来摆脱困境,那么只能是越来越倒退,过去只能表示你去过哪些地方,并不能为你的未来指路。

04

数据永远不会是实时的

现在很多公司都在谈论数据实时分析,但是其实数据永远都不可能是实时的,数据实时分析本身就是个伪命题,因为数据在发起和捕获之间总是有时间滞后的,在plant/SCADA/PoS系统中这种时间滞后可能是几微秒,但是IT/OLTP系统数据库中的数据的格式化、清理、验证、策划和提交可能需要几个月。另外,在对BI/OLAP数据集执行分析操作之前,需要从不同的系统合并并聚合数据,所以时间延迟会进一步延长。

聚合数据分析与流数据分析虽然截然不同,但是在这两种情况下,数据的发起和分析之间都存在时间滞后,聚合数据的时间滞后的单位可能是天、周或月,而流媒体数据的时间滞后的单位可能是分钟或者小时。所以即使企业设法做到了实时获取数据,但是通过数据进行的趋势、规范和预测分析也还是需要时间的,有意义的数据分析永远不会是实时的。

05

数据对于企业来说固然有价值,但是如果盲目投入时间和精力建设数据驱动型企业有可能会徒劳无功,因此,企业应该有个长远的规划,对维持数据管理有自己的计划,对数据分析有客观的理解。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-11-11 10:03:28
运营商 爱立信《5G进度调研》报告:5G发展有条不紊并日趋成熟
爱立信5G商业化主管Thomas Noren表示:“在2016年的调研中,90%的受访者指出个人用户是其5G业务规划的重点。今年,三个细分市场出现了平分秋色的情况,运营商不仅在个人用 <详情>
2017-11-03 10:21:57
运维管理 云将消亡:企业将如何从数据中心向边缘计算转变
在行业厂商技术领导人的讨论中,越来越多的证据表明新的颠覆性事件即将发生。这不过是人们所知的计算的根本变化。如今,云计算可以看作是一种处理数据的大型主机。但是当云 <详情>
2017-10-20 09:01:01
云技术 最新研究表明,云技术的蓬勃发展正在推动IT转型
云技术的蓬勃发展正在推动现代企业的IT转型,各类组织机构正在利用软件定义式基础设施(SDI)、容器以及DevOps来紧跟当今市场需求的发展步伐。 <详情>
2017-10-19 17:19:30
云资讯 企业通过公共云与私有云成本比较更好地发展业务
为了节省费用,将近一半的企业并没有采用公共云,并且表示已经找到了如何利用自己的私有云来避免采用公共云成本高昂的方法。 <详情>
2017-09-29 09:40:00
大数据资讯 谷歌数据透明度报告:政府索要数据48941次
1月1日至6月30日,全球各地的政府向谷歌发出48941项请求,要求提供数据,涉及83345个帐户,当中65%的请求得到谷歌的配合。 <详情>