大数据时代,我想没有人会不知道数据的重要性,对于企业来说,数据可以帮助决策者更加了解市场,辅助制定发展方案。不过,大数据的技术与商业模式还处于探索阶段,企业若是不得其法的话很可能会带来负效果。

01

数据可能存在偏差

统计学家NateSilver表示:没有毫无偏差的数据,偏差是数据的自然状态。企业中的绝大多数数据都是存储在数据库中的结构化数据,这些数据通常是在原始数据阶段被收集,然后从非结构化格式转换为结构数据存储起来,数据的结构通常是由应用程序(包括数据库)或技术人员的个人习惯来确定的。

02

例如,在基于活动的成本计算分析中,如果应用只能捕获开始和结束时间,不能捕获活动的全过程,那么对于活动的分析几乎是不可能实现的。因此,数据的上下文预先确定或失真就意味着捕获和存储的原始数据不仅是模糊的,而且还有可能是有偏差的。

数据管理昂贵且耗时

虽然企业一直想要通过有质量的数据来获取洞察,但是数据质量的获取和管理是十分昂贵的,数据的创建、存储、处理、共享、聚合、清理、复制等操作都是需要时间和金钱的。根据MITHowardRubin博士的研究:金融服务部门的92%的业务成本是与数据有关的。

03

即使数据质量得到了改善,整个数据的生命周期中也还是需要管理的,因为数据质量会以每年7%的速率下降。数据管理是一场马拉松,而不是冲刺,所以如果企业需要高质量的数据,那么数据管理计划应该被提升到企业级持续改进计划的层面。

数据可能会约束创新

数据只是在揭示过去的事情,但是并不能改变未来。《GettingChangeRight》的作者SethKahan曾说过:只依据数据来做决定就像是只利用后视镜来驾驶汽车。如果企业在困难时期,想要利用过去的决定来摆脱困境,那么只能是越来越倒退,过去只能表示你去过哪些地方,并不能为你的未来指路。

04

数据永远不会是实时的

现在很多公司都在谈论数据实时分析,但是其实数据永远都不可能是实时的,数据实时分析本身就是个伪命题,因为数据在发起和捕获之间总是有时间滞后的,在plant/SCADA/PoS系统中这种时间滞后可能是几微秒,但是IT/OLTP系统数据库中的数据的格式化、清理、验证、策划和提交可能需要几个月。另外,在对BI/OLAP数据集执行分析操作之前,需要从不同的系统合并并聚合数据,所以时间延迟会进一步延长。

聚合数据分析与流数据分析虽然截然不同,但是在这两种情况下,数据的发起和分析之间都存在时间滞后,聚合数据的时间滞后的单位可能是天、周或月,而流媒体数据的时间滞后的单位可能是分钟或者小时。所以即使企业设法做到了实时获取数据,但是通过数据进行的趋势、规范和预测分析也还是需要时间的,有意义的数据分析永远不会是实时的。

05

数据对于企业来说固然有价值,但是如果盲目投入时间和精力建设数据驱动型企业有可能会徒劳无功,因此,企业应该有个长远的规划,对维持数据管理有自己的计划,对数据分析有客观的理解。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2022-12-30 11:39:36
云资讯 构造云原生数据战略三大核心因素 亚马逊云科技2022 re:Invent全球大会发布多项新功能
亚马逊云科技指出了构建云原生数据战略的三大关键构成:建立面向未来的云原生数据基础设施;实现高效、跨组织的数据一体化融合;借助教育和工具,使数据普惠化。 <详情>