何为大数据?
“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。个人觉得很贴切,“新处理模式”是一个很关键的词汇,这也是我所理解的“大数据”区别于传统统计分析等最关键的特征之一。这个所谓的“新处理模式”有两层含义:
A.由于海量的数据,需要更高效的存储和处理技术,Hadoop成为了大数据时代的标志;
B.如果你认为大数据就等于Hadoop,那就大错特错了。Hadoop只是大数据时代的一个必要条件,大数据还有一个明显的标志是数据挖掘和人工智能的紧密结合。这也是我理解的“大数据”与现在很多所谓“大数据”项目最明显的区别之一。
下面就来说说,很多人眼里的大数据误区:
1、大数据是万能的
大数据显然不是万能的。正因为如此,她才真实。大数据在有些领域由于种种原因,所带来的价值并不如预期的那么高。导致这种现象最主要的问题有两个,一个是由于数据本身的质量或者数量不够;另一个是算法不合适。
不要以为是海量数据就一定会有价值,在过往的工作中,我们经常发现来自甲方的数据源有80-90%的数据都是无用的。只有10%-20%的数据才会产生一定的价值。这就又让我想到Marry Meeker打的那个比喻,“大数据的工作就像在一堆稻草中寻找一根针”。
2、大数据是灵丹妙药
大数据不是企业的灵丹妙药。确实,访问更多的信息,特别是关于你的客户的行为的信息,将会对某些业务提供竞争优势, 就像互联网。然而, 在许多情况下, 相对未分化的互联网和网络功能并未导致很大的业务增长, 建立的预测分析也是如此。相反, 更好的数据管理和分析是帮助企业做出更好决策的工具。就算“小数据”也可以为中小企业很好的利用在投资的路线图上,构建和多样化而无需有大型的IT投资。
3、只有大公司需要预测分析
虽然亚马逊、Target、沃尔玛、Zipcar和其他大型企业是预测分析(尤其是客户分析)早期的采用者和重要受益者,各种形式和规模的企业都将受益于智能分析带来的好处。例如,基于群体客户剖析和行为的分析客户保留模式,然后使用上述数据来设计针对性推广工作,对任何企业可以产生立即的影响。
以上就是关于大数据的几个误区了,其实不仅仅是只有这几点,很多人对大数据都不够了解,想要进行大数据行业,就要多多了解。