中国IDC圈8月13日报道:大数据和数据科学的定义在今后几年也许仍然不会确定下来,但是可以肯定的是,人们在2013年消费的数据量超过了2012年所消费的数据量。

从大数据的出现开始,对大数据的争议似乎就一直未断过,似乎每家软件厂商、每家咨询公司,以及每个思想领袖都在尝试着对“大数据”做出准确的定义。尽管目前还没有出现这样的定义,但是打破关于大数据的神话将有助于我们认识大数据。

你能够获得所有的数据

我们从来都没有像现在这样能够获得如此多的数据。此前一直被人们所忽视的兆字节、拍字节和艾字节数据如今已经出现了。在如今的工业化社会中,平均每个人一天所消费的信息量超过了生活在十五世纪的人一生所消费的信息量。目前还没有一个人或一家公司能够存储和检索关于某一特定主题的全部数据,更不要说是所有数据了,包括谷歌在内。谷歌索引的只是表层网中的信息,而不是深层网中的信息。专家估测,后者的规模是前者的25倍。因此,在我们进行搜索时,我们所获得的信息量仅仅是互联网信息量中的4%~6%.

你需要所有的数据

虽然数据越多帮助越大,但这并不意味着在做商业决策时你需要所有的数据。正在高效利用大数据的公司已经认识到,他们不需要获得所有的相关信息。几乎每天都会涌现出大量新的数据源,但是并不是所有的数据都有价值。例如,电子邮件信息常常为我们提供了洞察企业状况的宝贵信息。精明的公司正在挖掘个人信息,以评估员工的情绪,以及谁可能会辞职。但这并不是说所有的电子邮件都具有相同的价值。因为分析垃圾邮件没有任何意义。你并不需要所有的数据。数据当然是越多越好,但是请不要浪费时间尝试做这一不可能实现的事情。

大数据会给我们明确的答案

经常听到这样一句商业格言:“处理你能够处理的数据,并从中获得更多信息。”我们在利用所获信息做商业决策时会遇到许多问题。而事实上,我们根本无法利用这些信息完全准确地预测出公司的并购、产品的发布、新的风险投资,以及员工入职等情况。但这并不是说,存在不确定性,大数据就不能为我们提供帮助了。请不要将减少不确定性和消除不确定性混为一谈。大数据能够帮助我们消除不确定性的这一天还没有到来,可能这一天永远也不会到来。对海量非结构性数据进行分析或许能够帮助公司更好的理解客户的情绪。但是请不要误认为大数据能够为我们排除所有的可能性。生命的无常和业务的起伏将会破坏我们制订出的完美计划。

大数据只是昙花一现

2012年的美国总统大选,尽管许多人预测奥巴马和罗姆尼在得票率方面将旗鼓相当,但是身为统计学家的Silver却预测,奥巴马将以90%的选举人票赢得2012年的美国总统大选。由于Silver的预测模型极为精准,以至于如今许多人在遇到事情后都来向他寻求帮助。

大数据和数据科学的定义在今后几年也许仍然不会确定下来,但是可以肯定的是,人们在2013年消费的数据量超过了2012年所消费的数据量。许多公司已经认识到了大数据的重要性,拒绝大数据可能将会导致公司在竞争中被淘汰出局。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2022-12-23 11:27:09
大数据资讯 立法先行 法治护航大数据发展
不久前,贵州省贵阳市某媒体公司经理高鹏进入“贵阳市政府数据开放平台”,在索引栏里输入关键词后,相关数据统计页面立即映入眼帘。“这个平台非常方便,可以根据主题、场 <详情>
2022-12-14 10:17:50
2022-12-14 10:16:47
大数据资讯 中国移动发布《大数据湖仓一体技术白皮书》: 打破数据孤岛壁垒,引领高效数据价值变革
随着湖仓一体技术应用的逐步深入,未来还将具备近数据计算加速、AI驱动数据全生命周期自动驾驶、多云协同等先进技术能力,以适应更大的数据体量和更多的场景诉求,进一步促 <详情>
参会指南|与您畅游 数字基础设施全球合作发展曼谷论坛
2026-05-25 11:07:01
发改委明确优先支持算力设施"绿电直连"!智算下半场已至, 8 月上海这场盛会不可错过
2026-05-25 11:01:01
案例征集|科智咨询《算力底座之争:智算芯片产业链、竞争态势与趋势研判白皮书》启动参编征集
2026-05-25 09:24:15
SpaceX斥资28亿美元 为数据中心采购燃气轮机
2026-05-22 10:11:28
AI行业最大的错配:我们都在为Token买单,却还按囤卡思维投资
2026-05-22 09:50:00
商汤林海谈AIDC:“通用标准”已不再是最优解,“适用高效”成为新法则
2026-05-21 10:48:23
东南亚AI数据中心迎“寒武纪时刻”,当前面临最大挑战是什么?
2026-05-21 10:15:26
5月27日•曼谷,DIFGC 2026•Thailand正式启幕!500位产业领袖齐聚,聚焦AI数据中心本地化交付与绿色能源协同
2026-05-21 09:24:00
35小时智能体自主进化!千问旗舰模型Qwen3.7-Max重磅发布
2026-05-20 11:22:17
阿里发布基于新一代真武芯片的超节点服务器,可支持海量Agent并发推理
2026-05-20 11:08:24
申报倒计时|2026中国智算产业年度评选活动即将截止
2026-05-20 09:42:00
投资2.5亿美元 中资企业将在马来西亚开发NexQuantum AI数字园区
2026-05-20 09:23:36
先场景,后全球:中企通信助力中企AI竞争力出海
2026-05-19 14:00:10
DayOne计划在新加坡与美国同步IPO
2026-05-19 10:28:12
一期总投资3.36亿元,中国电信(济南)智算中心正式发布
2026-05-19 09:26:41