中国IDC圈4月11日报道:“前两天和一个在高盛工作的同学聊天,他去年做了一个项目,为此获得了奖金40万美元。项目主要研究的是全球各地的下雨天与股价走势的关系,最后得出的结论是:没有关系。”
“4月9日,Facebook宣布以10亿美元的现金和股票收购Instagram公司。”
以上两则是早报记者昨日登录网络时弹出的讯息,前者是一位朋友转发的真实吐槽,后者是昨天业界最热的话题。当鼠标在这两则消息间反复切换,记者仿佛有感会在二者间发现什么联系。关联词当然不是“40万美元”和“10亿美元”,事实上,记者认为联系它们的是一个词:大数据。
数据提供决策依据
“大数据”(Big Data)是一个在近期才兴起并爆红的明星概念,它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫官网的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。
最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。” “大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。
根据维基百科的定义,“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量,大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。
回到本文开始提到的两则消息,它们和“大数据”有什么联系呢?
那位转发高盛40万美元奖金的朋友解释说,“很多人听说这件事后都会笑,我却要替他辩解。这个结论很有价值,如果研究的结论是下雨天和股价有关,那高盛就必须以几十倍于此的代价开发衍生品。这个基于数据的研究结果提供了决策依据。”
正如《纽约时报》今年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。
数据的可视化
关于Instagram被高价收购一事,必须交代的背景是:收购方Facebook成立于2004年,月度活跃用户8.45亿,估值高达千亿美元;被收购方Instagram,诞生551天,员工十数人,提供拍照分享服务,此次出售价为10亿美元。
由此可见,无论是Facebook还是Instagram,都是当今互联网时代的产物,信息、数据是一块肥沃且富有创造力的新土壤,它们帮助当代企业以须臾之速达到了过去百年老店也未能企及的规模。
“数据是新的石油。”亚马逊前任首席科学家Andreas Weigend说。Instagram以10亿美元出售之时,成立于1881年的世界大影像产品及服务商柯达正申请破产。
大数据是如此重要,以至于其获取、储存、搜索、共享、分析,乃至可视化地呈现,都成为了当前重要的研究课题。
“当时时变幻的、海量的数据出现在眼前,是怎样一幅壮观的景象?在后台注视着这一切,会不会接近上帝俯视人间星火的感觉?”
这个问题我曾请教过刘建国,中国著名的搜索引擎专家。刘曾主持开发过国内第一个大规模中英文搜索引擎系统“天网”。
要知道,刘建国曾任至百度的首席技术官,在这样一家每天需应对网民各种搜索请求1.7亿次(现在约为8.77亿次)的网站中,如果只是在后台静静端坐,可能片刻都不能安心吧。百度果然在提供搜索服务之外,逐渐增添了百度指数,后又建立了基于网民搜索数据的重要产品“贴吧”及百度统计产品等。
刘建国没有直接回答这个问题,他想了很久,似乎陷入了回忆,嘴角的笑容含着诡秘。
倒是有公司已经在大数据中有接近上帝俯视的感觉,美国洛杉矶就有企业宣称,他们将全球夜景的历史数据建立模型,在过滤掉波动之后,做出了投资房地产和消费的研究报告。
而在数据可视化呈现方面,我最新接收到的故事是,一位在美国思科物流部门工作的朋友,很聪明的印度裔小伙子,近期被Facebook高价挖角,进入其数据研究小组。他后来惊讶地发现,里面全是来自物流企业、供应链方面的技术人员和专家,“Facebook想知道,能不能用物流的角度和流程的方式,分析用户的路径和行为。”