当今世界几乎所有的事物都有一些数字组件或数字对应物。人们可能在考虑大数据公司的数量到底有多少。智能手机、计算机、平板电脑、智能家居设备、地理空间硬件、遥测设备等技术,这些设备都可以生成数据或数字内容。这意味着必须收集和处理一些数据,然后将其存储在某个地方。
云计算和远程技术通常是大多数企业进行数据备份的解决方案。企业可以将数据推送到远程、非现场服务器或数据中心,在那里它可以安全地受到保护,并在相当长的时间内保存,从而使本地存储空间可以容纳更多数据。
这正是亚马逊Snowball数据传输设备所需要做的工作。企业可以将敏感数据复制到Snowball便携式存储硬件上,然后将其传输到亚马逊的数据存储中心。
很明显,对于像Snowball这样的设备必须处理不断变化的大量数据。特别是考虑到携带Snowball设备的载货卡车可以容纳亚历山大图书馆数据资料的五百万倍。
亚历山大图书馆是现存最著名的图书馆之一,其中包括古典文物的许多文本和阅读材料。幸存的古典书籍总数超过20万册。更进一步说,全球互联网每天生成超过2.5艾字节的数据。而迅速发展的物联网和智能家居技术等现代技术让这一数字令人印象深刻。
让人惊奇的是,企业或服务提供商产生了多少数据?这些数据看起来是什么样的,有什么可比性?以下是全球大的四家科技公司的统计数据。
谷歌:每秒40,000次谷歌网页搜索
目前全球37亿人经常访问和使用互联网,而谷歌公司将处理每秒大约40,000次的网络搜索,而这仅仅在谷歌公司的网页上。
此外,超过一半的网络搜索都是在移动设备上进行的。随着越来越多的人在全球范围内使用移动设备,网络搜索总量将会继续增长。
Facebook:每天500TB字节
2012年,Facebook公司系统每天产生25亿条内容和超过500TB的数据。还有无数的照片和数据。其数据相当巨大,而且随着时间的推移而增长。
如今,Facebook平台上有20亿个活跃用户,并且数量巨大,使其成为现存大的社交媒体平台。每天大约有15亿人在网络上活动,所有人都在生成数据和内容。每秒有五个新用户加入Facebook,并且每秒超过3亿张照片上传。
Twitter:每天12TB字节
很多人认为140个字符的消息不会包含大量数据,但事实证明Twitter社区每天将会产生超过12TB的数据。这相当于每周84TB字节或者每年4.3PB字节的数据,对于像网络上共享的那些具有字符限制的短消息,比如那些在网络上共享的消息。
亚马逊:每分钟销售额258,751.90美元
亚马逊公司生成的数据是双重的。主要零售商正在收集和处理有关其常规零售业务的数据,其中包括客户偏好和购物习惯。但同样重要的是要记住亚马逊为企业界提供了云存储机会。亚马逊S3在公司处理的所有其他方面,提供全面的云存储解决方案,也促进了海量数据库的传输和存储。因此,很难真正确定亚马逊公司总共生成多少数据。
相反,好了解一下亚马逊公司与数据处理和存储直接相关的企业收入。该公司每分钟的销售和服务费用超过258,751.90美元。
一般统计:每分钟评级 以下是各种社交网络的每分钟评级:
•Snapchat:用户共享了527,760张照片
•LinkedIn:超过120名专业人士加入该网络
•YouTube:观看了4,146,600个视频
•Twitter:发送或创建了456,000条推文
•Instagram:上传了46,740张照片
•Netflix:观看了69,444小时的视频
•Giphy:提供694,444个GIF图片
•Tumblr:发布了74,220篇帖子
•Skype:用户拨打了154,200个电话
看看这些数字,很明显这些平台的数据量到底是多少。同样重要的是要记住,这些厂商成为了少数利用当前市场中客户和使用数据的公司。
甚至还有一些影响因素,比如微软、Pinterest,甚至谷歌公司的其他平台,如Gmail,Hangouts或Google Docs。
数据生成每天都在加速
与这些统计数据和数字相比,可能会带来更大的冲击是,即人们拥有的所有数据中的90%是在过去两年内产生的。这相当于过去两年每天创建的2.5艾字节的数据。
在过去几年里,人们创造了天文数字般的数据量。那么这到底有多疯狂?随着人们要用更多技术并调整现有技术(如物联网、人工智能和机器学习),数据生成将继续增长。当然,加速增长也意味着带来了更多的创新用途、平台和渠道。
诸如无人驾驶车辆、自动化制造硬件、智能家居设备甚至办公硬件等技术都将有助于数据的加速生成。人们需要一个地方来存储、处理和分析它的方法以及大量的平台来利用它。例如,无人驾驶车辆将需要利用进来的数据为车主提供安全可靠的驾驶。