中国IDC圈5月17日报道,大数据服务对于企业云来说颇具吸引力,亚马逊AWS,微软Azure和谷歌公共云为此在市场中激烈竞争,但哪家公司会脱颖而出呢?
云计算的市场正在迅速发展,而大数据业务也在不断变化。虽然这对于云计算供应商来说比较困难,这是值得尝试的,而这对于全球领先三大云计算供应商(亚马逊网络服务,微软Azure和谷歌公共云)来说也是不平等的。
在云计算和大数据具有协同效应的市场区域,谷歌公司在搜索方面经验非常丰富有但亚马逊网络服务(AWS)和微软Azure吸引一些有趣的初创公司增加价值。
而大数据服务这个充满活力的服务无论从性能和经济的角度来看越来越有吸引力。云计算用户将最终从三个云计算巨头之间的大数据竞争中获益,不过这看起来将要持续多年。
以下仔细看一下亚马逊AWS,微软Azure和谷歌公共云目前提供的大数据服务:
亚马逊网络服务
亚马逊网络服务(AWS)拥有广泛的大数据服务。例如亚马逊弹性MapReduce,运行Hadoop和Spark而KinesisFirehose和KinesisStreams提供了大数据集到AWS。用户可以通过Redshift存储数据,Redshift是通过数据压缩以帮助降低成本PB级规模的数据仓库,开源软件Elasticsearch是部署在AWS中的分析工具,提供如点击率和日志监控等服务。并通过Kinesis补充分析数据流。
值得一提的是,谷歌提供的大数据产品缺乏的就是GPU实例。
与谷歌公司相比,AWS有一个更大的数据集的存储选择。除了大量的AWS简单存储服务的农场以外,还拥有低延迟的NoSQL数据库;为Titan图形数据库提供存储服务的DynamoDBTitan;PB级的NoSQL数据库和关系数据库ApacheHBase。
AWS还具有一个商务智能(BI)服务,QuickSight可以采用并行的方式,在内存中实现高速处理。这是亚马逊机器学习和物联网的AWS联网(IoT)平台,该平台的设备连接到云中,并可以扩展到数十亿美元的设备和万亿条消息。
虽然谷歌公司具有边缘的搜索和分析引擎,而AWS的服务范围更广,并有双图形处理单元(GPU)的实例。
微软Azure
对于分析,微软Azure有数据分析湖,它采用专有的U-SQL与SQL和C++,以及基于Hadoop的服务的HDInsight。此外,还有Azure的分析数据服务DataFactory,使用全局元数据系统识别数据资产和数据工厂,其中连锁内部部署和云数据源和管理数据管道。
数据存储湖是Azure在Hadoop文件系统的大数据存储服务。云服务提供商有广泛的通用存储产品,包括StorSimple,SQL和NoSQL数据库和存储块。
Azure也有PowerBI和机器学习,并设有一个物联网中心。云平台还包括一个搜索引擎。微软公司的Cortana套件和认知服务可以提供更先进的智能功能。
大数据的好处
PBS公司在2016年播出了人脸大数据的纪录片,引发了很多社会媒体关于大数据的讨论和对话。这部纪录片中显示大数据的好处,人们对大数据有一种普遍的兴趣,并表明大数据几乎对每一个行业采用重大影响,其中包括零售,制造和营销等行业。
谷歌公司
谷歌公司的BigQuery资料服务使用一个类似SQL的界面,对于大多数用户来说很直观,甚至非技术的学习。它支持PB级的数据库,并可以执行每秒100,000行的数据流,以替代从云存储数据的运行。BigQuery同时支持地理复制,并且用户可以选择他们自己的存储数据。
BigQuery是一个没有一个专门的基础设施的即收即付的服务,允许谷歌使用了大量的处理器来维持快速查询次数。也支持park,Hadoop,Pig和Hive集成。企业也可以使用谷歌Analytics(分析)和DoubleClick。谷歌云数据流允许用户进行云数据服务排序。
谷歌提供其他的大数据服务,其中包括非关系型数据的NoSQL数据库CloudDatastore;可大规模扩展的NoSQL数据库CloudBigTable;机器学习的云管理平台CloudMachine;以及一些辅助工具,如翻译和语音转换器。
值得一提的是,谷歌提供的大数据缺乏的是GPU实例。数据分析编写GPU代码是一个高价值的技能,可以让GPU获得令人难以置信的性能提升。谷歌公司缺乏一个GPU实例系列是有点令人费解,尤其是在2011年添加了AWS功能,并在2015年添加Azure。
AWS、Azure、谷歌云:一场势均力敌的大数据竞争
在许多方面,三大云计算供应商在大数据服务方面步调一致,虽然在性能和使用需要一些实际的测试来辨别之间的差异。虽然谷歌可能具有搜索的优势,但落后于BI前端,微软公司有Cortana优势。谷歌缺乏GPU实例也是一个显著的差异。
正如任何产品一样,这些大数据服务仍然处在他们的相对起步阶段,将有不同的使用或数据依赖的情况。因此,用户在AWS与Azure和谷歌之间进行选择是比较困难的。而确定最佳云服务的一个方法,就是在几周的时间内尝试这些云服务,以获得这些云服务工作的意义。