如今,开源分析已牢固地成为企业软件堆栈的一部分,“大数据”一词似乎已经过时,并且Hadoop已成为死法已成为人们公认的民间传说。不过,这太夸张了;尽管Hadoop不再炙手可热,但它仍然是一个重要因素。那是因为它定义了一个附属项目的生态系统,该项目支持数据库,数据湖,流数据和数据工程功能。这就是为什么基于Hadoop的云服务(如Amazon的EMR和Google Cloud的Dataproc)仍然至关重要且有用的原因。
微软的云Hadoop服务Azure HDInsight是Hadoop实用程序的一个很好的例子,因为即使Microsoft推出了其他与之竞争的产品,该服务仍然存在。例如,微软与由Apache Spark的创建者创立的Databricks合作,提供并直接支持该公司同名服务的版本。此外,Microsoft将其Azure SQL数据仓库服务演化为Azure Synapse Analytics(Azure Synapse Analytics),该服务现在提供按需Spark池以支持完整的数据湖功能,作为公共预览功能。但是,HDInsight是微软于2013年首次推出的Hadoop服务,目前仍在发展。