如今,大数据分析市场与几年前相比已经截然不同。而在未来十年,全球各行各业都将发生变革、创新和颠覆。
在日前发布的2017年度市场研究报告中,SiliconAngle Media公司的Wikibon分析团队发现,2017年的全球大数据分析市场规模比前一年增长了24.5%.这比前一年的报告中预测的增长得更快,这主要是由于公共云的部署和利用好于人们的预期,以及云计算的平台、工具和其他解决方案都在加速融合。此外,企业正在通过大数据分析更快速地脱离实验和验证阶段,并从部署中获得更高的业务价值。
展望未来,Wikibon团队预测,2027年全球大数据分析市场的年增长率将以11%的速度增长,将达到1030亿美元。通过在物联网(IoT)、移动性和其他边缘计算用例中采用大数据分析技术,大部分市场可以保持未来几年的增长。
未来十年大数据分析发展的主要趋势
正如Wikibon团队的研究证实的那样,未来十年将推动大数据分析行业发展的主要趋势如下:
公共云提供商正在扩大其影响力。大数据行业正围绕全球三大主要公共云提供商亚马逊网络服务、微软Azure和谷歌云平台提供相应的产品和服务,而大多数软件供应商也在构建解决方案。这些和其他大数据公共云提供商(包括像IBM和Oracle这样已进入行业的大数据供应商)正在提供托管的IaaS和PaaS数据湖,鼓励客户和合作伙伴开发新的应用程序,并帮助客户迁移遗留应用程序。其结果是,纯粹的数据平台和NoSQL供应商似乎发展比较平淡,日益被多元化的公共云提供商统治的大型数据领域所边缘化。
与私有云相比,公共云的优势继续扩大。公共云正在成为每个客户细分领域首选的大数据分析平台。这是因为公共云解决方案比内部部署堆栈更为成熟,增加了更丰富的功能,而且拥有成本日益增加。公共云正在开发其应用程序编程接口生态系统,并加快他们的管理工具的速度,超过了为内部部署而设计的大数据分析解决方案。
混合云正在成为企业大数据的过渡站点,以便在公共云中实现更全面的部署。混合云是大多数大型企业的大数据计划,但主要是作为一种过渡战略。这是因为天平正在向企业倾斜,将更多的大数据资产放在公共云上。认识到这一趋势,传统大数据供应商正在针对混合使用案例优化其产品。出于同样的原因,基于内部部署数据中心的大数据平台正在重建架构,希望部署在公共云中。
基于云计算的大数据孤岛融合正在加快企业实现价值的速度。用户开始加快将孤立的大数据资产整合到公共云中的速度。公共云提供商的主导地位正在瓦解困扰企业私有大数据架构的跨业务孤岛。同样重要的是,基于云计算和基于内部部署的大数据解决方案正融合到集成产品中,旨在降低复杂性,并加快实现价值的速度。更多解决方案提供商正在提供标准化的API,以简化访问,加速开发,并在整个大数据解决方案堆栈中实现更全面的管理。
创新型大数据初创公司将越来越复杂的人工智能应用推向市场。创新的应用程序提供商开始通过基于人工智能的解决方案颠覆大数据的竞争格局。来自新的市场进入者的威胁在各个大数据领域都在加速增长,其中大部分创新都是为公共云或混合云部署而设计的。过去几年来,许多新的数据库、流处理和数据科学初创公司已经进入市场。
颠覆性大数据方法正在成为已建立平台的可行替代方案。不久之后,新一代的“独角兽”大数据平台提供商将推出融合了物联网、区块链和流计算的下一代方法。以上的这些新一代的大数据平台将管理端到端的DevOps管道机器学习、深度学习和人工智能的优化。同时,大数据平台正在为边缘设备设计人工智能微服务。
Hadoop正在成为大数据难题中的一部分。有迹象表明,人们将Hadoop视为一种传统的大数据技术,而不是颠覆性业务应用程序的战略平台。尽管如此,Hadoop是一种成熟技术,广泛用于许多用户的IT组织中的关键用例(如非结构化信息提炼),并且在许多组织中仍然具有很长的使用寿命。考虑到这一长期前景,供应商通过在独立开发的硬件和软件组件之间实现更平滑的互操作性,不断提高产品性能。
用户越来越多地在开放的生态系统中混合和匹配多供应商的大数据部署。一些大数据供应商正在提供包含专有、非标准或非开源组件的解决方案。客户正在利用当今竞争激烈的市场,从大数据分析厂商处获取持续的增强功能。反过来,供应商则将他们的工具解耦为模块化架构,客户可以在各种功能级别交换组件。对于希望通过完整的供应商锁定在过去的市场中获得可持续份额的供应商而言,这是好的方法。
数据库正在通过创新方法进行解构和重组。从架构角度来看,人们以前熟悉的数据库正在减少。人们正在采用流媒体、内存和无服务器大数据分析基础架构。供应商正在探索重新构建核心数据库功能以满足新兴需求的新方法,例如自动化机器学习管道和面向边缘的认知物联网分析。在这一演变过程中,随着更多高性能事务分析功能集成到各种数据平台中,分析和应用程序数据库正在融合。此外,数据库存储引擎正在成为主要用于机器数据的存储库,可通过替代结构(例如键值索引和对象模式)进行寻址。
数据科学工具链的端到端的DevOps管道越来越自动化。大数据增强的编程将继续增长。开发人员可以使用越来越多的DevOps工具来自动化机器学习、深度学习和其他人工智能资产的开发、部署和管理中的各种任务。这些解决方案的范围越来越广泛,甚至利用专门的机器学习算法来推动超参数调整等机器学习开发功能的发展。
打包的大数据分析应用程序正变得越来越普及。未来十年,更多用户将以预构建、预培训和模板化云服务的方式获得大数据分析解决方案。更多的这些服务将自动调整其嵌入式机器学习、深度学习和人工智能模型,以持续提供最佳业务成果。更多的这些服务将纳入预先训练的模型,客户可以调整和扩展到自己的特定需求。
大数据分析的演变和部署障碍
尽管大数据分析采用的预测看起来很乐观,但仍存在许多持续性的问题,使用户试图大限度地利用这些技术的投资价值受到挫折。其中最主要的是:
过于复杂。大数据分析环境和应用程序仍然过于复杂。供应商需要继续简化这些环境的接口、体系结构、功能和工具。这样做会将复杂的大数据分析功能应用于主流用户和开发人员,其中许多人都是缺乏具备必要专业技能的内部IT人员。
繁琐的开销。对于一些IT专业人员来说,大数据分析管理和治理流程仍然过于孤立,成本高昂且效率低下。供应商需要构建预先打包的工作流程,帮助大型专业人员团队更有效、快速和准确地管理数据、元数据、分析和服务定义。
加强管道的自动化处理。大数据分析应用程序开发和运营管道仍然过于耗时,并耗费人力。供应商需要加强其工具的自动化功能,以确保提高用户技术人员的生产力,同时确保即使是技能较低的人员也能处理复杂的任务。
自定义应用程序。大数据分析专业服务对于开发、部署和管理许多自定义应用程序仍然至关重要。这对于跨越混合云的数据驱动型应用程序,涉及不同的平台和工具,以及纳入难以理解的复杂数据流程尤其如此。供应商需要为常用的大数据分析应用程序加强预先打包的应用程序内容,同时为用户提供自助服务的可视化工具,用于指定复杂的业务逻辑,而无需外部帮助。
对于企业IT团队来说,Wikibon团队的主要建议是开始将更多的大数据分析开发工作迁移到公共云环境中。这将加速企业利用AWS、微软、谷歌、IBM和其他公共云提供商提供的快速成熟、成本低廉产品的能力。企业应该考虑构建自己的混合云,以确保在未来几年内将其业务顺利过渡到公共云。