“大数据”一词反映了一个非常实际的增长趋势。到2020年,每个人每秒将产生1.7MB数据。根据调研机构IDC公司的调查,2020年全球数据量将增加到44万亿GB。数以亿计的智能手机和数十亿台物联网(IoT)设备每分钟产生的近300万个Facebook帖子和近300万个视频,每秒约有40,000次谷歌搜索查询。
而大数据认证的数量也在不断增加,尽管不尽相同。这些资格来自供应商、教育机构、独立或行业机构。他们需求量很大。
但那些希望增加技能的业界人士应该在仔细观察。大数据领域有数十个专业。这些包括大数据系统管理、Hadoop、分析、数据科学、大数据存储/安全,以及包含大数据的一般商业智能(BI)证书。此外,供应商平台通常可以确定什么是帮助个人在其职业生涯中取得进展的最佳证书。
Foote Partners公司分析师Bill Reynolds表示,物联网的发展推动了对大数据技能的更多需求,特别是在分析领域,“预测性数据和分析现在被认为是物联网迅速发展的支柱。”他说,“由于现在缺乏拥有大数据人才的人才,这一技能组合特别有价值。”
他指出了诸如Apache Hadoop之类的热点,这是一种基于Java的开源软件框架,用于存储和处理大型数据集的分布式存储。其他热点包括HDFS、Hbase、MapReduce、Flume、Oozie、Hive、Pig、HBase、YARN、NoSQL、NewSQL、Apache Spark和机器学习。
这份大数据认证列表涵盖了许多选项。但除此之外还有更多。它们以各种方式交付:在供应商、大学校园、贸易展会、在线培训等。
独立的大数据认证
(1)认证分析专家(Certified Analytics Professional)
如果企业希望供应商独立,因为没有与特定的分析平台绑定,那么Certified Analytics Professional(CAP)可能适合。这个培训可帮助企业解决分析问题,构建模型,实施企业分析和模型生命周期管理。
(2)PGP在大数据分析和优化中的应用(PGPin BigData Analytics and Optimization)
国际工程学院(INSOFE)以前称为工程卓越大数据分析与优化证书(CPEE),但决定将其重新命名为PHP,但未能说明新缩写词的含义。该课程大致相同,使用R、Hadoop、Map Reduce、Hive、Pig、Spark和Sqoop处理大数据,以及统计、建模、机器学习数据挖掘和其他分析领域。它针对的是印度的学生,并且具有课堂形貌式。
大学数据认证
(3)数据科学专业成就认证(Certification of Professional Achievementin DataSciences)
哥伦比亚大学数据科学专业成就证书(CPADS)通过开发基础数据科学技能为学生做好准备。要求包括本科学位,以及微积分、线性代数和计算机编程的基础。它大量涉及概率和统计,机器学习和数据可视化。它可以在课堂上和在线上使用。
SQL工具团队调整其策略,使其工具跨平台和开源。
(4)挖掘海量数据集研究生证书(Mining Massive DataSets Graduate Certificate)
此认证由斯坦福职业发展中心提供。需要获得认证的业界人士应该已经是一名软件工程师、统计学家、预测建模师、数据挖掘者或分析专家。要获得证书,必须完成四门课程:社交和信息网络分析、机器学习、挖掘海量数据集,以及信息检索和网页搜索。通常需要一年或两年才能完成。
(5)分析中的证书:优化大数据(Certificatein Analytics:Optimizing Big Data)
分析证书:优化大数据由特拉华大学专业与持续研究单位提供。它它为分析、图形和数据分析、建模、评估数据变异性等提供数据。学生必须完成四个模块:分析基础、大数据工具、过程控制和能力,以及一个单独的项目。它适用于商业、营销和运营经理以及数据分析师。
(6)康奈尔数据科学认证 (Cornell DataScience Certification)
由康奈尔大学SC约翰逊商学院的教师开发,数据科学证书可用于数据分析,数据分析360和数据驱动的市场营销。
供应商大数据认证
(7)SAP HANA认证(SAP Hana Certification)
SAPHana全部都是关于内存分析的。有各种课程可以成为使用SAPHANA的受过训练的应用程序专家。SAP认证应用程序专家SAPBW由HANASPS12(版本2016)提供的“认证考试”,例如,在SAPHANA上实现SAPBW的实现和建模。考生必须完成,以便有资格参加这次考试的几个SAP课程之一。
(8)AWS认证大数据-专业(AWS CertifiedBigData–Specialty)
这种考试测试学习者在设计和实施AWS服务方面的技术专长,以从数据中获取价值。要成为亚马逊大数据专家,学习者必须至少持有亚马逊集合中的一个证书:解决方案架构师、DevOps工程师、开发人员、云计算操作员或SysOps管理员。
(9)MicroFocus Vertica
由于MicroFocus从HPE公司手中接管了Vertica,因此它提供了培训课程,如VICTA概要、描述性分析、性能调整和数据库管理。这些是在Vertica平台投资的组织中工作的人员的关键课程。
(10)MCSE:数据管理和分析(MCSE:Data Managementand Analytics)
微软认证系统工程师(MCSE)的认证继续受到欢迎。它包括针对商业应用、云平台和基础设施,数据管理和分析、移动性和生产力的MCSE证书。作为微软的程序,他们专注于Azure、SQLServer和其他微软工具。数据管理和分析证书包括MicrosoftBI和分析平台,部署企业数据库,在云计算环境中运行SQLServer系统,如何操作Azure云或内部的大数据等等。
那些追求这门课程的人将自己定位为数据库分析师/设计师和商业智能分析师的职业生涯。其选项包括首先在SQLServer2012/2014或SQL2016数据库管理、数据库开发、商业智能开发、机器学习、商业智能报告或Azure数据工程中追求微软认证解决方案伙伴(MCSA)。完成此培训后,学习人员将参加考试以获得MCSA:数据管理和分析。
(11)数据科学R介绍(Introduction to R for DataScience)
R已经成为数据科学和统计学的一门专业。由RevolutionAnalytics(现在是微软的一部分)提供,此大数据培训提供了使用R统计语言进行高级分析的专业知识。它包括战略数据分析、生命周期分析、基本分析理论和建模。本课程是微软数据科学专业计划证书的一部分。
(12)Cloudera认证专家(Cloudera Certified Professional)
与微软公司一样,Cloudera已经为Cloudera Certified Professional(CCP)标签下的大数据汇集了大量认证。Cloudera认证专业数据工程师提供开发可靠、自主、可扩展的数据管道的技能,从而为各种工作负载提供优化的数据集。与微软公司类似,本次培训针对那些致力于Cloudera环境的人员。学习者首先参加Cloudera认证助理(CCA)课程。选项包括CCA Spark和Hadoop开发人员、CCA数据分析师和CCA管理员。一旦有了CCA认证,就可以参加CCP计划。
(13)EMC数据科学和大数据分析认证(EMC DataScience and Big Data Analytics Certifications)
EMC公司是另一家拥有大数据证书组合的公司。要成为一名获得认证的数据科学家,必须完成数据科学和大数据分析课程,以及数据科学和大数据分析课程的高级方法。该培训涵盖大数据、分析方法、MapReduce、Hadoop、分析非结构化数据、Pig、Hive、HBase、自然语言处理、社交网络分析、仿真、随机森林,多项逻辑回归和数据可视化等领域。
(14)SAS数据科学学院(SAS Academy for DataScience)
通过位于北卡罗来纳州卡里的SAS数据科学学院,学生掌握大数据管理、高级分析、机器学习、数据可视化和文本分析以及通信技术。他们可以获得三种不同的认证。SAS认证数据科学家是具挑战性的。它由五个考试和四个完整的证书组成。数据科学家凭证需要SASBigDataProfessional和SASAdvancedAnalyticsProfessional认证。但要获得SAS认证大数据专业证书,学习者必须具备足够的编程技能来处理数据管理、数据质量和可视化数据探索。像大多数面向供应商的程序一样,这个程序以SAS工具为中心,在这种情况下,采用SASBI和分析工具。
(15)MongoDB认证开发人员(MongoDB Certified Developer Associate)
开源的MongoDB由于能够管理结构松散和非结构化的数据,因此已经成为非常流行的NoSQL数据库。毫不奇怪,这个领域的认证是有需求的。MongoDB认证开发人员准备考试的目的是为了解使用MongoDB设计和构建应用程序的基础知识的人员。它主要针对已经了解MongoDB基础知识并使用MongoDB开发应用程序的软件工程师。还有针对JavaNode.js和.NET开发人员的准备培训课程。
(16)Oracle商业智能基础套件11g认证实施专家(Oracle Business Intelligence Foundation Suite11g Certified Implementation Specialist)
很难从Oracle军火库中挑选一个证书很困难。Oracle商业智能基础套件11g认证实施专家适用于Oracle商务智能套件的用户。它涉及仪表板、查询、软件配置、元数据存储库、安全设置和商业智能管理。该公司推荐几门额外的课程来准备与OracleBI相关的考试,包括新手训练营。
(17)Hortonworks
要成为Hortonworks认证专家,学习者需要至少获得以下其中一项:Hadoop认证开发人员、Hadoop认证、Apache Spark、Hadoop认证Java开发人员、Hadoop认证管理员、Hortonworks认证助理或Hortonworks数据流认证的NiFI架构师。完成这些课程的人员会熟练掌握Hadoop大数据环境的设计、开发和管理。
(18)MapR认证的Hadoop开发人员(Map R Certified Hadoop Developer)
MapR是Hadoop大数据空间中的另一个玩家。此证书需要至少两年的Java开发经验。本培训涉及使用Java设计和开发MapReduce程序。此考试涵盖使用MapReduceAPI编写MapReduce程序,以及管理,监视和测试Map Reduce程序和工作流程。
(19)IBM认证数据工程师-大数据(IBM Certified Data Engineer–BigData)
培训数据工程师应用技术来解决大数据问题和构建大规模数据处理系统是一项艰巨的任务。参加测试的人员应该已经了解了数据层、集群管理、网络、接口、数据建模和许多其他技能。培训主要集中在BigInsights,BigSQL,Hadoop和NoSQL等软件平台上。
(20)Google Analytics学院(Google Analytics Academy)
这与其他许多人有点不同。它是免费的,它仅以Google Analytics的复杂性为中心。但是这个平台正在变得如此普遍,以至于学习者对它的了解应该有助于提升职业发展。谷歌公司为初学者提供课程,并提供高级功能,如数据收集、处理、配置、复杂分,析以及如何在市场营销中使用Google Analytics。此外,Google Analytics 360、电子商务分析和Google跟踪代码管理器基础知识还有更高级别的课程。