数据科学影响了来自不同行业的许多企业。尽管数据科学已经成为“21世纪最吸引人的工作”,但还有一项技术正变得越来越突出。

如今,自动化不仅应用于机器人领域,它还与其他领域相结合,使技术人员的工作变得更容易,其中一个领域就是数据科学。有很多公司正在为数据科学领域开发工具和产品。在本文中,我们将研究数据科学专业人员可以使用的一些自动化工具。

1. Auto-Weka

有几种机器学习算法可以直接使用,其中许多方法都是在Weka包中实现的。然而,每一种ML算法都有自己的超参数,这些超参数可以极大地改变它们的性能,而且总体上有大量可能的替代方法。

Auto-WEKA最初于2013年发布,它考虑通过同时选择学习算法和设置超参数来解决这个问题。它还解决了使用贝叶斯优化的问题。Auto-Weka还致力于帮助非专业用户更有效地识别适合其应用程序的ML算法和超参数设置。

2. Darwin

Darwin是一家建立人工智能系统以推动最重要利益的公司Sparkcognition开发的,是另一个大规模解决数据科学问题的工具。 它是一种自动化的模型构建工具,允许用户在比传统方法更短的时间内从数据到模型。此外,它还可以实现场景的快速原型设计和高效的洞察力提取。

这个工具是如何工作的?该工具使用基于神经进化的方法,自定义构建模型架构,以确保最适合目前的问题。

3.DataRobot自动机器学习

DataRobot是一个先进的企业AI平台。该平台融合了一些世界领先的数据科学家的知识、经验和最佳实践。谈到自动化,DataRobot的自动化机器学习平台,帮助ML开发人员以前所未有的透明度自动创建机器学习模型,以帮助理解和信任他们所做的预测。该平台配备了不同类型的回归技术,从最简单的统计经典回归模型到复杂的统计经典回归模型。此外,这个平台好的一点是,它还可以解决多达100个不同类别的简单问题。

从一开始,DataRobot就一直是数据科学专业人士追捧的平台。要了解这个平台的更多信息,您可以查看他们的官方产品网站。

4. H20.ai

在机器学习自动化方面,H2O已经成为领导者。它是一个开源的分布式内存机器学习平台,具有线性可伸缩性。该平台的创建方式支持大多数广泛使用的统计和机器学习算法。

这个平台最棒的地方之一是,它具有业界领先的AutoML功能,可以自动运行所有算法及其超参数,生成排行榜的最佳模型。

5. dotData

特性工程被认为是数据科学专业人员最重要、最耗时和具挑战性的工作之一。打包了好的人工智能功能的dotData致力于将其自动化。简单地说,该公司只专注于民主化和自动化整个数据科学工作流。

与传统流程相比,在识别用例到将流水线投入生产之间可能需要数月时间,此AI / ML平台有助于快速,大规模地执行复杂的数据科学项目。

【凡本网注明来源非中国IDC圈的作品,均转载自其它媒体,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。】

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-03-31 09:28:00
大数据资讯 2023数据科学峰会 百分点科技正式发布数据科学基础平台
3月30日,由百分点科技主办的“2023数据科学峰会”在北京金隅智造工场·科技秀场成功召开。 <详情>
2020-09-23 09:21:00
互联网 迎接数据科学ML+和DL+时代的来临
“Gartner提出,到2024年底,75%的企业机构将从人工智能试点转为AI运营,基于流数据的分析基础架构的数量将因此增加5倍。 <详情>
2020-02-21 13:22:00
大数据资讯 意料之外 情理之中:解读Gartner 2020年数据科学和机器学习平台魔力象限
最近Gartner发布了数据科学和机器学习(DSML)平台魔力象限报告。数据科学、机器学习和人工智能的市场格局极为分散,竞争激烈且难以理解。Gartner尝试根据明确定义的标准对 <详情>
2020-01-13 17:45:00
大数据技术 数据科学初学者面临的5个常见误区
数据如今已经体现出巨大的价值——企业通过数据分析来为包括市场支出、员工决策到产品开发等所有事情提供参考性建议,而这也意味着,数据科学家在工作中的价值正变得越来越 <详情>
2019-12-30 17:50:00
大数据资讯 2020 年数据科学就业市场必备的五项技能
为了保持竞争力,一定要为新工具带来的新工作方式做好准备!以下就是2020 年数据科学就业市场必备的五项技能。 <详情>