在这篇博文中,我们聚焦于在数据科学领域所遇到的四种类型的数据分析模式:描述型、诊断型、预测型和指导型。当我与刚涉足数据科学领域的年轻分析师们交谈时,通常,我会问他们认为什么是数据科学家最重要的能力。他们的答案相当多样化。

 

数据分析

我想告诉他们的是,他们最重要的能力将是能够把数据转化为对非专业人士而言清楚而有意义的见解。瑞典统计学家Hans Rosling在这方面很有名。这种能力往往被忽略。下面Hans Rosling的这个TedTalk谈到了这些。分析能辅助开发有价值的见解,很有必要用一些工具来让人们了解分析所起的作用。其中一种工具是分析四维图。简单地来说,分析可被划分为4个重要的类别。下面我将详细解释这四个类别。

1. 描述型:发生了什么?

这是最常见的一种。在业务中,它向分析师们提供业务的重要衡量标准的概览。一个例子是每月的利润和损失账单。类似地,分析师可以获得大批客户的数据。了解客户(如,30%的客户是自雇型)的地理信息也可认为是“描述型分析”。充分利用可视化工具能增强描述型分析所带来的信息。

2. 诊断型:为什么会发生?

这是描述型分析的下一步难题。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。设计良好的商业信息dashboard整合了时间序列数据(譬如,在多个联系时间点上的数据)的读入、特征的过滤和钻入功能,能够用于这类分析。

3. 预测型:可能发生什么?

预测型分析主要是进行预测。某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。

在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。

4. 指导型:我需要做什么?

在价值和复杂度上,下一步就是指导性模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。交通应用是一个很好的例子,它帮助人们选择最好的回家路线,考虑到了每条路线的距离、在每条路上的速度、以及很关键的目前的交通限制。

另一个例子是生成考试时间表,不让任何学生的时间表发生冲突。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

扫描二维码,将会有专人将您拉进“大数据交流群”“云计算交流群”“区块链交流群”“物联网交流群”

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-08-25 10:33:00
运维管理 大数据给数据中心带来哪些改变?
大数据时代的来临首先对数据中心行业产生巨大影响。以往远程托管中心那些昂贵而又缓慢的内部服务器已经无力承载海量数据,现在,企业需要的是可扩展的存储解决方案,并且与 <详情>
2017-08-25 10:26:00
大数据资讯 大数据商用落地 看共享经济背后的“数据价值”  
为了抢占数据市场,争夺数据资源,在数据资源这一座金山面前,众资本家纷纷进入“共享”这片红海。 <详情>
2017-08-25 09:10:00
大数据资讯 首个年度大数据产业评估报告发布
8月24日,中国电子信息产业发展研究院在工业和信息化部信软司指导下发布了《中国大数据产业发展水平评估报告(2017年)》(以下简称《评估报告》)。作为《大数据产业发展 <详情>
2017-08-24 18:35:00
大数据应用 大数据公司该如何领跑亿万市场?
目前,数据的商业价值在越来越多的行业中逐渐得到实现,大数据应用逐渐落地生根。诸如工业、金融、公共事务、医疗、媒体出版、智能制造、零售、能源、地产等行业。 <详情>
2017-08-24 14:00:00
国内资讯 朱颖航:重新定义云时代的服务器硬件监控(二)
我们当前硬件的监控通常会怎么做,大家通常会采用带内IPMI的方式,厂商会有接口,会定义各种各样的传感器。基于采集到的数据,后面会有一整套的服务,会避免和别的厂商有通 <详情>