当我们谈到大数据分析,首先需要确定数据分析的方向和拟解决的问题,然后才能确定需要的数据和分析范围。大数据驱动的分析主要的挑战不是技术问题,而是方向和组织领导的问题,要确定方向,提出问题,需要对行业做深入的了解。

大数据

当然,大数据分析最核心的,关于数据的来源更是至关重要的。在数据量非常大的今天,如何以更高的效率获取到分析所需要的数据,如何利用这些数据反应最真实的情况,是业内不断探讨的议题。接下来,小编就带大家来了解下大数据分析及其数据来源。

  大数据分析  

大数据分析,顾名思义,就是对规模巨大的数据进行分析,是研究大量的数据的过程中寻找模式,相关性和其他有用的信息,可以帮助企业更好地适应变化,并做出更明智的决策。     

大数据分析的第一步是数据的“抽取—转换—加载”(the Extract-Transform-Load,ETL),这就是所谓的数据处理三部曲。该环节需要将来源不同、类型不同的数据如关系数据、平面数据文件等抽取出来,然后进行清洁、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。需要指出的是,尽管大数据分析有它的优势,但是也有很大的局限性。

很多时候,大数据产生的相关关系可能是虚假的,在完全随机的数据中显示了某些规律,因为数据的量非常大,可能产生向各个方向辐射的各种联系,有可能会得到与事实完全相反的结论。但是只要数据足够大,数据挖掘总能发现一些相关关系,可以帮助我们发现趋势和异常情况。    

 数据来源    

大数据分析的数据来源有很多种,包括公司或者机构的内部来源和外部来源。分为以下几类:    

1.交易数据。包括POS机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。  

2.移动通信数据。能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)等。  

3.人为数据。人为数据包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书、Linkedin等社交媒体产生的数据流。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。

4.机器和传感器数据。来自感应器、量表和其他设施的数据、定位/GPS系统数据等。这包括功能设备会创建或生成的数据,例如智能温度控制器、智能电表、工厂机器和连接互联网的家用电器的数据。来自新兴的物联网(Io T)的数据是机器和传感器所产生的数据的例子之一。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令(如警示技术人员在真正出问题之前检查设备)等。  

5.互联网上的“开放数据”来源,如政府机构,非营利组织和企业免费提供的数据。  

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2018-03-01 14:42:03
云安全 黑客最终会使用大数据和人工智能进行攻击吗?
人工智能和大数据会帮助黑客更有效地获取信息并影响人们的日常生活吗?其实这已经发生了。 <详情>
2018-03-01 11:30:32
大数据应用 孟天广:可利用大数据监测政商腐败,查出“白手套”
“马云说过,有了大数据就可以计划经济。这个是不靠谱的,但是我认为在解决政府监管市场方面大数据还是有效的,包括监管腐败和制度腐败,因为地方现金流完全可以监测出来。 <详情>
2018-02-28 11:08:00
市场情报 Teradata天睿公司入选2018年Gartner分析型数据管理解决方案魔力象限领导者象限
Teradata今年再次入选Gartner公司发布的《2018年分析型数据管理解决方案(DMSA)魔力象限》的领导者象限,这也是Teradata连续16年入选该报告。 <详情>
2018-02-26 17:25:00
大数据资讯 大数据告诉你为什么巴菲特这么乐观
白手起家的亿万富翁巴菲特发表了令人期待以久的年度致股东的信,投资者相信他总能给人最有价值的投资意见。 <详情>
2018-02-26 11:03:00
大数据应用 PTMIND铂金智慧:给所有企业做人人可用的数据分析产品
2017年度诺贝尔经济学奖获得者理查德·泰勒(Richard H. Thaler)曾在2008年与美国哈佛大学法学院教授卡斯·桑斯坦(Cass R. Sunstein)共同提出了一个类似于蝴蝶效应的观 <详情>