随着数字技术的飞速发展,数据的种类和规模正在高速增长,大数据时代来临了。数据已从简单的需要处理的对象,变成一种十分重要的资源了。
庞杂的数据规模给数据存储、管理以及数据分析等都带来了很大的影响。原有的数据管理方式正在改变,怎么能更好地管理和利用好数据资源,这是我们面临的重大课题,也与其他数据概念有许多的不同。
(1)从研究的对象看,大规模的数据集合是大数据分析的对象,只有依据大规模数据量作基础,才能对大数据进行分析与利用。这里的大规模数据是指收集到的数据之间有直接或间接的联系。否则,就不具有分析和挖掘的价值。数据间具有某种关联性,是“大数据”与“大规模数据”的重要区别。
(2)从技术角度看,大数据技术是从各类大数据中,快速获得有价值信息的技术及其集成。大数据之所以不同于大规模数据、海量数据等概念,就在于大数据在很大程度上包含了对数据的处理行为。为了从大数据中快速挖掘出更多有价值的信息,需要灵活运用各种数据挖掘技术。
(3)从对数据应用方面上看,大数据技术是将特殊数据集合,运用特别技术分析,从而获得有价值信息的行为。它之所以能成为当前的热点,就在于各个行业的经营与管理都能从中获得巨大的利益。再加上不同行业、不同企业、不同业务的数据收集和分析挖掘对象不同,大数据选择的技术也不尽相同,使"应用"成为大数据不可或缺的内涵之一。
从以上可以看出,大数据是其规模超出了典型数据库软件的采集、储存、管理和分析等能力的数据集合,是包括技术、数据和应用的统一,这也是大数据管理与其他概念的数据管理的重要不同。