中国IDC圈4月27日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。28日上午,在中国信息通信研究院、数据中心联盟主办的大数据人才发展计划公开课上杭州华三技术有限公司系统架构师孙晓军为大家讲述了大数据治理与管控的精彩内容。
杭州华三技术有限公司系统架构师孙晓军
以下是孙晓军演讲实录:
孙晓军:谢谢大家!这次演讲分成三个内容。第一,讲一下数据治理和数据管控这个市场。这两个领域是比较专业的,所以很多东西大家可能都要问为什么。这个解释一下。第二,实现大数据治理怎么样实现,怎么做。第三,就是实践。
第一部分,我今天讲的东西是讲数据,跟其他的上面的应用,下面的基础架构没有关系,讲中间的这样一个数据。首先,讲一下数据的发展过程,到今天是大数据时代,大数据时代已经成为系统或者我们组织的一个非常重要的资源。这个我是附庸的阶段,刚开始在计算机产生的时候数据是一种什么性质的存在?是纸带,数据是以那种方式存在的,计算机以大规模的机架存在,所以那个时代数据绝对的附庸。经过很长时间的努力,数据有独立的概念,就是数据库产生了,这时候数据单独作为系统中应用里的一个单独的元素存在了,所以产生了数据库。到大数据时代,整个社会都在谈数据,都在谈大数据。所以,我觉得数据进入一个引领的时代。
在大数据时代,非常多人说,对于国家这个层面上来讲,大数据就相当于像是资源,像是石油这样的一个东西。但是,我们不用以那么高的角度来讲。作为一个组织,一个企业来讲,这个数据应该已经位列人财物的第四这样的一个元素了。所以,它是我们要重点关注的一个对象,多数企业。以前为了人,为了财,为了物已经形成了很多这样的系统,这个大家都清楚。什么ERP、CRM、财务。数据在这个里头作为一个非常非常重要的资源也应该进入到我们管理的范围内了。为什么讲这些?就是今天我讲演的内容我们是定位在企业第四种元素的管理上面。
数据有两个方面的含义,一个是数据本身,另外一个是数据的内涵。我们今天讲的这样的系统只关注数据的本身它的外在,而不关注数据的内涵,数据代表什么意思?我们管理的是数据。现在叫数据仓库,我觉得这样一个概念非常贴切。数据如果是一个仓库,我们这边讲的我们是这个仓库的保管员。所以,我们关注的是装各种各样产品的箱子,我们不把箱盖打开看里边。
第二个方面是治理、管理。为了做好一个事情,第一件事要干的是什么?就是动机,你想干什么,为了什么?这些事情是管理人员要做的。这个用一个时髦的词来讲,叫愿景,叫目的,我们干的事情总得有点愿景。下面就是怎么做的过程,这是我们重点要分析的过程。就是两个方面,一个是做什么,就是说为了达到我的愿景,我的目的,我要做哪些事情,要正确的把这些事情找出来,这是一个方面。另外一个层面,就是更下到一个层面了,就是我们怎么样把选出来的事情给它做好,这样两个层面。
第一个层面,Do right thing,就是治理,习总讲的那些非常顶层的设计,就是我们国家现在要转型了,经济发展要转型了,然后下面就是识别持续要做很多事情,其中有一个做的就是大数据的这样一个事情。那么,我们下面也要分享一下,要把数据这个事情做好了,应该怎么做。
第二个层面,我们怎么把这些事情做好。所以,这样的两个概念我现在给大家澄清一下,在这两个概念的基础上,大概我们做这样一个事情,从一个技术人员的角度来讲,可能是三个这样的小椭圆。第一,目标策略,我们要干什么,怎么做。第二,组织流程的保障,主要是针对人的。下面是工具和技术的这样一个支撑,我们下面整个的胶片也是围绕这个来展开的。
说一下我们愿景和目标到底是什么?其实数据管理大大的一个愿景是什么?就是数据有很好的可获得性,有很好的可用性,有一致性和审核性,数据的质量很好,数据安全很好,所有的这些东西都是为了上面的应用做一个支撑。这就是我们数据管理、治理工作的一个目标。
下面提一个新的概念,传统企业都有供应链的概念,大数据时代提出数据供应链的概念。顺便也给大家,如果不太了解数据分析处理流程的同事,大概的分享一下整个这样一个过程是怎么一个事情。一个数据分析系统一共有三个阶段,第一,数据源,这个是各种各样的数据,中间这个位置就是对数据进行了各种各样的处理。第三个位置就是数据应用。这个方面大家一想,我早就知道了,但是这个也就是知道而已,那么我们下面先大概的用这样一个饭馆,作为一个饭馆老板,我们理解一下数据供应链到底是什么概念?先从这个开始讲。数据接入这样的一个层面上来讲,其实就相当于饭馆要有一个采买员去菜市场买各种各样的菜。在大数据时代有一个很重要的特点,传统时代基本上是ERP、CRM这样的系统进来的数据就可以了,大数据时代就是“4V”里头有一个V很重要,就是它的多样性,数据的结构化、非结构化的种类非常多,当然还有各种各样的特点。
所以,在大数据时代我们采买的工作跟以前不大一样了。所以,这里头提出一个单独的层次,就是数据采集层,主要解决4V里头的多样化的问题,要解决性能的问题。采买员把菜买进来之后,进入大数据系统里头。我们的菜买了以后,显然不是直接能做菜,首先得洗,最起码把烂菜都摘下来,得洗一洗,还得按照大厨的要求做什么什么样的菜,对数据进行物理上的加工清洗,这个过程我们叫数据处理的过程,时髦的词就是ETL。把这些弄好以后,我们这里发明一个词,叫数据的菜库,把这些菜放到一个菜库里头,数据分析系统,这个菜库以前技DW,现在还叫DW。然后开始基本上就可以营业了,这个时候理解一下,用户来了,点菜的客户来了,说点鱼香丝,这时候就有大厨了,就是数据科学家之类的人做。他做的时候得有两个事,有火、炒勺,然后有菜,菜比喻成数据,然后火、炒勺就是基础架构,把这两个东西融合在一起开炒,炒完之后,把这盘菜送到桌前,其实就叫呈现。所以,一个大数据的处理过程基本上是这样的,中间很复杂,但是基本就是这样。大数据的治理与管控就在这儿之间,主要为后期的数据的应用提供支撑。
数据处理的时候我们现在谈到的应用全都是数据驱动的系统,做数据驱动系统的时候,第一点一定是建模。大家有的时候可能不太理解,拿到传统的数据库的教材里头就会说概念建模、逻辑建模,然后物理建模。然后学生、学号就过来了,这是一种说法。但是,从另外一个角度给大家深度的剖析一下。所以,为了剖析这个,就有这的一个观点,这个观点当然不是我的,就是我们现在生活的这个世界可以分成三个空间,各种各样不同的空间。第一个空间叫意识空间,这个空间就是我们大脑,所有人的大脑组成一个意识空间,意识空间现在有一个联网的东西,非常著名,是互联网,互联网是一个典型的意识空间的联网。大家可能想一想,所有的互联网上的应用全都是由于我们的脑子支撑我们的手敲键盘产生的,所以互联网是意识空间的联网。还有一个空间就是物理空间,这个空间里有非常多的属性,比如说有温度、湿度。比如我现在就感觉比较热。所以,物理空间这也有一个网络联网的概念,现在所谓物联网。另外一个空间就是信息空间,所有的这些联网,各种各样的事情其实都是作用于我们的数字空间、信息空间。在这个空间里头,两边的空间他们跟它的一个概念是什么?这里头的实体,或者概念,这边是一个概念,我高兴了,失恋了,这些都是我们人才有的一些概念,在这个信息空间里头的一个投影。投影以两种方式存在,第一种方式以过程的形式存在,比如支付宝付账,有一个先认证再入账的过程。另外一个是实体的投影,其实最终的结果就是数据。比如问我高多少、体重多少,颜值多少,在这里都是以数据的形式存在,就是作为一个实体,有身高的实行,有各种各样的属性,大家知道这个就可以了,就是两种投影。模型是什么,这个就是就叫模型,只不过是怎么投影的问题。
数据建模其实是一个本体论,就是我存在,这就叫本体。那么,其实在整个世界里头,这个本体是有很多的。那么,各个空间之间的本题是有一个交互的过程,投影就是一种交互,两个空间,左和右那两个空间直接交互,那也是一种模型。他们这些模型之间的交互最重要的一个问题就是相互之间能沟通,能沟通一个最重要的问题就是建模,对我们来讲,在数据空间里头,这些东西整个的沟通其实就是一个建模的过程。我们以前有N多的系统,我想再强调一下,我们今天讲的系统是数据的治理、管控系统,它是一个业务系统,跟ERP系统、CRM系统,跟各种各样的系统没有任何区别,都是一种业务系统。所以,我们遵循的方法论跟那些系统遵循的方法论是一样那些系统要建模,我们的系统里头也要建模。那些系统里有学校里的学生要建模,我们这个系统里最重要的建模的实体是什么?数据。数据首先有大小,它有位置,谁生产的,数据还有更新频度、质量问题,所有这些纬度要加在一起,我们其实在这里考虑是业务域的数据要在这里进行一个投影。
我们为了把数据之间的模型相互交互,跟物理的技术域要进行交互,我们中间要有一个翻译,这个翻译就叫逻辑模型。逻辑模型其实就是一个翻译,这样物理空间就能跟概念空间进行交流了。物理模型很简单,要存储的物理模型就是以文件形式存,从姓名、行存,列存,那也就是很简单的模型了,中间就是数据库。我们讲在数据治理的这样一个系统里面,这样的一个逻辑模型其实很重要的是元数据,我们的元数据打通了下的两个空间。大概讲了一下这些概念。下面还有一些概念还不懂,大家直接说就行了。这里面讲怎么做,数据治理的目的刚才讲了,就是为了各种各样的好,我们的方法也有了,把事情分析出来,识别出来,怎么做好。刚才都是方法论。
整个治理架构,我这次的题目叫数据管控,其实就是数据的治理、管理与控制,这是三个不同的层面,从软的到硬的,从虚无的到实在的,中间有很多过渡。业务存在一个目标,目标是为什么,然后识别出很多管理的东西。比如说在数据治理里头要识别出来最重要的三个事情,是大数据治理、隐私和安全这非常重要,质量非常重要,质量以前也很重要,现在为什么更重要。数据生命周期很重要,我现在讲的都是跟大数据的“4V”连在一起的。然后下面是技术,各种各样的系统,各种各样的技术,各种各样的计算模型,软CPU,软硬盘,支撑上面的这些东西。所以,它对它是一个支撑。另外一个方面,其实驱动下面整个执行,最重要的是流程和组织。在一个系统里面没有人,这个东西是转不起来的,特别是管理系统。
看一张图,这是埃及的金字塔,地下是黄沙漫漫。在这一页里头,我们讲大数据治理业务的数据架构。我们这样的都是业务,这些业务一定是有些系统,所以数据架构要搞一搞。这个就是我想讲的,我们在数据治理这个业务里头,它的数据架构跟金字塔就很像了。最底层和上层,这是数据捕获,上层是应用分析,中间是我们要干的。那么,我们可以看一下,在大数据这样的一个背景下面,我们业务的数据架构跟以前大概有什么不一样的地方。首先,什么叫数据集成?这是一个概念,数据集成就是把一堆数据弄在一块,十个数据变成五个数据,再集成就是这个循环过来,可以把五个数据变成两个数据,两个数据变成一个。所以,数据集成就是一个数据集中的过程,是一个循环的数据集中的过程。所以,我们业务在数据管控里头最重要的一个支撑过程就是数据集成。大数据的背景下数据集成跟以前有什么不一样。数据仓库的时候数据是根据主题进行集成,但是大数据的这样一个环境下面,第一次的数据集成就变化了,它是没有目的的收集数据,它的目的就是没有目的。所以,它就是面向原始数据收集的一个过程,把收集下来进行极其充分的处理。为什么要这样做?第一,大数据就是为了集成而集成,这是大数据的一个很主要的特征。在上面金字塔的塔尖,就是有主题的,就跟我们以前的数据仓库是一样的概念。这个就是我们今天在关注的一个业务,大数据治理与管控这样的一个业务。它的二次集成就是为了它。所以,大数据治理的是看待数据的本身,不是看待数据的内涵,看数据内涵的是数据分析这一块,而这一块业务是只管数据的本身。
刚才从数据架构的角度分析一下这个系统。现在从系统构成的角度上分析一下数据治理与管控这个系统的功能点大概是什么样子。咱们刚开始,我们梳理了几个东西,安全隐私、质量、生命周期,至少这么多。我们从数据治理的架构,整个技术架构角度来讲,看一下应该是什么样。首先,这个架构其实是一个数据进入系统以后的一个顺序就形成这个数据架构,分成三层,第一个捕获,这个能知道,就是刚才讲的那一块。第二个就是组织,其实数据集成管控,数据的治理、管理、控制就是一个数据的组织的一个过程,有组织,有距离的数据就可以提供很好的东西。所以,它的核心本质,我们做的就是组织数据。这是从数据本身进行组织数据。第三个层面是数据的分析,那么,我刚才跟大家讲了,我们重点是这儿,我为什么要打这儿,我不是讲数据分析本身,而是作为我们这样的数据系统如何去支撑数据分析。所以,这个系统的构成,在我们看来一个大数据系统的构成,底层的平台应该是这样的,大数据系统构成是这样的,两块就是基础架构和应用,我们这个基本上代表基础架构的体系结构,就是这样的。
然后,开始这个点,我们要做哪些正确的事情,这些都是数据的点,这是数据源,数据源在大数据的背景下面,最主要的就是数据源太多。还有可扩展性,知道是灵活性和性能,性能就是我们可以横向的进行扩展。灵活性就是针对不同的这样一个数据源,可以经过类似于插件这样的一个手段,定义好之后插到我们系统上。数据标准跟数据架构是直接相关的,当然有几类标准,有外形上的标准,应该长什么样的,还有一些是质量的,各种各样的安全,各种各样的标准都会有。所以,标准我放到数据架构下,为了组织数据,最重要是元数据。还有主数据,主数据就是数据共享,主数据就是作为一个大的企业来讲,我的系统非常多,在以前烟囱式的结构里头,有一些重复的数据。比如学校里头学生的姓名,各种各样的条件,家庭住址,这是很多系统要用的,但是以前它是分开的。所以,主数据基本上从分享、共享这样一个角度考虑,把关键性的数据提取出来,放到一个集中的地方进行管理,这个东西就叫主数据,主数据不是大数据系统的根本内容,但是大数据系统要用到主数据。然后,审计,还有数据的生命周期,还有质量,这是最重要的几块,这是创新。
元数据,所有这个我讲的都是大数据这个背景。我觉得元数据首先有一点,其实元数据首先一点它就是数据,没有什么特别的,它从数据本身来讲就是数据。第二,元数据其实是一种数据组织的一种机制。我刚才说了数据了,一个数据,比如对于数据本身来讲有地点,从哪儿生产的,质量要求什么。但是不同的数据质量模型是不一样的,但是每个数据一定有描述它的模型。不同的数据有不同的元数据,这样由于我们在大数据的背景下面,数据的差别极其大,不但组织域内的数据,还有组织域外的数据。大数据的核心是数据的整合,特别是域内、域外的数据整合。
元数据可以有这样几个层面,元元数据其实是描述怎么给数据建模这种语言的数据。我刚才用数据建模,这是元元数据。然后是服务型的元数据,告诉我们这个数据怎么对外服务,还有管理员数据,管理员数据的概念就是怎么操作,这些过程性的一种管理在我们的数据空间里头,这个模型就是管理元数据。还有数据集,我们数据管理的时候往往不会针对一个数据进行管理,我们会把数据集成一个集合进行管理,这样也方便。
大家觉得为什么?我们如果熟悉用户数据大家可能知道,我们对用户管理的时候是针对用户组,这个组的授权、认证各方面的事情。一个用户只要加入一个组就可以,它就是一种管理上的方便。所以,在我们数据管理治理这样的层面,数据这样的一个级别是很重要的,它有一点分类的意思。这是数据的一些使用方面的东西。内容元数据也是数据使用的一些方面。
其实大数据的治理、管理和控制它里头有非常多的模块,或者叫功能,它们其实就是不同元数据之间的假护。这里头会有很多。但是,同样一种数据,比如学生这样的数据,在不同的学校里是不一样的,所以元数据是没有办法交互的。现在来讲,我们做数据集成的时候仅仅做一些工作也就可以了,但是在大数据的状态下,还像以前比较固定的架构是支撑不了的,怎么办?就是要有大数据的一个元数据系统的管理机制,这种管理机制会把所有的这些不同类型的数据映射成一个标准的形式,然后进行交互。这个里头很像我们的IP网络系统,IP网络就是网络的网络,我们以前在网络发展的初期有各种各样自己发展起来的网络,网络之间通信费很大劲,他们就是在所有的网络下面假设成一个IP层,然后在上面进行IP的交换,然后再下来。我们现在提供这样的一个管理思路也是这样的,就是跟上面IP层是一样的一个东西,把所有的元数据,甭管是A企业的还是B些小的都映射到上面,然后在上面进行一个交互。
谈安全和隐私也是很重要,大数据和以前的大数据有什么区别?我提出一个大数据敏感度的一个长尾效应。尾巴如果集成起来,力量是很大的。比如最出名的长尾效应就是互联网上面有一个长尾效应。比如我的裤子很难买到,不是没有人生产,而是生产了这样的一个裤子,这样的一个鞋没几个人买,很可能就被处理掉了,是亏欠的。但是,互联网电商产生了以后,就产生一个非常大的作用,它就把我这样个体的一些长尾上的需求整合起来了,至少在中国这样一个范围内整合起来,形成一个很大的示范效应的市场,这个时候它的供应不成问题了,这就叫长尾效应,长尾效应效应是能产生很革命性的东西的。大数据的敏感东西在长尾效应上面也是能产生的。这是长尾的头部,它的主要特点是只要纳入了我的安全管理,它的敏感性一定很高,相应的来讲,它的种类是很少的。但是,大数据不一样了,大数据一个“大”字不是数据量,第一位的不是数据量有多大,1P,100P也可能不是大数据,大数据第一位的我认为是纬度,它的纬度要非常非常大,纬度极其大,但是,每一纬的数据就算不是很大,1T也叫大数据的纬度。如果有信任用我们大数据的能力进行了一次整合,那么它的敏感度就会有一个本质性的问题了。所以说,大数据在敏感度管理上面要跟以前截然不一样。这一部分甚至是最主要的一个问题了。我们做大数据安全等保的时候,这一点是非常重要的点了。
大数据带来隐私侵犯这样一个问题,这是大家都关注的一个问题,数据用多了以后,我们的隐私其实是被暴露的。那么,对隐私进行管理,我觉得首先要说明什么是隐私,我觉得大家可能对隐私的概念,觉得保密的数据就是隐私,其实不是这样的。这里头,这是城市白领他有一个大的机会,你一个月挣多少,这是大家认为很隐私的东西。但是,他过年回家,遇上这么一位,结婚了吗?有孩子了吗?挣多少?对她来讲没有任何问题。所以,大数据是根据应用决定的,在某种应用下,是你的隐私,在某种应用下,也许不是你的隐私。
举个例子,一个女澡堂里,突然闯进去一个男的,这个时候就有保护隐私的问题。上面是隐私,还是下面是隐私?澡堂的大妈是非常有经验,说把脸捂着,这叫保护隐私。但是,在这样一个环境下面,脸显然不是隐私。所以,隐私最核心是能识别到一个人的数据就叫隐私。但是,在不同的应用里头,不见得就能识别到同样一个数据。所以,我们隐私的时候要有这样一个概念。所以,隐私的管理跟敏感度的管理以前是放在一起的,但是数据等保里提出一个概念,隐私跟敏感度应该分开关系,就是在元数据里头最起码隐私属性要跟敏感度的属性分离开,绝对不能混在一起。
质量问题,还是从大数据的角度来讲,域外的数据,域内质量不好,可以按照你的规章制度怎么检查,然后提高数据质量。但是,对于域外数据可以吗?没有办法。另外一个雪上加霜的事情,大数据时代如果数据质量过差会产生很大的问题。最起码我们现在有很多大数据这个年代里头它的速度很周期,所以很多比较实时性的复杂事件处理这样的系统,比如股票、信息,那边是买和卖的决策,如果数据的质量产生了重大的偏差,甚至数据是被人有意的攻击,篡改了,这个时候就会对这个系统产生非常大的危害。所以,这是一个难题,我觉得靠企业一己之力没有办法解决这样的问题。在大数据年代里面,整个从社会这个家度进行资源的整合。所以,在大数据的年代里头,质量控制应该形成一个质量联盟,还有数据质量情报,哪个地方产生了数据质量的问题,产生了什么问题,后果很严重,把这些下到联盟的盟员里面去。还有数据质量指标体系的制定,以及数据质量的业务规则,对数据质量进行更改的时候这是业务规则,都可以从这个角度上进行整合。最重要的力量,互联网就是整合,就是把这些各个企业里头的数据管理系统进行一个整合。比如发现问题了,往上报告,我有对某一个数据实体的质量清理规则,大家我给你,你给我的共享,形成合力,这样很可能数据质量在控制方面,最起码在联盟内部是处于一个可控的状态。
对它来讲,在联盟里头它的数据在某种程度是可控的,至少质量是可知的。这个在质量管理的时候,可知可控是两个不同的水平,最起码要做到,我知道数据有问题就可以了,有的时候控制实在达不到也行,因为上面可以有相应的规避。生命周期管理,最重要的是把数据删了,还是留下来,这是我们最重要考虑的。为什么?首先是因为成本的原因,以前说一年数据非常贵了,现在Hadoop里头便宜一万一呢,但是也九千美金呢,1T的数据也是很贵。大数据为了收集数据而收集数据,最后一定有问题。这时候要考虑去的问题,把哪些问题去掉。但是,还有在数据去的时候还要考虑另外一个问题,有些数据要保留,为什么考虑?是从合规的角度上要考虑。因为合规这样一个评估它是基于原始数据,而不是加工以后的数据。所以说,我们在这个里头就要考虑到国家、行业的规则,未来的合规把这两者考虑到,去和留考虑到了,我觉得可能做的就比较好一些。
数据资源管理,我刚才讲了一些具体的点,那么我们整个的合起来,把它数据架构,核心的点都联合起来,大概是这样的一个架构。我们下边是数据源,然后是一个资源统一的管理平台,这个平台提供两个东西,第一个东西是能力,能力是什么?就是预算能力、存储能力、网络能力。在这能力之上覆盖一层数据治理、管理、控制的系统,保证数据的质量各方面给上面的系统一个非常好的支撑。把数据收上来以后,有能力,在这儿进行了第一次集成,这是DW这块,是企业级、组织级的过程,这个数据就是为了收集而收集。那么,在这个企业上面进行第二次集成,我引用了以前的概念,叫数据集市,这是部门级的数据集成,它的集成是有目的的,是为了某某应用,整个数据处理过程,集成系统大概就是这个样子。
刚才我还讲了最下面的数据应用,我们做基础架构不支持数据应用,不技术数据分析,但是我们要支持数据应用,怎么支持。我有一个观点,叫万众创新。我认为大数据的成功是数据系统可持续性的发展,上面不断的涌现新的数据应用,在不断涌现新的数据应用里头有一些杀手级的应用产生,这种东西就是大数据的成功。叫杀手级的应用?现在互联网的个性化推荐,那就叫杀手级的应用,那是大数据非常著名的应用,而现在的情况无论是企业,还是政府部门做大数据的时候往往找一些第三方的应用开发商,他们解决的仅仅是当时管理人员的脑子里头能想到的东西,而这些东西真的是未来的杀手级应用吗?未必。
那么,真的让数据形成一个生态系统,能这样的循环进展下去,我觉得还要把另外一股力量引进来,就是小人物。比如说一个部门,环保部门里头,楼道里扫地的大妈,食堂里做菜的师傅,他们也有自己的思路,他们是不是可以到我的数据平台上进行一点创新呢?所有的这些人都可以上来,这个时候就形成了让这些小人物他们拥有非常独特的视角,然后我给他们很大的能力,比如数据,以及数据处理的能力,这样一个支点,很有可能这样的小人物就可以撬起大数据应用这样一个地球来。所以,这个非常重要。我们怎么看这些小人物才能很好的创新。总之提供一个很好的数据创新的环境。
讲一个具体的例子,大概一个数据业务,无论现在讲的数据业务,还是数据管理的业务,其实万变不离其宗,核心就是这样一个架构。然后我们的三个层面,第一、数据采集层上来,然后在数据管理层进行两次集成,提供各种各样的能力,然后这边的应用系统在我们的创新平台上进行他们的创新。谢谢大家!