11月1日,由中国信通院主办的2019(第二届)中国金融科技产业峰会进入了第二天分论坛环节。其中,分论坛六《金融业数据治理与应用》在当天下午隆重召开。该论坛由中国信通院云计算与大数据研究所马鹏玮主持。
会上,中国建设银行总行数据管理部数据集成管理处处长车春雷为与会者带来了题为《企业级数据模型的设计和应用》的分享。
中国建设银行总行数据管理部数据集成管理处处长车春雷
车春雷:建行对数据治理过程中,形成的数据模型是非常重要的抓手。今天我就结合这个话题谈一下我们团队在做数据模型工作七八年的过程中的一些思考和体会。
今天我演讲的内容分四个方面:
1、企业数据模型的概念特征
2、企业数据模型的应用价值
3、企业数据模型的设计研发
4、体会
企业数据模型的概念
全面性:跨企业的各业务条线、职能部门的数据和信息需求。
整合性:企业中所有数据和规则只描述一次,并且有机衔接配合在一起,没有冗余。
主体性:跨多个业务流程和应用系统,有共识的数据主题。
关键性:主要覆盖对企业高效运作和决策制定需要的、至关重要的数据和信息需求。
企业本体论,是指导企业怎么做信息化,信息化是为企业工作做好支撑。
因为是企业级视角,都是从企业级视角看问题。内容是主题域模型、概念数据模型、逻辑数据模型。企业级数据模型从概念、特征来说有以上几个方面。
EDM的价值之一:企业级数据全局视图,易于沟通。
有了数据地图以后,对整个企业有一个整体性认识。有这个全局视图以后,和别人沟通时方便了,大家有了共同语言。
EDM的价值之二:企业级业务词汇、数据标准。
有实体,有属性,有清单,要做模型时可以看到这些内容实际上把企业所有关键业务概念都包含在里面,这些业务概念就是业务数据,把关键业务词汇表放进来。数据取值、规则描述时,把需求放在里面。有企业级数据模型是把企业常用的业务词汇表、术语表、数据标准包含在里面。常规数据标准是一行一行的,企业级数据模型中可以看到相互关系是什么,有很全局性的视角。
EDM的价值之三:界定信息系统数据范围和可信数据源。
数据只是一列,有流程、有地点等等,实际上通过企业级数据模型只是整个业务模型的一部分,在做的过程中,要和流程、业务等对接,做对接时就很容易知道这个数据的流向,因为数据不是静止的,是需要串接在一起的,所以通过企业级数据模型可以和流通、和系统做对接以后,知道哪一个系统里有什么数据,可以很容易确定这些数据对企业如何进行管控,企业做引用时,哪个数据是最可信的数据源。
EDM的价值之四:数据模型业务对象和规范模型。
我们要做标准,我们要做架构,做微服务。我们在做应用时,经常是面向对象的,现在还有一个很关键的概念:业务对象。做微服务时方便使用。
企业数据之间共享,企业数据要打通,打通过程中有一个模型,这是非常有意义的。
EDM的价值之五:企业级数据仓库模型。
谈大数据,最核心的数据还是结构化数据,因为结构化的数据是矿石,矿石是可以管控的,放到数据仓库里,有企业数据模型就可以很好地构建数据仓库的模型。很多做企业数据模型的思路也都是来自于做数据仓库的模型转变出来的。
做企业级数据模型可以更好地服务这五个方面。
企业级数据模型设计方法
要向历史、向经验学习,把以前的经验总结出来。比较有名的几本书籍,1994年《设计模式》,把经验、方式总结出来,大家去应用。在做的过程中,就有很好的行业模型借鉴去做,就可以快速把企业级数据模型构建起来。
站在巨人肩膀上,吸收前辈经验知识。David先生写了《数据模式》,非常好,把常用的模式经验都总结了一遍,并且里面还有针对行业分别进行了介绍,他的书籍里都有针对于金融业的数据模型,大家可以拿来参考,这样做模型会非常快。
企业级数据模型管控和敏捷研发
管控和敏捷研发是什么关系?如图,我们开发很多工作不是一次性能说清楚的,都是交织在一起的。1、敏捷开发核心是相关人员组成一个团队;2、把大的工作分解成小的任务。这个过程中,把大的事情分解成小事情去处理,就比较好处理;第二是协作多次迭代。
企业级数据模型的建设是迭代过程。
需要相对稳定的协作数据模型团队和变革管理流程,一个业界的参考模型作为基础,从上到下和从下向上两者的结合。
金融科技产业峰会核心是数字化转型,Digitization和Digitalization两词的关系,Digitization是Digitalization的基础。金融科技的构成是ABCDE,与数据相关,谈到金融科技、数字化转型时,更多是来改变我们业务的模式,和客户打交道的方式是这样,这就是我们数字化转型里的变化。现在很多客户不到网点,因为我们进行了数字化转型。
谢谢大家!