随着我国数据安全立法走向健全,金融机构对于大数据的应用正在回归理性。
“现在各家银行获取的外部合规数据趋于同质化,对内部数据进行挖掘变得尤为核心。”某股份行高管向21世纪经济报道记者指出,以往有的银行还会使用数据供应商提供的爬虫数据对客户进行画像,但是自2019年后就不敢了,如今,对外部合规数据的获取,各家能力其实相差无几,最关键的是在于打通自身各个业务部门的数据,完善对自有客户画像,包括对相关联的信贷业务、结算业务、交叉销售业务数据进行动态分析整合。
21世纪经济报道记者在采访中了解到,目前,国有银行和部分股份行已经行动起来,正在推进全行数据的互联互通。此外,作为城商行“领头羊”的北京银行,亦率先踏上了这条内部大数据变革之路。
北京银行数据湖建设样本
2021年7月9日,记者在参观北京银行顺义研发中心时获悉,北京银行正在启动企业级数据湖建设项目,将数据划分为“基础、历史、沙箱、实时、集市、服务”六大功能区域,构建“物理集中、逻辑分离、数据共享”的数据服务平台,致力于将自身打造成同业领先的大数据应用银行。
“数据治理是将数据资产对应的数据质量做全方位的提升,而数据治理的前提是,先得把数据资产整合出来,而我们现在建设数据湖便是数据治理的基础。”北京银行开发中心数据湖项目负责人在接受21世纪经济报道记者采访时表示,建设数据湖的契机在于银行业务侧对数据使用需求的增加和监管对数据报送质量要求的提高。
该负责人进一步解释称,原来北京银行是以业务需求为出发点去建设“孤岛”式的数据平台,很多系统里的登记表都是不同部门的人填写,相同客户的名称字节都不统一,数据使用过程中无法实现关联,随着全行各业务线数据量不断增加,业务侧对数据需求非常迫切,现如今亟需将这些数据平台打通,也就是把原来散落的数据模型和数据指标进行一个重新梳理、认定、对齐的过程。
另外,从监管政策的角度来说,监管对银行报送的数据质量也原来越重视,要求银行的原始数据到报送的数据再到监管的统计数据都要对齐。
“随着数据的对齐和打通,能用和关联的数据越来越多,画像便越来越准,由此便可在不同的场景起到对应的效果。”项目负责人对记者说道。
举例来说,由于数据湖打通了全行在主题模型、数据接口、数据标签、数据指标、第三方数据、行为数据等不同领域的数据资产,以客户为维度建立全行客户的全息视图,可以帮助客户经理全方位了解客户的资产信息和行为偏好,有效促进客户营销和风控识别。
此外,数据湖可支持历史数据的全在线应用,通过自动化的方式将全行数据资产进行入湖,并对湖内数据实现永久归档和随查随用,支撑询证函和公检法查询等多类业务场景,大限度提升数据资产价值。
项目负责人还提到,数据湖的整体建设改变了传统数据研发的流程,通过DataOps体系建立企业级数据快速交付机制。
具体来看,数据湖里可以构建沙箱区,在保证数据安全的前提下,为全行数据分析人员提供数据验证、数据脱敏、数据探查的沙箱环境,总分行各级人员可以随时随地查看到自己权限范围内的客户、机构、产品等相关数据情况,辅助进行分析和决策。
另一方面,还可启动数据研发工作站建设,实现数据全生命周期在线研发模式,实现数据研发工作的“标准化、自动化和图形化”,形成调研、模型、研发、测试等多种场景的资产沉淀,支持一键部署能力,大幅提升数据需求的交付落地,整体交付能力提升300%以上,通过重构数据模型,让所有数据指标均可实现快速展示,在营销、风控、运营、监管报送等领域均可最晚于次日便可提供数据服务支持,有效提升行内外用户体验。
“很多集团内部数据价值更高,如果打通了就会特别厉害,但是这个过程很难。”一位从事数据整合的科技公司人士向21世纪经济报道记者如此说道。
数据湖项目负责人介绍称,数据湖建设完全是一个持续的过程,随着打通和关联的数据越来越多,对应的服务业务场景的能力也会随之提升。