问:互联网金融的发展依托大数据,那么大数据的特征有哪些?优势在什么地方?它给传统金融机构带来了哪些机遇与挑战?
张晓蕾(渣打银行(中国)有限公司副行政总裁):传统商业银行也有广泛使用大数据技术,但对技术的依赖程度是一个值得研究的课题。
举个简单的例子,渣打银行的程序性借贷(其中也包括个人借贷)是通过搜集大数据,并设定参数,这是一个自动撮合的过程。整个借贷流程非常快速, 以新加坡为例,两个小时就可以完成审批。产品本身非常好,快速、高效,且成本低廉。但是其发展速度受到一定限制。经过多年的摸索,我们发现,这个业务的增 长速度与其坏账增长并不呈现为线性关系,在飞速增长达到临界点后,其坏账明显增加。当然这与地域有一定关系。
商业银行为什么需要不断调整自身使用的模型?因为这些模型本身就是风险的来源,调整模型意味着对风险的控制,这也是新的第三方机构需要累积的经 验。比如证券界流行的量化策略,实际上是应用历史数据和概率进行投资策略的模型。根据这个理论制定策略,我们却发现黑天鹅事件导致了机构的倒闭,这就是系 统之外的突发性风险。
传统商业银行不能忽视大数据时代的到来,这意味着成本的大幅度下降。如果我们不能面对这样的转变,未来我们可能在很多领域都要让位于在大数据方面有很大优势的新进者。
从另外一个角度来讲,新进者在提供金融服务时,必须要考量传统金融行业行之有效的风控。为什么银行要花这么高的成本去做风控及信贷审批,特别是中型以上的金融机构,基本还是以人为考量标准,如果不能面对面看到贷款方,很难做出重大决策。
武剑(中国光大银行专职董事):银行对互联网金融的关注始于余额宝,他们一开始并没有正视这个问题,对余额宝的影响估计不足。现在大 家都在逐渐适应的过程中,目前尚存在监管的盲区,有一定套利的空间,但它不会是长期问题。我们更关注的是互联网金融的深层次影响,由于近年来移动互联网的 飞速发展,导致数据量激增,形成大数据现象。IBM的研究显示,近两年全球产生的数据量,相当于整个人类有记录以来数据量的90%以上,而且还在以几何倍 数的速度上升。并且这些大数据不光是海量,而且主要是非结构化的。以前银行处理的数据都是结构化的,比较规范、标准,这方面的经验比较多。而现在各种渠道 获得的数据,有音频、图像、视频等各种各样形式,我们不知道应该如何应对。另外,大数据还有一个特点是实时在线。传统数据的生产、存储以及调用是分割的, 很多数据在采集之前就已经经过了人脑有意识处理,如市场调查产生的数据,而大数据的产生和捕获都是在人们无意识地正常生产经营活动中进行,做到了反映真 实,并一直在线,再借助以云计算为代表的新型处理方法,就能将在线的大数据实时进行分析,并将分析结果随时调用。
从战略层面而言,将来银行的业务都会搬到线上,所有金融机构的竞争将在信息平台上展开,从这个角度来讲,简单概括成一句话就是 “数据为王”。将来谁掌握大数据资源,谁就掌握了风险定价的主动权,也就可以获得准确、高额的风险收益,最终获得竞争优势。
银行做风险评估模型的时候用的主要是结构化数据,往往是滞后的,比如财务报表是上一年度的,很多数据是静态的、局部的,而且是容易被粉饰和掺水 的。采用这种数据做前瞻性预测效果可想而知。从目前情况看,五大行的内部评级模型都已经通过了银监会最近的验证,但是这些数据和模型准确性还是令人疑虑。 现在的数据库是过去5-7年的,是在经济繁荣时期积累下来的,没有经过一个完整的经济周期,将来一旦系统性风险爆发,再回头看这些数据很可能低估了潜在的 风险。
应用大数据思维,银行可以根据纳税记录、刷卡记录、存货变动等动态数据进行信用观察,只要观测流量达到标准,就可以发放贷款,采用这种评估方式发放的贷款违约率很低,这就是大数据的作用——各种不同类型、不规范的数据都可能是有价值的。
大数据不光能够改进风险管理的技术,还能促进商业银行的业务转型。商业银行的转型已经开始几年了,但目前的效果并不理想。其中一个重要的原因是 商业银行的严重同质化,一窝蜂式地开展业务,要么都发理财,要么都做小微,要么都做社区银行。由于没有数据支持,银行对自身的业务结构了解并不透彻,往往 只是依靠管理层的主观判断来调整银行转型的发展方向。
进入大数据时代,要学会用数据说话,通过大规模数据挖掘,我们才能深入了解银行自己的客户需求和市场结构,从而进一步确定差异化的转型方向。只 有这样,整个中国金融体系才能避免高度同质化,才能真正活跃起来。从这个角度来讲,大数据既可以做商业银行扩展市场的“矛”,也可以做防范风险的“盾”。 大数据在促进银行发展方面的作用还有待我们继续深入探索。
雷涛(天云融创数据科技有限公司首席执行官):我从产业角度谈谈大数据如何作为工具和推动力落地。
首先,大数据作为Tools,改良优化已有金融业务。先回应刚才提及的一个问题,大数据规模化处理数据,但能否做一些个性化的智能业务?事实 上,对数据业务的理解已经经历了几十年的历程。早先机器辅助参考决策系统,比如BI系统、商业智能系统是面向人类来做决策的,系统面向有限商品有限数据 集,在此之中我们人会基于机器中间状态数据结果,生成相对于的的规则。人的智商以及我们的经验和判断去做有限的商业策略,以面向有限的服务包和有限人群, 所以我们可以在电信运营商里做各种套餐,在金融里做各种产品。而现在的大数据集合里,受众的需求越来越多且碎片化了,我们的产品可能不能定制为一个标准化 的产品,而很可能是根据用户访问的行为随机触发的动作,比如阿里推荐一个产品,9亿个商品,不可能像沃尔玛超市那样能够全部平铺摆开。在用户点击的过程 中,如何发送一个合适的商品给受众,不是依靠报表系统,而是自动化触发的系统。自动化触发的系统更客观地把很多需求定制化和差异化。大数据和以前的BI、 数据仓库本质差异就在于,大数据生成的不仅是一个面向决策报表系统,更多是一个自动化可执行的系统,这个系统可以帮助我们做很多差异型的,个性化的、定量 的动作匹配。
同时对于大数据,我们不要看它不能做什么,而是先尝试它能做什么。大家提到了对获取外部数据的挑战,其实银行业不必急于获取外部的资产数据,比 如工商、房车资产购买记录或者社交行为等等,这些价值稀疏数据还涉及到数据治理的复杂问题,实施利用都需要持续演讲的路线图支撑。其实我们看到,现在很多 金融自身数据还没有价值化,比如现在的账户数据都是结构化的,都是以个体为核心来描述,或是两两之间的债务资金关系,还有大企业的资产负债表、资产损益表 等等。这些数据受限于传统以表为结构的数据组织方式,缺乏全局视野,而我们做定量分析时,需要有一个公共参照体系,像一个米尺一样来衡量今天在座所有人的 身高,而不是表达两两之间的高低;像元素周期表一样用标准参照体系描述所有物种。这个公共参照体系是从全量的金融实体以及它们之间的交易行为抽取出来的模 型。每一个帐户实体在参照系上都会获得一个定量的评估,即使缺少个体数据(例如小微企业),也可以通过其它实体和交易行为量化传递评估。比如以节点的形 式,将每一个金融实体的交易方式做成一个很大的复杂网络。这些过程能把金融实体用以前结构化的账户数据用大数据技术构建新的基础数据平台,这个基础数据平 台可以完成很多事情,比如征信、置信、基于社团发现的供应链的挖掘,完全可以在线上实现而不再依靠垂直行业经验,还有卡业务欺诈与异常交易,很多识别都可 以基于金融帐户的结构化数据实现。因此,大数据可以作为Tools,利用已有数据资源,优化提升已有业务。
大数据真正创新的是推动力,即破坏型创新驱动金融去拓展零消费市场的新业务。传统金融是基于资本获得盈利的,现在金融也可以基于数据实现盈利。 亚当.斯密定义了土地、资本和劳动力缔造财富,现在数据本身也可以作为新的生产资料,用于开拓新的业务。比如许总提到的支付平台模式,可以考虑深入下去, 利用数据延展为商户CRM。我们尝试过基于POS支付做商圈推荐和识别,也就是说,基于复杂的网络结构,具有相同社会属性的客户访问不同的商家,可以统一 置信或交叉推荐,我们可以做很多O2O服务。金融同时也是一个的服务行业,服务中聚集了人群、产品和服务以后,会留下很多电子化的行为痕迹,数据本身随着 生产经营开始形成一个新的生产资料。同时对资本市场而言,评估传统金融资本项和评估互联网企业的用户流量,将在未来交织形成新金融实体的评估体系。数据资 源将与资本资源同等重要,成为未来资本市场评估的新考核体系和重要指标,大数据的推动力驱动和缔造新的财富。