中国IDC圈4月28日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。28日上午大数据推动金融创新分论坛中国银行总行软件中心上海分中心副总经理牛晓峰做了主题演讲。 

500-333文章照片-大数据推动金融创新-牛晓峰

中国银行总行软件中心上海分中心副总经理牛晓峰

以下是牛晓峰演讲实录:

 牛晓峰:非常感谢李司,刚才听了前面六位专家的介绍,确实觉得受益匪浅,在实际工作当中遇到的很多问题,通过今天的聆听和学习,感到有了一些新的思路和新的想法,非常感谢主办方能够举办这样一个活动,让我们有机会学习到更多的新思维、新观念,以后有这种活动的时候请主办方一定记得通知我。跟大家汇报中国银行大数据方面的思考。

大数据的发展背景,我不再多说了,目前随着互联网的发展,互联网金融下的大数据发展得非常迅速。我选的这张图是4V,我还见过5V、7V说大数据主要的特征,增长快、变化多、类型多,最关键的还是它的价值。这张图是2013年史文博格(音)在大数据时代里陈述的比较主要的关于大数据的观念,大数据时代给人类的思维带来新的变革,2013年到现在不到三年的时间里,这本书里的很多观念已经有了很多的变化和发展。他在互联网大数据的思维里提到的量化意识、全量数据的观念,现在已经有人把它做了发展和完善。比如全量数据,在银行里我们都知道银行因为自身经营业务,中国银行有上百年的历史,我们积累了大量的数据,是不是说这个数据的量越大就越符合大数据的要求,就越能够挖掘出数据中的价值呢?其实不一定。我们都知道美国现在正在进行下一届的总统选举,特朗普最近的风头很大,美国有一个习惯,每次在总统选举之前都会有一些民调机构预测这次哪个候选人会获胜,其中比较著名的就是盖洛普,盖洛普是怎么成名的呢?

之前美国有一个杂志叫做《文学文摘》,他成功预测了1924、1928、1930年总统的选举结果,到了1936年又是这家杂志预测当时的候选人叫兰登会获胜,《文学文摘》的结论源自于对240万人做的调查,那时候盖勒普只调查了5000人说罗斯福会获胜,事实是罗斯福以很大的优势击败了兰登获任美国总统。为什么对5000人的调查会超过对240万人的调查,是不是数据量越大就一定表示调查的结果越准确,事实证明不是这样。盖洛普选择的人,在人的分布上做了精心的分化,这5000人分别代表了不同地域、不同种族、不同年龄、不同教育背景、不同工作、不同党派,尤其是中间派的人物,他做了这样的选择。对数据的选择的覆盖程度高决定了他最终预测的结果更准确。在大数据领域,虽然只有短短的几年时间,很多的思维已经有了改进和提高。

看看中国银行有关大数据的战略规划和我们实施方面的一些想法。这是我们的主管行长之前就大数据如何进行建设的时候提出的以平台为支撑构建大数据的技术体系,以数据为基础充分整合数据资源,以应用为驱动深入挖掘数据价值,以人才为核心提升数据分析能力。短短的四句话非常具有战略指导意义。2014年美国的Ganner对一千多家企业和政府机构做了调查,当时的调查有65%的企业和机构表示他们正在进行或者在不远的将来会进行大数据方面的项目的上马。在这65%的企业里有30%在当时已经开始了,另外有19%是准备在2015年之前半年之内开始他们的大数据项目,另外有16%准备在2016年才开始自己大数据的项目。

实际结果到了2015年下半年将近年底,Ganner对这1000多家企业和机构做了另外一次调查,大数据项目成功上马的不到9%,为什么?Ganner对他们没有成功做了原因的分析,其中比较重要的几条是这样的。排在第一位的是无法挖掘出数据的价值是什么,第二位是企业或机构没有明确的大数据的战略目标和战略规划,第三是缺乏核心技术,第四是无法有效的整合数据资源,第五是企业的内部无法对大数据的实施和规划达成共识。总结了这样一些不太顺利的原因之后,我觉得有一个清晰的完整的系统性的战略规划,对中国银行以后大数据的建设的作用是非常巨大的。

下面我分别做一个介绍。第一,以平台为支撑构建大数据的技术体系。我们把大数据的技术体系分成战略层面、规划层面和设计及交付层面,在这里面最重要的是大数据的体系架构,分为业余架构、应用架构、信息架构和技术架构四个不同的架构,在这四个不同的架构里分别支撑我们的业务流程和端到端的场景及应用的组建及分析模块,最后是设计跟交付。我在这张图里特别提到我们在实施的方面采用分行试点的模式,有很多的调查机构在对大企业实施大数据项目做了总结之后发现大数据的项目实施方法上分两个流派,一个流派是自顶向下的,上来规划很大的大叔据的东西,从地层往下逐渐延伸,累了大量的数据,在这里面做清洗分析,在这里面找规律,再看这个企业怎么从数据里得到什么样的东西。另一个流派是从底向上的,先看需要哪些东西,再对这些数据进行整合。我看了很多相关的实例之后,后一个方法在现阶段的效果会更明显,有了清晰的需求才会更准确的对位需求的产品。所以我们在大数据实施的策略上采取小步快跑、快速迭代、迅速试错的方式。

这是中国相关的云平台的建设策略,中银开放平台,2014年IDC金融的大奖,去年获得人民银行的奖,亚洲金融家组织把它评为今年最佳的金融云服务产品,这个产品是我们对大战略的落地实施的例子。这个产品的主要设计思路是我们把整个中国银行的大数据进行了归并整理之后,开发了1000多个标准的API接口,这些API接口可以用与我们的分行甚至我们的客户,在我们规划的未来里,可以通过这些API访问和使用中国银行的数据,用于加工得到自己想要的相关结果,目前已经有很多分行利用这样的平台开发出了很多比较受欢迎的产品,大家如果有兴趣的话可以在苹果的APP Store或者安卓的平台下载这个产品看一下。

以数据为基础充分整合数据资源,扩充银数据采集范围,延长保存周期,跟刚才讲的一样,我们在很多产品里把一线的数据通过延长保存周期的方式变成在线的数据。整合海内外商业银行及集团附属公司的数据,中国银行在混业经营方面范围是比较大的,我们有很多保险、基金等等的附属公司的数据,我们希望都能把它整合进来,拿到跟客户相关的完整的数据。我们非常希望利用银行的外部数据服务,借这个机会做一个呼吁,很多渠道的互联网企业掌握的数据在广度宽度上比金融企业有优势,他可能更会知道客户什么时候上网,访问了什么网站,在哪个网页待了多长时间,宽度可能比银行宽,但是金融企业的数据是有深度的。

给大家讲个很有意思的例子,迪宝就是ATM的主要供货商,他是这家企业的主要管理人员,他给他的客户在某个地方装了一台新的ATM,用了一段时间客户来找白天没什么交易量,晚上有大量的交易,是不是有欺诈的可能,迪宝建议他找个侦探看看,这家机构真的是雇了个侦探,调查了没两天就回来说晚上交易频繁的主要原因是这台ATM旁边很近的地方新开了一个色情俱乐部,很多人不愿意在色情俱乐部留下他的信用卡记录,所以这个ATM在12点到2点的时候取现交易非常频繁。拿到这个调查结果之后,迪保一笑了之了。当地马上出了一个很大版的新闻,某某银行知道昨天晚上谁去了那家俱乐部,迪宝自己在评论这件事的时候说银行的数据不仅记录了一个客户在某个时间做了多大金额的交易,他通过交易地点和交易类型能帮助很多东西,能够帮助我们分析出客户的行为习惯。所以说银行或者金融企业的数据在深度上不是一般的互联网企业能够比拟的,如果我们金融行业跟其他的相关企业进行有效的数据交换,大家彼此利用对方的优势,就能够使我们这个数据得到更完美的使用。

这是中国银行的整体架构图,跟前面三大行的专家介绍大同小异。我们希望通过全集团的数据对客户进行一个360度的信息采集的规划的架构图。我们非常希望在合规的前提下充分利用银行外部的数据服务。以应用为驱动,深入挖掘数据价值。举一个例子,某个分行做的一触即发的产品,他的产品思路是基于客户已有的信息的分析和客户的年龄、客户的区域、客户的背景资料、客户的交易行为习惯,他在网点排队取号,右边有针对客户的产品推荐,这是大数据应用的场景。此外中国银行还推出来口碑贷、中银沃金融的服务,都是按照这个思路去进行我们产品的组合规划和设计。

精准地建设客户的营销平台,目前我们正在建设基于大数据分析的线上和线下的精准客户营销平台,把线下的客户信息和线上的客户行为统一在一起,把结构化的数据和非结构化的数据有机地提炼并且整合,争取能够精确地描述客户的各项属性特征。

以人才为核心,提升数据分析能力。很多大数据的开发最关键的因素还是人,对大数据的人才,各个企业都有自己的标准,对人才的培养,各个企业也有自有的方式。对于银行金融服务来说,我觉得最主要的是对数据分析师的培养,数据分析师最佳的基础人选就是具备软件开发经验又懂银行业务的资深程序员,能够有好的数据分析师的队伍才会使我们的大数据建设得到事半功倍的效果。

我就跟大家分享这些内容,谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>