中国IDC圈4月28日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开。

其中,在4月28日上午“大数据与电信业转型”分论坛上,享宇金服CEO蒋妍君发表了主题为《透视通信数据在金融领域中的应用与思考》的精彩演讲。

电信业-蒋妍君

享宇金服CEO蒋妍君

以下为蒋妍君演讲概录:

蒋妍君:非常高兴这次有机会跟我们最重要的客户一起探讨一下我们的一些实践应用,我们做的是应用层面的,而且是打通了跟金融行业相关的应用层面,我们这个案例是在2014年已经在落地实施了,2015年在四川完成业务运行,到现在一年的时间,希望通过这样一个案例能给所有参与人一些借鉴和思考。

在谈到应用层面的时候,一般我们会讲应用的价值,我们会分析一下,大数据变现,应用等同于我的数据要产生价值,我要收入,这个收入的来源可以是三类。第二个比较典型的是内部提升的管理,现在在各个领域都有这样应用,他是以内部的优化和服务的提升为目标,更多瞄准的是自我。第三种应用是新产品创新,而且是跨领域的。在大数据很多应用过程中,我们会发觉有一种情况,数据的采集方和应用方是分割在两个完全不同的领域。我们已经把通信的数据应用到金融行业的时候他是完全不同的两个领域,这两个跨领域的创新是非常重要的价值源。我们是一家为金融机构做服务的专业性机构,传统的金融圈是偏封闭的,随着2013年互联网金融兴起之后,这个封闭生态圈在被打破,比如我们的电商BAT,在金融领域大量的进军,这些都是一些非常重要的,在这个过程中,我们觉得通信业应该怎样面对这个过程,我们要成为竞争者还是成为合作者,其实是需要思考的,在最开始的时候这里面有不同的思想,我们在现场看到了大多数的通信企业会选择成为合作者,因为我们是平台提供能力者,在这个过程中,作为这样一个合作者我们的价值到底有多高,我相信通信行业对自己的理解是有的。我们看到了很多数据,这些在2014年我们对通信领域的思考,我们确实觉得通信数据价值在金融领域的应用,在我们认为的全中国大数据源中是最有价值的,当然也是最难的。

所以在2014年的时候瞄准了通信数据领域的数据源做了一系列的开发性工作,这些都是我们会考虑的,更多的,我们对它的定义会是在最下方他跟我们的消费和支付的差距有,芝麻信用为代表的BAT的状态是完全封闭的状态,他有自己的消费数据和支付数据,支付是一种金融服务是完整的生态圈下所有数据的整合,他在征信空间上代表性更强一些。通信到底是什么样的价值,作为单一数据源来讲,它有很强的价值,但是,在对一个人的支付行为的分析上,其实表现能力比较弱,如果从征信的角度来看,把他作为唯一数据价值的时候,他会缺乏一些代表性,但是在其他数据源没法解决的问题上,通信数据反而具备非常强的作用,比如稳定性,在金融角度来看数据的时候是不一样的,他的要求不一样,通讯数据对于一个人稳定性的表现是非常有效应的,我们会合理分析,这个时候有一个问题。在实际应用过程中,我们选择了信贷,实践应用也是这样的,征信和信贷还是有区别的,在这个里面通信价值都非常高的。我们来看看怎么办,在实际应用过程中有几个越不过去,我们是站在2016年的时间点我们已经有一些成果,当时是在2014年,我们面临很大的挑战,比如个人隐私,怎么样保护,怎么做业务,输出一个号码行吗,肯定是不行的,数据安全问题怎么解决,还有通信资产,我们最愁的是后面两项,当我们有一个东西的时候非常值钱,这个东西卖不出去的时候价值是零,到底有怎样的并价的方式,2014年实际应用的时候跟我们的合作移动探讨一种思维,我们到底应该用成本定价法还是价值定价法,我们选择了价值定价法,因为逻辑上很难用成本定价。比如传输三个数据多少钱四个多少钱。这个在金融逻辑思维的接受力度比较难,到底是多少?我们采用一种方法,到底为金融降低了多少成本,我带来了多少收入,在风险控制环节上到底帮你起到多大的作用,我给你带来的价值效益到底是多少,我们叫做一个价值创造的过程,但是对于所有的价值创造方来讲,这个蛋糕是三方分享的,移动中间方银行金融之间做分配。

这个时候我们发觉构建一个商业逻辑就有基础了,如果你只是在这儿谈论,移动数据如果定点到个人,跟金融是达不到同日而语的。我们家所有的电话号码都是我的身份证注册的,非本人使用手机号,这是很常见的现象,但是在金融生态圈里产生巨大影响,在数据的精度上有一个区别度,我们在这个应用过程中采用了最简单的方式, 我们先不谈我们到底值多少钱我们先谈谈到底给你带来多少价值,通过价值锁定的方式做业务流程的设计,这会成为我们非常重要的方式,我们在过程当中并没有选择最简单的数据输出或者健全的方式进行业务,因为其实在数据输出和健全的过程中往往对价值的评价都是成本定价法偏多,带有这种概念在里面,他很难确定,不论你怎么定,都可能有国有资产流失的嫌疑,三个运营商都是国有企业,大家都知道数据是一种资产,已经被所有人认为数据是资产,在数据资产定价的时候是非常大的难点,我们采用了共同的业务设计。这个难度会更高一些,其实对于价值实现更明确,他会从收入成本风控三个维度跟金融分享利润。我们做了三个动作,第一个是目标画像,第一点是在移动自有体系完成,我们站在金融机构的角度提建议,我们给了第一个模型给移动公司,第二和第三是放在业务平台封装打包的评估状态,这三个在业务流程全部拥有的状态,给用户带去价值。基于这三个价值我们有一个简单的业务流,我们花了两个月的时间跟移动从法物信安所有部门开会讨论创造的。比如刚才提到授权要移动,我们这里面授权是移动,因为整个业务流程体系的设计里客户三大敏感信息都不是移动给到我们这个平台,是客户自己去填写的,客户填写之后也要授权,一般是三方机构授权,我们是移动系统授权,所有健全过程是移动体系内控制,验证码的发送也是移动体系,没有由于三方公司自身原因造成在授权当中的一些问题,不能真实表示客户的意愿,我们还有授权信息搜集,还有客户当时时间点所有的内容,还要给移动做备案,这样完成一个信息调用的过程。

大家可以看到整个服务平台是封装在一个体系内,我们最核心的输送模型是在移动4A监管体系内,非常的严格,当然也在业务过程当中对我们造成不少困扰,完成这个过程之后,客户信息在我们平台是以分数,对金融机构输出是以分段,我们在金融机构完全以分段的方式做输出,连分数都没有,脱敏性非常高,但是,到了这个级别之后有没有效,分段数据不是没效而是计算方式方法有没有用,因为金融机构最重要的是定性化分析过程是不是合理的强关联的这才是关键的。这里面最重要的,为什么要做一个业务流程设计,特别是在打通两个关系的时候数据的延伸,这个时候数据融合是一个问题,在两天的会里我们听到很多关于融合的问题,移动在这个点上开始走在前面,我还可以开放,在金融领域里金融的信息真是强强监管,他不光有银监的监管还有银行监管还有自身因素,金融数据的共享几乎为良,他给一个地方做数据共享,做银行征信,那个信息传输不是时时的,是有一个时间滞后性的。如果没有数据完成的共享机制任何一个跨领域应用的时候,他的价值无法提升无法进行自我价值修整和调整。同样的信息换一种加工模式和关系,以前是一块钱现在能变成两块钱,因为你帮金融结构省的钱大大提高,这是数据价值提升的点,这个在没有完成数据融合之间是难以实现的。我们看到解决方案放在公有云上做,作为一个连续性数据有很长的时间在金融机构上修模型有很长的概念,基本要修两年,要不停的调教这个模型才能很高,为什么费克的模型还有代表,他是多少年沉淀下来的,他的代表和效率有一个准确的数据值表示,当时我们做这个业务的时候,金融机构问我们你算出来的每一项值知道精准度是多少吗,这个问题包括互联网企业都解答不出来,如果没有数据交互过程我们也答不出来,我们在设计业务的时候在这一点上做了突破,我们用业务流程完成了数据流传,我们有结果,打通了封闭型的结果,这个过程比较痛苦,在这个过程中最关键的不光要我们改,不光要电信行业通信行业要做适应性的改造,我们在接触移动之后,数据有很多,但是数据存储的方式是磁带化的,但是没有时时响应速度,我们用一年的时间在改这个。在这个业务流程里金融机构有很大变化,在我们合作的金融机构里打破了原有的审核机制,大家可以看到这个模式,金融机构把所有的审核过程封装到手机平台,这对金融机构来讲也是一种挑战,金融机构有银监监管,比工信部还要严格,所以在这里面有很强的两方共同改进的作用。

我们现在运行一年的业务状态,目前在四川移动做全面的合作,这是现在合作的金融机构,这是业务形态我们已经完成几千万的放款,每天有几百位金融机构推进到里面。这个数字为什么小,电信机构不是引流公司,第二审核通过率还在不断提升,我们的审核通过率进芝麻信用差不多,我们希望移动数据经过加工后的信息能够部分的取代银行自己审核体系里的某些指标值。这样其实通信领域的数据,在金融领域里应用的安全性和编辑性就非常高了,已经进入审核领域了,这些数据是要进入金融机构的风控领域,我们有更重要的突破,由于数据代表性更强,这方面需要我们的金融机构在底层数据给我们非常好的保证,在这一点上作为应用型公司,我们只能是一种呼吁,这是我们应用的案例,大家也可以找到,非四川地区我们还没有开放,你能进去,但是做不了所有业务申请,因为没有数据,因为你不能时时从合作方那提到数据,一旦能提到,我们就可以全面做开放,因为我们合作的金融机构是全国性的。

首先对客户来讲有价值,简单加速,爽和免费,这是互联网最有意思的特征。在运营商里这种方式是可以进行数据价值挖掘的方法,不是自我的定价,他可以不断进行数据价值修整和提升的方式,不断的提升,在最开始的时候很难说我的数据定到什么程度,随着业务发展数据的不断反馈修整,我们能够增加这样的数据价值。第三,他是一个免费服务还有数据提升空间。在金融机构是利益大集成方,金融是天生依赖数据的行业,除了我们看的到的剩下全是IT,都是在电子系统里转,这是金融的特点,不论哪个维度对数据的依赖性是极高的,刚才我们也提到了,我们的通信行业的数据在国外已经进入他的评分模型了,他是有意义和价值的,它的应用型的状态在中国是什么样子的,有可能我们按照一个维度一起进步,但是我们经常看到金融行业怎么理解通信行业的数据,你们好像有这种客户分级分类,你们能不能把名单给我,我做到我的系统里,基本都是这样的逻辑,很正常,金融去思考通信的时候没有看到通信里的深层次的价值,更多看到有全中国多少的客户,三大运营商覆盖了全中国所有的客群,没有任何一家做到,工商银行业没做到,相对来讲这种量级对银行形成天然的优势,他第一个想到的都是这件事。其实在这个里面有很大的信息隐私安全,我怎么可能把一个电话号码给出去。其实是一种在个人隐私信用上的问题,没有经过授权查客户的征信可能吗,金融机构的思维比较传统,跟通信行业的思维在后面一个阶段,金融在很大一个维度上,他们的风控机构在引领整个公司业务发展,所以这里面是非常重要的。第一,降低运营成本,第二降低一线人员的调头风险,金融也是一家机构有大量一线人员,他在操作过程中有各种各样的情况,这会形成调头风险,但是我们用数据,他是天然产生的 不可能放一个贷款改变这个行为。因为我也需要数据进行一系列的业务,他是非常真实的数据承载,这种真实性就是金融里最重要的特性。在这点上是可以降低的,提升他的获客能力和后至方式。连接双方,在这边我们要告诉金融机构你到底要怎么样,我们要帮运营商争取利益。因为任何一个利益的既得者得不会告诉你这个事儿多好,只有一个人真正这件事多好的时候才跟他讲。因为我们在很多地方也看到了我们同样合作的机构和电信或者运营商直接合作的时候,同样的业务,我们是不平等条约,金融是很复杂的体系,有自己的逻辑,当你这样的服务被第三方取代的时候应该拿出多少跟大家共享,是行内的人帮着说话,当然不能全拿走,所以我们还要给他一些,让他觉得,这个事情对我有利润提升,在这一点我们起到了一个比较重要的作用。当然还有最重要的,不论做任何业务的时候前期建立的模型是假设性的,很多人在提建模,这个过程在开始没有大量数据交验的情况下都是假设性模型,移动和金融的思维模式完全不一样,是非常不一样的。我相信未来在应用的时候金融是金融的思维,另外一些其他行业有其他行业的思维,每个行业都有自己的思维,这非常关键,我们在这个过程中,我们是用金融思维建模,这个时候,金融行业就会买账了,他至少对你的逻辑是认可的。接着采用业务看你的数据,至少到目前为止有金融机构经过验证之后确实认为有很多计算值加工过后的表现值有比较明显的特征,跟金融之间的关联性比较强。某种意义上可以理解为模型的某些内容被获得了,我不能说所有的,在建模过程中有很多值不一定确定它的精确度多少,随着后续加工方式的变化精准度会提升,这就是最重要的蜂巢模型的部分,他是国外信贷的灰色理论和空间合计的方式表现的特征。

这是我们在具体的一些状态,我们有这么多数据,这些原始的数据表单都由我们的合作通信商扔在黑匣子里,大家会看到很多关联,这种关联计算方式,最后输出的是计算方式,其实我们对外输出的非常有效的因素在那边,客户的稳定性因素和计算方法获得了金融机构的认可,目前的表现特比较明显,我们不是所有值都OK,有些值在修整的过程,要提升精准度,有些精准度现在可以被用了,其实这些值是可以进入到金融机构的风控审核体系里的一些值,这一部分在做价值。如果我们下面那些精准度不够的值其实与金融机构来讲没有太大意义,这是价值不断提升的过程,因为你的值一定要不断的修整和提升,不能说做到所有都有效,但是应该有十几项的小指标,这也是国外实践经验的逻辑。

我们刚才说的是贷前的审核方式,我决定要不要你,但是在个人业务里,金融机构大工作量,几乎现在无人管的地方,我们叫贷中,当你已经被批款之后应该怎么对你,金融机构一般做法你不还款了线发短信再打电话,这是事后性的。通信商是一个极度高频使用的场景,我们在通信里获得的场景不是按月度来的是按分钟来的,这个量级很恐怖,我们基于这个情况和贷前的评分做了一个贷中管理,这个贷中管理服务是基于贷前,我们叫做照片对比性,他有一个不断的照片对比性,目前在很多大型的金融机构里在这一点上是觉得确实能帮到他们,因为以前这块几乎没人做,没法有有效的解决手段,这个在通讯领域里可能成为一个解决的方式方法。大家可能觉得我输出的全是01法旨。在未来随着我们业务逐渐的完善,我们认为这种服务性的内容会成为非常重要独立的主体,但是我们没有上来就开始做这个主体的原因是因为我们觉得很难说清楚自己值多少钱,所以我们看到很多互联网金融的应用,特别是类似我们这样的公司,当我去网上采集完做服务的时候是免费的而且还得不到数据修正,你可能追求的是数据共享,在金融机构里数据共享很难,因为已经有金融机构单独买我们的服务。因为从一个业务形态的逻辑形成一个非常标准的值我们可以非常负责的进金融机构讲有效度是多少,我们可以告诉你每个值的有效度空间,这是在真正服务里很难做到,我们可以用业务形态解决问题,业务形态是小规模状态,他是有特定业务场景和需求。多数一种通讯领域覆盖全中国人群这样一种特征性上运用范围更广的是纯粹的专业化输出,这种输出,对于运营商来讲足够简单方便,还有很强的稳定性,一旦他真的认同数据价值和资产过后,稳定性是极高的,他会进他最核心的部分。对于金融机构也有帮助,他在很多审核里完成信息不对称的状态,通过外围实现。在这个过程中完成一个非常重要的动作叫定制,为什么我们没说叫征信就在于这儿,任何一家金融机构都有独特的风险策略,这个风险策略跟他的审核一样,跟他自己的模型建立是一套体系,在这个时候如果只输出一个最标准的给他,有时候很难解决一个问题,在这里面我们会进行模型的分支调教一个对金融机构来讲敏感度的法旨,分段是有学问的,很多人说分段很简单,我们在实践过程中发现真不是这样的,我们长期跟金融机构在一个数值的分段上,开始给他一个意见他们不认可了,后来在实践过程中认可了,你一定要根据当地用户的需求做,他们是广东思维的分值,结果发现都不OK,但是他们调整完之后代表性非常强,这个内容不是那么简单说我输一个标准分值给你,而且很多应用不能对外输出太多分值了。所以在分段的问题上,我们也有很多工作量去做,所以把这一块理解成一个非常重要的定制化的工作。

我们现在的业务只集中在一个区域,下一步开始往所有区域发展,这会涉及到系统架构的问题,我们现在用集中分布式的方法解决信息安全和业务流程体系的问题,比如你去一个省建一个不得了,因为我们接的是银行总行,金融机构的总部,金融机构没有二级三级的架构,要接只能接总部,没有任何一个法人单位接30次,他是一个接口,一个接口打通了,这一个接口做全中国的业务,我们必须有业务流和数据处理流的分离,分离的原因很简单,因为模型处理流行要符合我们信息安全,还有所有的通信商内部监管的安全规范。比如数据不能出省不能出移动等等这样的规范,我们要满足这个规范,这是最基本的要求,所以我们采用了这样的逻辑。这是我们现在的一些情况。为了更好做这个研究,我们已经在跟北大光华做联合实验室,这也是我们花了两年的时间终于做成的一件事,真的有机构拿来做研究了,这个很有意义。把两个领域的数据放在一起,而且是两个领域最核心的数据放在一起,我们来看通信行业跟金融之间的行为代表性有多强,哪些指标代表他的行为这个里面不光通信要Open,金融机构也要Open,他把他的数据拿出来做匹配和一系列的分析,这个在监管状态,目前这个工作在移动体系内进行得状态,为什么我要给到移动体系内,在金融机构来讲是很难克服的障碍,现在有金融机构愿意对一个样板做实验,我们希望有这样一个成果过后直接修正到模型里加强模型的应用价值。

像享宇这样一个以应用为主导的,我们是创业和创新性的公司,我们活着的动力就是创新,我们必须以创新推动业务发展,我们不是数据源公司,我们没有任何数据源,我们是在打通两个领域之间关联性的公司,我相信很多这样的公司在各个领域都有,只是处于不同的阶段,我们从2014年到现在,看整个过程,我们觉得这条路是对的,其实我们已经看到了,我们坚持到现在,已经有我们行业内的人对我们认可,也有其他的因素,各方面资源的投入对我们认可,我们觉得这样的方式实现一种跨领域的融合,不光是第三方收入体现,还有要以业务驱动大数据的发展,其实有时候也许在看来很多问题的时候也是一条可行的路径,这个路径走下去了形成一个结果了,这个结果会被这家公司复用,这样的逻辑在其他领域也值得借鉴一下,谢谢大家。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>