中国IDC圈4月27日报道,互联网的发展使得大数据引起人们广泛关注。现如今大数据技术早已渗透到金融、通讯等行业以及生物学、物理学等领域。大数据在容量、多样性和高增速方面的爆炸式增长全面考验着现代企业的数据处理和分析能力,与此同时也为各个行业带来了准确洞察市场行为的机会。迄今为止大数据技术与产品有哪些创新,工业大数据应用面临哪些挑战,金融行业大数据应用现状如何等。围绕这一系列问题,4月27日至28日,由工业和信息化部指导、中国信息通信研究院主办的"2016大数据产业峰会"在北京国际会议中心盛大召开,会上,泰一指尚大数据事业部总经理、公司首席技术架构师封雷,以《助力传播企业降低大数据应用门槛》为主题做了精彩的演讲。
泰一指尚大数据事业部总经理、公司首席技术架构师封雷
以下是封雷演讲实录:
封雷:我们首先来看一下,伴随着传统企业IT建设的日趋完善,企业积累了很多有价值的数据,但是这些传统企业往往会面临一个非常复杂的场景,就像刚才这位演讲嘉宾介绍的一样,就是数据这么多的情况下,这么多的技术,这么多的认证,如下把这些数据运用在这些传统企业上,让这些企业真正能够体现他自己的数据能力,这是现在这些企业面临的一系列问题。今天我就围绕着能力、数据这两个象限来给大家做一个分享,通过一系列的实在案例,让大家感受到现在传统企业怎么一步步去接近于大数据的应用能力。
我们先来看一下有数据但是缺乏大数据应用能力的一些企业,比如说咱们的政府部门,比如说我们一些传统的大型企业,他们沉淀了很多的数据,我们会帮他怎么来做呢?第一步我们先得找到一个应用的切入点,往往这些客户他首先会想到的第一个场景是你让我要去建一个巨大的大数据平台,你让我要去把什么Hadoop、Spark、Kafka这些建立起来,对我到底有什么帮助?这是企业面临的痛点,我们首先找到一个应用的点。围绕这个点再去分析哪些数据是需要的,这是第二步。第三步,帮助这些企业去构建他的数据思维逻辑,进而他自己想明白了以后,能够基于整个数据的开放平台来构建他自己的大数据应用生态。
我们先来讲第一个案例,首先看一下政府部门。前一段时间我们跟质监在进行沟通,质检总局他们面对着雾霾的事情,面对空气净化器这个行业,说我的监管应该怎么做?我现在拥有超海量的稽查的数据,线上的这些数据该怎么利用?我们围绕这个课题帮他做了一个分析报告。这个分析报告里面,从大数据里面的线上数据,包括线下的数据进行有效整合,通过语义分析、智能归类等等一系列数据挖掘的算法帮他做了这么一份报告。这里面我分析了整个市场的行情,也分析了产品质量现在到底缺陷在哪里,国际上面的一些品牌的优势在什么地方,我们自身的品牌到底有哪些地方是需要弥补的。从消费者的角度来看,消费者的核心诉求又是什么。
针对于这一系列的分析,其实也是佐证了他自己的一套想法,其实他也有完整的线下的体系,他对于线下用户的信息把握还是非常足的。也就是说,通过线上的数据,去有效的佐证了线下的场景。然后通过宏观政策应该怎么去做,对于质检部门的监管和服务应该怎么做,进而在面向整个行业市场,面向传统中国的企业应该去做什么样的扶持,怎么去避免这种产能过剩,怎么有效的构建这些基本产品质量的提升。另外面向消费者应该提供什么样更加有助于不同类型消费者的一些产品,这就是我们在跟他分享这个东西。
这个报告一出来以后,在“两会”上面得到了比较好的肯定。质检总局就想我们是不是也能油这样一系列的分析报告,对于我们的监管和执行会有很好的抓手。他又想到了一个场景,我们是不是能够基于物联网的贴标的技术,加上大数据分析的能力,是不是就能够建立起一个自动的质量监察。比如说打假等一系列的场景。这样的话,实际上我们是帮助质监在构建这么一种数据思维能力。这种场景的案例很多,我们这一段时间也在跟税务的相关部门正在探讨这个话题。我们通过企业图谱,人际关系的图谱构建一张很大的网。我们发现一个很有意思的现象,从某一个经济发达的A城市到某一个以旅游著称的B城市,这两个地方发票开的是最多的。我们就在琢磨,这个事情不至于,每天都去旅游了,这么多的钱花在旅游上面,这里面是不是有偷税漏税或者是洗钱的嫌疑?是不是有开发票的乱象,这就是一个有力的抓手。
我们举一个例子吉利,吉利汽车是一个著名的品牌,最近几年他们的产品迭代非常快,这个品牌发展得非常不错。但是他们也会面临这样一个局面,几千万的用户规模在那里,数据量也是相对比较大的。那么怎么把这些数据运用在整个生产过程当中?我们就借助于一个事件,上个月月底他们有一个新车发布,叫博越,他们老板很想关注,说我做了这个线上发布会的效果好不好。通过这样一个数据分析以后,发现了三个问题:第一个问题,互动性很差,发布会当天峰值,之后马上下落。他自己官网上宣布的是“你好,博越”这样一个主题,互动性一般。其中一个网友在一个论坛上面发了一个“今天终于见识到吉利水军了”这么一个帖子,反而是热议话题,是当天好的一个帖子。他们就会考虑,我是不是可以分析一下新品发布的策略,大家都知道,现在新车发布周期还是比较短的,也就是一两个月。第二个问题,他自己宣传这款车的卖点是“三好”SUV:好看、好开、好智能。但是这“三好”没有得到大家的互动,媒体也没有宣传这些内容,网友也没有跟他互动这些话题,也就是说他主打的方向跑偏了。第三个问题更加有意思,他一直在关注媒体怎么看待他这个新车发布,竞争对手到底有哪些举措,消费者有哪些声音,忘记了自己这些老的受众。他前一段时间刚刚推出了一个叫博瑞的一款车,那款车的受众就跳出来了,觉得不满。通过这样一个场景,实际上对于吉利来讲也是一样,构建了一种数据的思维模式。他自己就开始去考虑,说我是不是应该在新品发布的环节,在我们整个对媒体,对网友的一些互动环节,包括对竞争对手的研判环节构建起自己的一套智库。这样的话,大数据的应用就有了比较好的切入点。
看完了第一个场景,我们接下来进入到第二个场景,我们来看一下有数据,也有能力的企业,比如数据源公司,三大运营商,歌华有线、华数等等,这些老牌的公司,包括一些传统企业,这些传统企业在大数据方面的投入也是非常巨大的。面对这些企业应该怎么去办?首先第一步是建立联合的数据实验室,一般企业内部所拥有的数据,刚才前面一位演讲嘉宾也讲到了数据孤岛的问题,也是一样的,虽然说他的数据非常海量,但是面向于要做商业化,还是有一定的缺失,还是有一定的缺位。首先第一个要做数据联合的实验室,去研判里面的数据。第二个场景才是构建数据商业化的能力,第三步才会到了建立整个营销闭环能力,因为你把数据变现了,要把数据售卖给这些传统企业,这时候这个数据有什么价值,能帮企业带来什么东西,我们是围绕这样一些话题进行展开。
我们往下看一个案例,这个案例是浙江移动。浙江移动现在的上网用户规模在4500万,每天日活用户在2500万,每天的上网记录是100亿条,双11时候达到600亿条,每天的增量数据大概在30个T左右。面对这么海量的数据,首先面对的问题是怎么在这些数据里面挖金矿,我们在跟他们联合着研究这样一些场景。比如举个例子,网友听歌,通过这么一个行为,我们可以研究出一个场景来,他是哪一个明星的粉丝,是哪一个歌手的粉丝,他听的是狂放性、小清新还是屌丝,透露出了这个人的性格。我们就可以大概研判他的性别是什么,可能跟他的购物场景结合,他可能的购物倾向,是冲动型的还是理性型的,还是货比三家的等等。通过这样数据标签化的梳理,也就具备了数据商业化的能力,这个前提是合理合法的,就是在数据脱敏的场景下进行运作。第二个场景就是帮他做数据变现,后面的版本就水到渠成了。现在浙江移动的IT部门从一个历史上的成本部门,终于已经转变为了一个盈利部门。
我们再来看一下助力传统企业构建闭环能力。比如说华为手机现在卖得非常火,比如说海信、美的这样的家电大佬,他们这几年在这个大数据领域投入巨大,动辄是几千万,甚至是上亿规模的应用在做大数据方面的应用。对于他们来讲,他们心里是非常清楚的,我知道只有有什么,我知道自己缺什么,我知道这个数据要用来干吗,要做企业的决策智库,通过联动整个事业部的集群,去有效的串联各个部门形成联动力,来提前整个工作效率。这个时候我们实际上帮助他要构建的事情是,第一个解决这些数据价值问题,也就是说我们把标签维度设立的是否精确,是不是能真实的刻画出这一批消费者的场景,也就是刚才讲过的数据质量检查的场景,也是希望作为这样一种标准构建。这里面实际上就会涉及到互斥逻辑、排他性等等一系列的数据质量的检查,包括样本的测试等等,首先要确定这些数据是不是能用。第二步要通过这个网站的测试模型,包括行业模型导入一个营销的策略模型导入,来构建整个营销的实践。通过这种实践的方式,来建立起一个营销的闭环。当然最终的分析结论以后,也要通过这种智能的对于他的数据模型,对于他的行业模型,对于他的策略模型进行持续优化的这么一个过程,来不断的完善他整个的营销闭环的圈子,这是面对于超大型企业的一些做法。
面对数据缺失,技术能力也缺失的企业我们怎么做?一般的这种企业我们定位为中小型企业。面对他们很简单,第一步是数据能力开放,技术能力开放,应用模式开放,这个一般是服务于中小企业一个比较好的场景。现在在国际上,SaaS的这种模式已经非常流行了,前两天刚刚看到一份报告,基本上美国的这种中大型企业都愿意每年花费1万到60万美金之间的费用来买单于SaaS的服务。但是出于中国的国情,现在中国的大型企业还不愿意或者不敢把这些数据进行公开,会担心自己的一些策略失控。也就是说,面向于中小企业,反而是这种方式的一种受益者。通过轻量级的SaaS帐号的模式,把大数据的应用能够有效的提供给他,这样的话能够极大的降低中小企业的大数据应用门槛。
面向能力很强,但是缺少样本数据的公司应该怎么去办?比如说高等院校。现在咱们有各种各样的高等院校,都具备各自所擅长的算法能力,他们缺少的就是数据资源。比如说一些原来服务于行业里面的IT集成公司,一些合作伙伴。他们面临的场景是我对这个业务非常了解,但是我要在大数据方面有一个转身,实际上这里还是有相当的门槛的。
面向这样的企业,我们有一个合作伙伴,他是在银行这个圈子里面已经耕耘了十几年、二十年了,对于银行业务非常熟悉。但是针对于银行这边网格化的营销场景,实际上对他来说是比较困惑的地方,我怎么样的方式能够LBS定位到周边的受众,我怎么样来帮助客户经理,片区经理构建他自己的一个营销网络,怎么样去进行一系列的考核落地,能够把绩效有一个正向的反馈,这些都是面对的一系列的问题。面对这样的场景,我们会选择一种联合的方式,有数据能力的公司,有技术能力的公司,叠加对行业了解的公司,三方实际上是能够形成一个共赢的局面。这就是我们现在做的这几个方面,助力于一些企业的方式。
泰一指尚是浙江省大数据应用产业联盟的发起单位,我们还是浙江省大数据重点研究院的授权单位。我们现在秉承这么一种原则,能够希望跟业界的这些合作伙伴形成强强联合的方式,帮助我们传统企业降低大数据应用的门槛。我的演讲到此为止,谢谢大家!