中国IDC圈8月31日报道,数据给我们的生活带来了翻天覆地的改变,万物互联,云计算,各行各业的互联网化使我们提前进入了大数据时代,而这些流动的数据通过新的技术,也将被赋予新的能量,生动的描述未来是一项挑战,因为正式的未来很少与科幻世界保持一致。8月29日-30日在上海国际时尚中心举行的D-Future数据时代峰会是七牛为大家带来的一场数据盛筵,汇聚了业界领袖、行业专家,他们将从产业的角度和技术的角度来解读数据从何而来,数据如何应用,数据重新构未来。
七牛CEO许式伟作为开场演讲,他立足于移动互联网时代的新背景新机遇,分析新时代数据之于商业模式再构的意义,在海量数据情况下非结构数据的处理一系列问题,以及七牛是如何定义云存储的。
七牛CEO许式伟
以下是七牛CEO许式伟演讲内容(根据速记整理):
许式伟:感谢大家对于七牛的支持,今天能举办D-Future大会,从我个人而言,心里感慨万千。七牛到今天已经有四年左右的历史,应该说是非常年轻的一个公司。今天有幸举办这样一场大会,最重要的一点,我觉得首先是这个时代给我们的一个机遇,我觉得在座的各位都是这个时代的弄潮儿,今天有幸和大家谈一谈我们对于数据、互联网时代的看法,这是七牛的荣幸,也是我们能够和大家共同探讨的,如何重构,用技术的方式,基于数据重构我们的商业。
互联网产业亟需变革与创新
我觉得我们是非常非常幸运的,我个人毕业的时候,刚好是互联网这个新兴的产业刚刚开始的阶段,我觉得前面的十几年很精彩,但是其实今天大家也能感觉到,现在是更加精彩的时刻,因为互联网刚刚开始的时候,它只是一个新兴的产业,今天大家都说互联网产业,但是很快在不久的将来,互联网不再是一个新兴的产业,它其实是一个新兴的生产力,和所有的实体经济和各行各业都息息相关,所以今天为什么,我们认为它是一个更加有巨大的商业机会的时代,是因为互联网之前是一个行业,它的影响仍然只是非常小的一个人群。但是今天我们看到,每一个人都已经联网了,基本上,中国超过半数的人群,已经随时随地的都在网络上了。那么这个给我们的影响是非常巨大的。它会让我们的商业因为有了互联网而发生重新洗牌的机会,所以今天我们看到,所有的公司都有非常巨大的危机感,因为他们如果没有变化,他们可能就很可能面临淘汰,他们也许就会从这场竞赛中出局。但是同时我觉得这也是一个新的机会的来临。因为我们如果跟随了这个时代的机遇,我们能够在其中抓住里面带给我们的机会,我相信你就可以成为你所在行业的领头羊。所以今天为什么那么多人谈互联网转型,为什么大家都会谈创新,谈颠覆,是很有道理的。因为我们正面临着一个前所未有的机遇,如果不变,那么你一定会死。
大家今天都知道D-Future是一个以数据为主题的会议,我们确实现在正用一个词来涵盖这个互联网时代,我认为就是两个字,数据。实际上信息一直都存在,只是它以前是在原子世界,但是有了计算机有了互联网之后,我们知道这个世界多了一个虚拟世界,比特世界。这个新的世界正在以每三年翻一倍的速度在增长。为什么会有这样的一个变化?是因为其实人,大家去分析一下人的能力,我们会发现,其实人本身的逻辑能力处理能力是非常有限的,我们很难去很快的执行一个对计算机来说非常简单的预算,比如71×131等于多少,我相信没有很多人能很快的答出来,但是计算机执行这样的计算,是纳秒级的计算。所以计算机和互联网延伸了人的逻辑能力,让我们有了很强的分析和预测未来的能力。
互联网转型后的商业新常态
这是一个数字化的洪流。在这样的一个洪流下,我觉得对于我们的商业,其实是产生了一个非常巨大的影响。所以今天我们也想谈谈互联网转型后的商业新常态到底是什么样的。
首先我们来看一看业务本身,因为互联网化最基础的一个层面的诉求,就是业务要上网,如果我们想象一下,或者我们对比一下传统的商业和新兴的商业形态,它大的一个不同是什么?或者我们用一个词去概括旧的商业形态是什么东西。我个人想到的一个词就是一手交钱一手交货,这就是旧的商业形态最基本的商业特色。但是互联网改变了这一切,互联网让远程交易成为了可能。但是远程产生一个服务,这个影响是非常非常巨大的。因为我们的业务的场景比以前开阔很多,我们以前也许只能影响我们周围非常一小群的人群,或者最多我的公司做大了之后,我在不同的地方开不同的分部,但是你影响的人群仍然只是你公司能到达的范畴。但是互联网改变了这一切,它让商业可以让你人不用过去,和世界某一角落的人就可以做生意,这个影响非常非常巨大。我们来看如何达到的,其实我们分析一下商业在互联网上之后,业务有什么样的特征,我概括了一个词,非结构化数据是人的自然沟通的方式。所以在上网之后,我们发现大量的数据被映射,或者被影像到现实生活当中,这也是数据化生活洪流的根本化的原因。我们要表达我们的意愿,就是非结构化数据,什么叫非结构化数据呢?就是自然表达的语言的文本,以及图片、音频、视频等等这些媒介,都是非结构化数据。那么这些数据天然是人非常容易理解的。但是其实计算机很难理解。刚刚我讲了,计算机有非常强大的逻辑能力,但是计算机在语意的理解上是非常原始的,可能连三岁婴儿的水平都达不到。在这样的情况下人怎么样沟通呢?就是非结构化数据。非结构化数据就是传递人的意愿。比如我拿起电话说几段语音,告诉我的客户或者是告诉我想要交易的人,告诉他我想要表达的东西。或者是通过图片,表达你的商品,你的商品长什么样,你的商品怎么使用的。所以我们可以看到非结构化数据自然而然会成为交互的一个中介。而这个也是原子世界映射到比特世界一个根本原因,因为业务要上网。
第二个层次,当业务上网之后,我们会发现,旧的商业过程当中我们也会谈运营。但是旧的商业过程当中,我们如何运营,大部分的企业就是做调查问卷,我们会找一些样本的客户去问他们,你对我们的服务有什么样的看法,你希望我们做什么样的一个新的服务来去为你提供,但是今天我们会发现,其实有了互联网,有了计算机之后,这一切也发生了变化,首先业务上网之后,天然你可以记录每一次的交易过程,可以把所有用户的行为都能够记录下来,所以今天我们会发现,运营的基因的分析的背景,不是取样数据,而是全量的用户的行为记录。所以我们每天都在产生,对于任何一个互联网公司来说,每天都在产生上千万上亿的调查问卷。而这些调查问卷,如何去对你的商业去进行改进,这个是一个非常重要的课题。也是我们今天为什么会谈大数据,会谈精益的运营的原因。
我们先看一看非结构化数据数据的挑战。刚才我们讲了,现在世界上正以每三年翻一番的数据的增长速度,而这其中95%以上,都是非结构化数据,而且这个95%的比例还在不断的提升,而不是下降。也就是说我们会有越来越多的非结构化数据在其中。所以这个数据的存储量是非常非常惊人的,如此惊人的数据,应该如何存储,如何让它不丢失,如何进行分析和挖掘,这其实是个很重要的课题。刚才我也讲了,非结构化数据,其实今天主要的用途是用来做交互,但是我们刚才也讲了,今天计算机对于语意的理解是非常原始的,可能连三岁小孩都不如。所以在交互上,我们发现它仍然有非常巨大的提升空间。我们知道我们有自然语言,NLP什么的,技术数据来讲,这样的一些技术,但是它今天仍然很原始。我们也会知道有语音的识别,有视频或者图片里面对于场景对于动作的识别等等,但是这些新的分析方法都还非常的早期,我们把这些新的分析方法,如果能够往前走的话,那么我们可以想象,其实这个数据时代会有更大的想象空间在里面。正因为我们的分析能力还很原始,所以今天几乎所有的非结构化数据都没有二次分析。所谓的二次分析,就是我们除了直接的业务交易过程,比如说我想表达我的一个意愿。但是二次分析是可能的。因为用户每一次沟通,每一次交互过程当中,沉淀了大量的信息,这些信息如何挖掘,也是很重要的课题。
接下来谈一谈用户行为的记录,我认为这个是远未充分挖掘的金矿。因为今天很多企业没有用户行为记录。因为他们大部分业务连商网还没有。所以他们今天想得更多的是让我的业务上网。但是其实哪怕是互联网公司,今天日志的处理能力,或者是我今天能处理多少的数据量,以及我的分析方法,能产生对于我经营有效的指导数据,这方面的能力还是很不足。大部分的公司停留在比如说日活跃用户的分析等等基础的过程。第三点是绝大部分企业日志会定期的删除,因为他们不能理解用活分析之后还能干什么。因为日志是计算机生成的,所以它天然可以很容易被计算机所去理解,这个理解是全面的,不会损失什么信息。所以日志本身是一个更高含金量的金矿,但是大部分的企业其实并没有意识到这一点。所以今天日志的使用量,我认为远远处于一个非常原生的一个状态。
数据构建未来
那么今天谈这些对于我们来说有什么样的意义呢?这个就涉及到七牛对于自己的定位。如果用一句话来描述七牛对于自己的定位,我们会这么解释。七牛是最开放最完备的数据服务供应商,最开放的含义是什么呢?我们希望不是七牛把所有的数据服务给提供了,我们希望搭建一个平台,能让所有对于数据,因为我们刚刚分析了非结构化数据,分析了日志相关的一些挑战,这些挑战绝对不是七牛一家公司所能解决的,我们希望有志于去提升这个数据的应用价值的企业,都能够和七牛一起,共同开拓这个世界,而不是七牛单独一家去做这样的事情。
最完备的含义是,我们希望能够分析这一些数据的使用场景,去触及它的方方面面,去构建一个完整的基础战,七牛完整的构建一个商业。这个是七牛对于一个数据服务商的一个定位。
今天七牛做了一些什么,大家都知道七牛现在叫七牛云存储,所以七牛如何定义云存储,其实七牛之前已经有很多的云存储的供应商,最典型的是亚马逊。但是七牛,我们认为我们重新定义了云存储这样一个概念,为什么呢?因为在AW上的S3,我们认为它是一个零件,什么零件呢?就是云主机的复数品。因为S3主要的能力是一个数据仓库的能力,它可以放东西,可以取东西。但是七牛认为云存储不应该仅仅局限于我是一个数据的存储的空间。首先它是一个数据存储的空间,所以我们有数据存储这样一个基础服务。这个基础服务,它的核心价值很简单,就是可靠,然后便宜。然后高可用,这个是它最基础的几个能力,第二个能力是什么呢?第二个能力是加速。七牛可能是全球第一个提出存储加速和数据处理这样三个词来描述云存储这样一个服务的一个公司。当然后面我们看到业界也逐渐的大家认同了这样一个模式,所以我们看到,几乎所有的云存储都在往这个方向在走。
那么加速是什么呢?七牛的加速,我们是用一个相对比较独特的方式,因为大家听到加速这个词,都会想到CDN,而CDN是存在了十几年的一个服务形态。七牛的加速到底和他们有什么不同呢?这个跟七牛的做事方式很有关系。我们认为不差一个新增的CDN公司。所以七牛从加速角度来讲,我们定位成我们是CDN融合的公司。我们希望协助客户管理CDN,让这些CDN融合在一起,能够提供更高品质的,或者是更高可用性。因为任何一家CDN,很可能会出现区域性的故障,这样的情况下,我们可以协助自动的去解决。然后有一些CDN可能在比如在上海快一点,有的CDN在广州快一点,我们可以融合,可以形成更高速的访问。第三个层次是数据处理,数据处理这个词比较抽象,我们如果去展开来讲,它的就呼应我刚才讲的那个非结构化数据的挑战里面最重要的一点,就是我们对于非结构化数据,计算机对于非结构化数据的理解其实是非常原始的阶段,所以七牛成为一个真正的开放的云存储,最重要的点在于我们的数据处理是开放式的平台,我们知道七牛最近接入了非常多的数据处理的服务,比如说图片的建网,比如我们正在接入的人脸识别等等。数据处理的业务是做不完的。七牛最开始提供的一些基础的数据处理,比如音视频的打码、打水印等等。这个是个开放的平台,待会我们的团队会讲,这个我不讲了。
还有什么呢?还有一点就是直播!因为视频或者是音频,它是一个非常特殊的介质,因为它有一个值,就是在线沟通的需求,这是传统的存储所没有的。当然因为视频和音频它本身有流媒体的属性,所以它天然有点播的需求。七牛的霹雳云可以把直播和点播融合的平台。我们可以在霹雳云上完成用户的沟通,以及事后的点播,以及不同的网络下不同码率的转换。
介绍了七牛当前云存储的概念之后,我们来看看七牛的一些数据,今天七牛的注册企业有28万,我们直接覆盖网民每月月活有3.7亿,我们的平台上产生了1600亿的文件,每天我们有750亿的请求。我们数据处理,数据处理本身可以被加速的,也就是同一个文件,哪怕它多次访问,它只会处理一次,所以它的量会相对少一点。今天七牛的平台上每天有12亿的数据的处理量。总结一下七牛干了什么,我们认为我们重新定义了云存储,重新定义如何服务商业。很多人会问七牛未来会做一些什么,七牛到底会往什么方向发展。我们七牛首先,我认为在这个时代,要符合这个时代的主题思想,就是创新和创造,今天和数据相关的几个词有云计算,有大数据。这些词七牛是如何看待的,如何重新定义这些词。我觉得2016年可以期待,这就是我今天的演讲内容,谢谢大家。