作为新一代信息技术的核心之一,大数据技术已得到业内人士高度关注,许多IT公司和投资者均加强了对该技术研发和应用的投入。成立于2008年、总部位于西雅图的芭蕉技术公司无疑是该领域的佼佼者。不久前,芭蕉技术公司在旧金山举办的大数据技术研讨和培训会议上,展示了其先进的大数据技术开发理念及业务特点。针对当前大数据技术发展情况和应用前景,以及中美大数据技术合作等问题,科技日报记者在感恩节期间对该公司董事长切斯特。达文波特先生进行了专访。
大数据拓展了网络服务空间和前景
在美国政界和商界获得成功的达文波特,多年前已敏锐地洞察到数据库及大数据技术对未来网络发展的重要性。年轻时就对相对论入迷的他一直被爱因斯坦有关时空变化的论述所吸引。他告诉记者,人类开发利用网络空间需要新技术的支持,而如何对海量数据进行采集、管理和储存则是最为重要的技术领域之一。“芭蕉公司创立之初主要致力于软件技术开发和服务,2012年后则倾全力开展大数据技术研发和服务。”
达文波特介绍说,目前网络数据每两年翻一番,每天需要对100亿组数据进行处理,每秒产生4G以上新数据。2017年将有50%的企业使用混合云,到2020年将有280亿台物联网设备处于运营之中。因此,数据库和大数据技术对未来网络自身发展及其所提供的服务至关重要,预计2017年大数据市场将达到500亿美元的规模。
“经过短短几年的发展,独具特色的芭蕉大数据技术和服务已经引起业内高度重视。目前苹果、微软、IBM、CISCO和亚马逊等IT巨头均在使用芭蕉大数据技术或是其重要客户。”他举例说,芭蕉与CISCO的合作是帮其搭建一个Riak/Mesos框架,以此来创建一个能够在InterCloud平台上运行的基于Riak的数据微服务和分布式文档系统。
用户需要的是安全、实用和操作简便
达文波特介绍说,现有的数据约80%为非结构化数据,芭蕉公司提供的大数据技术突破了只为特定公众而研发特定数据库的局限。芭蕉大数据的技术核心是Riak系统,与芒果(MongoDB)等其他非关系型数据库(NoSQL)技术相比,Riak是一个开源数据库,以分布式、水平扩展和高容错性等特点著称。随着大数据技术的发展,芭蕉大数据产品服务形成了一条较为成熟的产品技术链,即从Riak核心发展到Riak键值再到多模型解决方案,之后产生芭蕉大数据平台和应用栈。
他告诉记者,建立在Riak核心之上的Riak键值数据库技术,具有可用性高、多集群复制能力、易于增加节点向外扩展增容、保证数据精准度的优势,已经得到用户高度认可。目前芭蕉大数据技术平台不仅能提供具有综合性的核心服务,包括减少人工操作的复杂性,对单独的群和NoSQL数据库进行管理,提高高速缓存和存储逻辑分析能力,而且可以提供分布式、可扩展性和容错性构架,为集成数据库提供资源管理程序及其它关键大数据应用组件等。
达文波特认为,芭蕉数据平台具有六大技术特点,即简化复杂的程序、高可用性、容错性、将实时数据分析和Apache Spark相结合、整合Redis提供更高速应用性能、整合Solr提供更丰富的查询结果。由此可以看出,与其他大数据公司的数据技术相比,芭蕉的技术优势有四点:一是具有数据准确、可扩展性和实用性;二是通过整合进行增值;三是通过创建核心知识产权支持整合;四是合作伙伴可自主吸收采用。达文波特希望芭蕉数据软件能够为未来国际大数据技术行业制定标准提供帮助,开发出世界上最先进的软件来管理NoSQL数据库。
对与中国开展大数据合作充满信心
达文波特称,近年来中国网络应用和服务发展速度很快,特别是物联网行业发展异常迅猛,预计2014年到2019年,中国物联网市场年均复合增长率将达到32.15%,为大数据技术开发和应用带来了巨大的潜在市场。他指出,中国政府一直非常重视和支持大数据技术研发与应用,目前许多中国的IT公司已开始进行大数据技术开发,且广泛寻求国际合作,芭蕉公司也正在寻求中国的战略合作伙伴,迫切希望抓住机会,与中国开展深入、广泛的技术合作。
针对合作中的数据安全性问题,他明确指出,芭蕉技术的一大特点是把数据保存在用户指定的数据库中,而且不需要用户开放数据资源。“我们的软件通常是不留‘后门’的,但也可以根据用户的特殊需要留有‘后门’。”达文波特说,芭蕉公司不仅保持和追求非常低廉的产品价格,更是一直把确保用户数据安全作为宗旨。
在结束采访时,达文波特感慨地说,创新是发展的不竭动力,新技术和新产品提升了人类的生活品质。“尽管我本人不开发新技术,但我一直都对新技术的开发和使用抱有浓厚的兴趣。”