据悉,偶数已于近期完成新一轮融资,投资方为金山云。在此之前,偶数曾获得红杉中国和红点中国的两轮投资。
偶数科技对自己的定位为AI和大数据软件提供商,为全球各行业客户提供AI和新一代数据库产品。
公司产品是以新一代云数据库OushuDB为核心的智能数据平台,支持高性能实时查询和机器学习。OushuDB是世界上最快的新一代云原生数据库,同时支持公有云与私有云部署,兼容各大云计算平台,该产品采用了存储与计算分离架构,具有超高性能,遵循国际SQL标准,还具有弹性,支持大规模集群、混合工作负载、和可插拔存储等优势,可以轻松取代传统Oracle,DB2,Teradata,SQL-on-Hadoop引擎,助力企业数字化转型。
现阶段,偶数已经服务大型金融、电信、政府、能源等众多领域的全球客户,包括建设银行、浙商银行、中国移动、中国联通、国家电网、VMware等诸多行业头部企业,并和建设银行成立了高性能大数据联合实验室,结合双方优势力量,共同打造金融数据库基础架构。
本轮投资方金山云团队表示:"偶数是数据库领域的佼佼者,公司新一代云原生数据库在性能和功能等方面有着极大的技术优势。在未来,我们希望能够结合金山云独立云服务商的优势,与偶数共同助力企业的云化进程和数字化转型。"
红杉资本中国基金董事总经理翟佳表示:"数字化转型是近两年金融、政府以及中大型企业绕不开的一个话题,数据库作为数字化转型的基础重要性不言而喻。同时,数据量的爆发和业务场景的分析多样化对数据库的性能、扩展能力也提出了更高的要求。另外,自主创新也是一个潮流和趋势。偶数和建设银行成立的高性能大数据联合实验室,是金融行业数据库基础架构建设的方向标。同时,偶数的新一代云数据库OushuDB还在金融、电信、公安、能源等领域的头部客户得到了广泛的应用。我们长期看好偶数的发展潜力。"
红点中国执行董事刘岚表示:"全球数据库市场目前市场容量巨大,竞争激烈,海外也已经诞生了不少巨头。我国目前正处于结构化改革和数字化转型的关键时期,在过去的2年多里,企业、机构客户对于自主研发的数据库需求开始爆发性增长。源自于Apache开源社区的偶数,作为中国云原生数据仓库的先行者,从成立开始就在大数据和人工智能领域的不断创新,致力于提供更快、性能更好的数据库,满足海量数据存储管理、高效分析处理场景的需求。常雷博士长期专注人工智能、大数据和云计算领域,扎根行业多年,并多次带领团队开发出世界级领先的数据库产品。我们从一开始就支持偶数,非常高兴见到常雷博士带领团队产品和业务双轮驱动,不断创新,在快速迭代产品的同时,也获得如金融、电信、政府等重点行业客户的认可,成长为领先的AI和大数据软件产品提供商。偶数未来发展可期,我们非常看好。"
风起于云原生数据库
2020年9月16日,纽交所迎来今年最为重要的IPO之一,Snowflake市值超过700亿美元。云原生数据库的大红大紫,早已有迹可循。万物互联时代,数据总量爆发式增长。如何存储和处理海量数据也成为一个亟需解决的问题。因此,数据库底层技术的变革是大势所趋。
随着云计算发展普及,IT基础设施都有了逐步云化的可能,并在诸多领域开始落地。
在业内人士看来,云原生数据库的存储与计算分离架构毫无疑问有利于数据库构建和运行可弹性扩展的应用,能够灵活及时的调动资源进行扩容和缩容,以从容应对流量激增可能带来的压力,以及流量低谷期因资源过剩造成的浪费等。
全球知名咨询公司Gartner也为云原生数据库定性,认为云将主导数据库市场的未来,未来75%的数据库将被部署或迁移至云平台,只有25%的数据库会考虑部署在本地。
一般来说,数据库承担着存储和计算的功能。早期数据库主要针对日常的事务处理,随着分析型应用的普及,分析型数据库应运而生,这个如今拥有数百亿美元存量并快速增长的市场,一直在吸引诸多公司加入。
比如,早年Oracle推出了Exadata,但因为只能储存在EMC这样的高端专有硬件上,成本高昂;且多节点共享存储设备,可拓展性差,往往只能支持十几个节点,灵活性不高。这种共享存储架构的数据仓库为第一代数据仓库。
针对这一问题,Teradata使用专有硬件实现了MPP(Massively Parallel Processing,大规模并行处理)数据库系统。EMC收购的Greenplum、 HP收购的Vertica等也是MPP架构,但是使用普通的x86服务器硬件,将各个计算节点的数据独立存在本地的硬盘上,将计算任务并行的分散到多个服务器和节点上。这些架构一般可以支持到上百个节点,但随着业务的复杂度和数据量提升,依然无法完全满足用户需求。这种MPP架构为第二代数据仓库。
为了解决MPP架构的可扩展性缺陷,以Hadoop为代表的数据库渐渐崛起。这些Hadoop数据库将数据存储在HDFS分布式文件系统上,扩展性强,可以延伸到上千个节点。但因为产品复杂度较高,但应用必须的ACID(Atomicity, Consistency, Isolation, Durability)特性支持弱,大多情况下性能和功能不如MPP系统,因此未能规模应用于企业核心场景。这种Hadoop SQL数据库(SQL-on-Hadoop)为第三代数据仓库。
伴随着云计算和AI的崛起,一系列新技术应运而生,云原生架构,存储与计算完全分离,大规模集群上事务特性的实现技术,可以同时解决MPP和Hadoop数据库的缺陷。OushuDB和Snowflake就是其中的两个代表产品,这类采用云原生架构设计的数据库为第四代数据仓库。新型数据库领域风起云涌。
200万行代码,自研数据库系统,挑战IT领域最难三座大山
要做一款高可用、高可靠的数据库,显然并不容易。在IT基础设施中,操作系统、CPU芯片和数据库被称被认为是难度大的三座大山。
全球绝大多数数据库由国外厂商开发,可用的国产数据库寥寥无几。原因之一即是其研发难度高,缺乏优质客户早期试用陪跑。数据库之难仅看代码行数就可见一斑。常雷告表示,一般一个成熟的数据库有200万行代码,每一行代码都需要工匠精神来精雕细琢,业界一个资深数据库内核工程师的每日平均有效代码不超过20行,而一个应用开发工程师大约为150行;与此同时,做一个新的架构,又有非常高的设计门槛,数据库系统就如同一个设计优美的航天系统,每一个组件都需要像艺术品一样打磨。
诞生于2017年的OushuDB,本身就是为云原生设计。在常雷看来,要做到云原生数据库,就必须要做到存储和计算的完全分离以及执行引擎的完全弹性。
常雷表示,相比于市面上其他数据库产品,偶数真正实现了存储和计算的完全分离,而不是简单把传统MPP数据库或者Hadoop放到云平台中,就称为云数据库了,换汤不换药。这样做的好处是可以使数据库产品在弹性方面得到巨大提升,也可以很容易很方便的做动态的缩容和扩容,无论是存储节点还是计算节点,可以根据用户需求的增加和减少做实时的调整,不仅符合云的商业模式,而且符合云的技术特点。
抢夺千亿美金规模市场,入局数据库国产替代之战
云数据库公司市值暴增的背后,是资本对云原生数据库的长期看好。根据IDC数据,数据管理和商业智能等分析软件的市场将在2020年底达到560亿美元,到2023年将达到840亿美元;另外,云数据库数据共享能力的市场目前尚未被量化,潜力巨大。也就是说,未来依旧有巨大的市场空间可供云数据库公司野蛮生长。
而随着国产替代、自主可控、新基建等政策红利,国产数据库公司迎来了难得的"去IOE"机遇期。这些利好叠加,资本、资源重金押注国产数据库。相关统计显示,2020年中国的数据库市场规模已达到200亿元,并在高速增长。
云原生时代,像偶数这样的新兴数据库公司正迎来快速发展的历史机遇。
传奇风险投资人、有"互联网女皇"之称的玛丽·米克尔发布的2018互联网趋势报告指出中国正在成为全球大的互联网公司的中心,当年全球20个市值或估值大的互联网公司中,中国占据了9家,美国有11家,差距不断缩小。另有相关数据显示,2019年中国云计算市场整体规模超过300亿美元,在未来五年这个规模会达到现在的3倍,中国的增长速度远远高于全球。
IDC 预测,2025年全球数据量将增至175ZB,中国数据量增速最快,预计到 2025 年将增至48.6ZB,占全球数据量的 27.8%。本土互联网相关业务、云服务业务高速增长,也意味着未来对于数据处理量的需求大幅提升,其数据处理难度很可能达到全球高水平。有足够客户陪跑,打磨产品,中国成为数据管理公司的中心也很值得期待。