OceanBase客户数破2000家,首批分布式数据库通过安全测试,撑起蚂蚁集团AIAgent

智东西 2024-10-25 16:29:38

作者 |  徐豫

编辑 |  心缘

智东西10月25日报道,在10月23日举行的OceanBase 2024年度发布会上,OceanBase数据库OceanBase 4.2.5 LTS、OceanBase 4.3.3正式发布,OceanBase 4.4开启内测,OceanBase云数据库即日起免费提供365天的试用期。而OceanBase首批分布式数据库今年已通过中国信息安全测评中心的“安全可靠测评”。

基于单机分布式一体化架构和AI技术,OceanBase数据库大幅优化了可扩展性、实时分析、消除数据孤岛、跨云部署、多模态、向量搜索、容灾等方面的性能。

同时,有了专有云和公有云服务“双引擎”加持,今年OceanBase的客户数成功突破2000家,行业解决方案伙伴增速超100%,热门解决方案落地增速超50%,核心经销商伙伴业绩占比超60%。

一、新版数据库正式对外开放,强化实时数据处理水平

OceanBase CEO杨冰正式宣布推出OceanBase 4.2.5 LTS版本和OceanBase 4.3.3首个GA版本。

OceanBase 4.2.5 LTS版本相较于此前的4.2.1 LTS版本TP性能提升了26%,小规格4C TP性能则提升了37%,系统的处理能力得到较大提升。

同时,其融合了OBKV-HBase和OBKV-Redis两个不同模态的数据库,可以兼顾HBase的大规模数据存储和处理优势,以及Redis的高速缓存和实时读写能力。

此外,据OceanBase CTO杨传辉透露,该版本还可兼容甲骨文的数据库,用户托管在甲骨文数据库5.7版本的数据,可以不改代码平滑迁移至OceanBase 4.2.5 LTS版本的数据库。

与4.3.0版本相比,OceanBase 4.3.3版本TPC-H 1T提升了64%,TPC-DS 1T提升了36%,宽表性能ClickBench hot-run提升了49%,还新增了向量检索能力。

杨传辉称,该版本是面向实时AP场景的首个公开版本,兼容特定的数据类型,支持快速导入导出,并且针对特定场景预设了AP参数模板,免去了用户重新补充参数的功夫。据杨冰透露,过去一年已有大约60个客户试用该系列的小版本,并给出了不错的使用反馈。

二、采取单机分布式一体化架构,兼具性能和成本优势

对于数据库而言,其采用集中式架构通常会在兼容性、易用性、单机性能上较为突出,而选择分布式架构则更多是在扩展性、可用性和成本上占优势。

OceanBase的数据库则依靠的是“单机分布式一体化”架构,既考虑到分布式架构的扩展性,又具备集中式的功能和单机性能,还能同时处理结构化和非结构化数据。

杨传辉解释道,这是因为OceanBase希望能用一个数据库,去解决至少80%的数据问题,使数据库变得普惠和通用。

从OceanBase多个实际客户案例中可以看到,企业用户选择单机分布式一体化架构后,等同于只花费一个系统的钱,能获得两份甚至多分复合收益。

例如,山东移动此前用的是甲骨文数据库,基础设施基于传统“IOE”架构,扩展能力受限,也难以应对高峰期流量和复杂查询场景。其转用OceanBase的数据库后,计费系统效率提升了近30%,整体成本降低了9成。

同时,通过跨多数据中心分布式集群部署,山东移动的数据库能达到机房级别的容灾效果。

三、AI Agent的数据底座,可理解并执行复杂语义

OceanBase将其一体化数据库视作AI时代的数据底座,旨在让AI技术像数据库一样通用。目前,AI技术已渗透该公司数据库的开发、运维、诊断等环节。

如果用不同的数据库处理不同类型的数据,这通常存在研发成本高、传输过程复杂、查询路径繁琐等弊端。杨传辉称,在通用数据库中集成向量插件后,OceanBase的所有底层能力都可以直接复用。

除此之外,OceanBase一体化数据库还融入了LangChain、Llamaalndex、DB-GPT等主流AI技术栈。

现场杨传辉用ANN Benchmarks基准测试验证OceanBase一体化数据库的向量性能。从测试结果来看,其向量引擎在准确率、速度等多维度上超过业界头部水平。

在C端应用方面,OceanBase与蚂蚁集团的生态建立了紧密结合。支小宝、蚂小财、支付宝百宝箱Agent,以及包括AI健康管家在内的3个蚂蚁集团AI管家,它们的数据底座都用的是OceanBase一体化数据库和架构。

其中,支付宝百宝箱Agent是一个搭载了AI能力的小程序。该Agent可以读懂复杂语义,为用户检索、筛选、推荐吃喝玩乐的店铺。

杨冰称,此类Agent背后需要涉及复杂的语义交互,过去通常依赖大量地理位置、向量的存储来实现这一功能,产品开发周期也长。而得益于OceanBase一体化数据库和架构,该平台仅由两名开发者耗时一周的时间,便实现了从构思到产品的落地。

▲在支付宝百宝箱Agent的聊天框中输入“推荐距离两公里以内,人均消费25元以下,评价4.5分以上,不用排队的奶茶店”

四、公有云和专有云成为商业化双引擎,超6成客户为千亿级规模

除了OceanBase一体化数据库和架构,该公司的多云服务也实现了全新升级。

OceanBase上新Free Trial入口,即开发者可以在一年内免费试用OceanBase云数据库,也能自由选择所需的云服务商。此外,OceanBase云数据库不久后将在阿里云精选市场中开放接入。

而OceanBase 4.4实验室版本正式开启内测,主推存算分离和共享存储架构。

迄今为止,主流计算机的资源利用率大部分情况下只有个位数。OceanBase创始人兼首席科学家阳振坤建议,若想给客户带来“用一份硬件的钱买到了两份硬件”的使用体验,公有云、专有云、行业云等多云服务一方面可以通过资源池化和复用来降低成本,另一方面可以通过动态伸缩和按需使用提升效率。

据杨传辉透露,OceanBase云数据库已经在公有云上实现基于对象存储的存算分离,并且用起来“性价比高”。

经过4年的商业化摸索,OceanBase今年客户数突破2000家,连续4年增速超100%,并且中小客户占比相较于去年进一步扩大至80%。

当前,该公司形成了“双引擎”的商业发展模式,主要增长动力来自专有云服务。从2022年到2024年,其专有云客户数增速达到50%,包括中国南方航空等航空公司,北京、西安等多地地铁运营商,汇丰银行、交通银行等金融单位。

而同期其公有云客户数增速为130%,成为OceanBase的第二增长引擎。其客户集中于零售、智能制造、互联网金融行业,包括小米、科大讯飞、Vivo等高增长公司和行业独角兽。

杨冰称,超千亿交易规模的支付企业和超千亿规模的消费电子企业均超6成在使用OceanBase公有云服务。

两年前,OceanBase曾在当时的年度发布会上宣布了其“珊瑚计划”,旨在构建一个以合作伙伴为中心的商业生态模式。该计划的核心目标是在未来3年内与60家核心经销商达成合作,并且合作伙伴的收入占比达到60%以上。

从今年的战果来看,该公司超前完成了这一目标。现在OceanBase累计有超150家核心经销商,签约占比达70%,业绩占比超过6成。未来该公司将持续下沉二线、三线、四线城市,并计划在出海市场中寻求新的增长动力。

五、无论是金融还是出行产品,都需要一个国产的、更安全的数据库

OceanBase的生态合作伙伴覆盖了金融、政务、交通、能源、科技、公共服务等多个领域。在《共话云和AI时代的数据库》的圆桌论坛上,部分生态合作伙伴分享了他们对于OceanBase新版数据库的第一感受。

据IDC中国副总裁兼首席分析师武连峰透露,虽然全球已有17%的企业把生成式AI技术应用到企业生产的过程中,但实际上只有11%左右的企业真正落地了“DateBase for AI”,或者“AI for DateBase”,主要是因为准确率达不到95%的标准。

中国人保财险科技运营部副总经理张帆称,单库40个TB的数据处理是基操,数据库的安全性和稳定性也愈发重要,因此保险行业未来更需要一个国产化的、多模的、支持多云的、可靠的、具有AI能力的数据库产品。

T3出行数据库负责人高建丰认为,数字化出行的调度过程需要大量实时数据来支撑。因此,一个实时分析能力强,并且可以节省人力、物力、研发资源,低成本可用的数据库产品,在他看来是一种更好的技术解决方案。

中国联合航空有限公司信息中心总经理冯振宇则将数据库和AI的关系,比作“好马配好鞍”。在他看来,OceanBase数据库的新版本、新产品可以将原有的系统原封不动地集成到新的平台下,能够把现有的资产盘活,变成真正的数字资产,已经称得上是“好马”。

同时,OceanBase结合AI技术,为其架构推出全新的向量搜索能力。冯振宇认为,这不仅拓宽了图片等数据资产的范围,也使AI初具“马鞍”的雏形。

六、AI时代的新风口,“让数据好用,把数据用好”

钱卫宁是华东师范大学数据学院院长和CCF数据库专委会常委。此次OceanBase 2024年度发布会上,他也受邀分享了自己在数据库领域,从学生身份转变到导师身份这一过程中的观察。

他认为AI行业中的核心变化是数据智能的变化。从某种程度上来说,“互联网企业是最早的AI企业,”钱卫宁解释道,人们很早就开始尝试把手头上的事情交给机器去做,这也意味着人们逐步建立起对底层数据库的信任。

随着互联网行业不断重构各行各业,该行业内逐步孵化出了数字化这一概念。数据可视作一种“新能源”,如何在新的AI时代中将其真正大众化,将其变得“唾手可得”。在钱卫宁看来,这是对数据库厂商的关键考验。

目前,基本上每个大型企业都部署了专用的数据库。然而,同时在线使用数据库的用户在数量和使用方式上都愈发不可控,原本单机形式的数据库已经不足以满足用户需求,也因此催生了分布式数据技术和分布式数据库,让企业能够以更低的成本来管理好数据。

分布并行数据库、云原生数据库和开源数据库是未来数据库的三大衍生方向。钱卫宁称,“现在是中国数据库最好的时代”,而类似于OceanBase的做法,去集成、协同不同垂直领域的数据库,则是新的机遇。

结语:OceanBase独立分拆后的首次年度发布,商业化成果是其最大的底气

从V1.0版本走到V4.3版本,从分布式到一体化,从TP到HTAP再到SQL+NoSQL,OceanBase数据库和架构持续朝着一体化的方向升级迭代。最新的V4.3版本则基于一体化产品,推出了全新的向量能力,实现SQL+AI的深度融合。

目前,OceanBase的业务不仅覆盖了头部政企、行业独角兽,也兼顾了中小客户。其公有云服务已触及全球范围内100多个可用区,并且兼容多家主流公有云基础设施。

OceanBase今年3月才从蚂蚁集团中分拆出来,成为一家独立运营的公司,这也意味着其背负了更大的财务压力。从此次年度发布会中可以看到,距离蚂蚁集团组织架构改革已过去将近半年的时间,OceanBase不仅持续迭代升级其开源数据库,还构建了在海内外市场的商业竞争优势。

0 阅读:0