当我们谈起关键核心技术自主创新的话题,很多人都会非常关注芯片,但是还有一种IT的核心技术,它的重要性丝毫不在芯片之下,那就是数据库。中国有14亿人口,每秒钟都产生海量的数据,从日常的社交、餐饮、游戏、水电费缴纳,到网络购物再到时下流行的AI大模型等都跟数据库息息相关。因此,数据库被称为基础软件行业“皇冠上的明珠”,一举一动扣人心弦。
从产业发展来看,当下,人工智能大模型兴起的浪潮与我国数字化信创化转型高质量发展的需求,形成历史性的交汇,中国数据库市场进入了大发展时期。根据第一新声研究,2024年国产数据库整体市场规模预计为543.1亿,到2027年将增长至1183.8亿,2022年-2027年复合增长率达到30.67%。此外,国内数据库生态也迎来了蓬勃发展,并不断涌现出极具创新力的产品,推动了数据库应用的遍地开花。其中,openGauss就是佼佼者。据了解,开源四年以来,openGauss在技术、商业、生态上都取得了显著成绩。截至目前,已有超过660家企业加入openGauss社区,吸引超过6700名开发者实际参与社区贡献,全球版本下载数量超过270万套,345家高校与openGauss社区达成合作。2023年openGauss系数据库在线下集中式新增数据库场景的市场份额占到了21.9%,2024年,该市场份额将会持续增加,预计达到30%以上。值得注意的是,作为openGauss核心伙伴之一的海量数据也迎来了迅速发展,短短几年从数据库技术服务型企业变成一家数据库产品型企业,并在市场上取得了不俗的成绩。
从技术变革来看,回顾过去,数据库技术迭代的背后是数据模型的变迁、分析型需求的兴起、分布式架构的演化以及开源模式的流行。我们今天能看到,数据库从最开始的层次/网状数据库,到集中式架构的、主要面向OLTP需求的关系型数据库;再到独立出MPP架构的OLAP数据仓库;然后到更适合非结构化的、海量数据的、分布式架构的NoSQL数据库和大数据处理框架;再到同时结合了SQL和NoSQL的优势的NewSQL等。面向未来,行业信创时代,随着AI、云计算、5G、物联网等新技术逐步成熟,国产数据库又将面临全新的挑战。
近日,以“数智时代 共赢未来”为主题的openGauss Developer Day 2024在北京圆满召开。峰会期间,国产数据库上市公司、openGauss社区理事会理事单位之一的海量数据在其专场论坛分享了行业用户在重要系统数字化转型中的数据库选型、迁移、改造的实践经验,以及海量数据的路径选择和产业布局。
01 把国产数据库真正用到核心系统里去
在数字经济高速发展、数字中国建设如火如荼的今天,数据库作为支撑各行各业开展数字业务的核心生产要素,有着全世界最复杂、丰富的应用场景。如何锤炼出一流的数据库产品,承接新一代信息技术与千行百业数字化信创化转型深度融合大机遇,对厂商来说至关重要。而其中的第一步就是了解不同行业用户需要什么样的国产数据库。
“大信创时代,用户在做数据库选型时主要有四大顾虑。一是国产数据库产品是否满足相关政策要求?二是其功能、性能、可靠性等质量特性能否满足要求?三是产品提供商是否掌握核心技术,产品是否能持续稳定供应?四是应用能否适配不同技术架构?”在海量数据专场论坛上,中国软件评测中心信息技术产品测评室主任孙康健在进行《数据库行业应用选型分析》的分享时如是说。
分行业来看,央企客户,“中交在进行数字化转型的过程中,综合考虑安全可靠(技术路线客长期演进)、便捷迁移(迁的好、迁得快、迁得省心)和开发友好(丰富的接口和驱动、便捷可视的开发工具)”中国交通信息科技集团有限公司数字安全部副总经理徐兵代表在大会上介绍道;交通领域,“民航汇集大量实时机场全局业务系统数据,对于数据库性能与可靠性的要求更高。而面向机场的地理信息系统对数据库的空间索引能力也有较高要求,此外厂商的研发实力、生态能力、行业客户布局能力也是我们考虑的重点。”甘肃省民航机场集团有限公司信息网络公司电子信息工程师刘恒伟表示;此外,不间断服务、高可用、数据安全、数据分析是教育行业的诉求。而运营商用户对并发规模、性能要求、应用复杂度的要求非常高......
行业信创时代,面对指数级增长的海量数据、业务热点和突发流量的挑战,数据库的国产化替代,不仅要“能用”,更要“好用”,在性能、可靠性、安全性等方面,对厂商的技术实力提出了更高要求。而上述中交信科、甘肃省民航机场、新开普、中国移动均选择了海量数据库作为核心业务场景的支撑。
“只有真正将我们的数据库用到核心系统里去才叫成功。很荣幸海量数据已在制造、运营商、政务、金融、央企、医疗、教育、交通等领域的头部客户核心应用场景落地应用。据沙利文的数据显示,国产数据库在核心系统中只达到20%左右的应用水平,未来还有很大发展空间。剩余80%是我们未来努力的目标”海量数据总裁肖枫说。
深入行业核心系统,这不仅仅是一个个项目场景的落地,更是海量数据对当前数据库市场需求的深刻回应。
02 为什么是海量数据?
如果说哪个环节是如今国产替代的最火热环节,那数据库无疑是最多人选择的答案,甚至是之一。但同时,数据库也是最“卷”的领域!从互联网厂商掀起的“去IOE”浪潮到国产替代如火如荼,面对巨大的行业前景,短短几年间数据库厂商竞相入局。据不完全统计,截至2023年12月,中国数据库产品已超288款!
数百家数据库企业喷涌而出,那么海量数据作为新兴数据库企业又是如何在激烈竞争中赢得用户青睐成为其核心系统支撑者的?
“海量数据从2007年成立之初起就一直专注做数据库,2014年开始基于PostgreSQL开发第一代产品,2020年开始基于openGauss开发第二代产品,并紧随openGauss内核升级而逐步迭代,开发商用数据库发行版。经过四年的发展,我们在技术研发、产品力构建、生态建设、用户体验四个维度上实现了循环驱动,形成了‘飞轮效应’,持续推动海量数据进入高速发展期。”肖枫介绍道。
具体来看,在技术研发上,海量数据不断打磨自身对于核心技术的攻关能力,从存储引擎到SQL引擎投入了大规模的研发力量,在openGauss社区代码贡献率仅次于华为,排名第二。据肖枫介绍,只有植根于数据库的基础研究,产品的发展才能产生质的突破和飞越。在深度参与openGauss社区建设中,海量数据在源码贡献和非代码贡献方面均有大量涉及,包括代码提交、Bug修复、新特性,缺陷提交、产品改进需求等。接下来希望增加对社区的深层贡献,比如加强对产品缺陷的管理和修复、研发更贴近用户需求的功能和特性等,争取为社区贡献更大的价值密度,同时也提升海量数据自己的能力。
从产品维度来看,海量数据始终在用户场景的驱动下不断构筑产品的核心竞争力。面向未来的应用发展趋势如多模融合方面,海量数据致力于打通并提升结构化与非结构化数据的协同性,实现了“一专多能”面向时序数据、空间数据、向量数据等场景提供高效的处理能力;在多形态方面,海量数据打造了软硬深度协同、全栈自主创新的数据库一体机,实现了开箱即用、轻量化的运维和管理。在体验方面,海量数据持续夯实Vastbase安装、部署、实施的能力,提升日常管理、运维、监控等用户体验。在安装体验方面,实现数据库全自动部署、升级与卸载;可进行专题模板和配置参数的自调优。在运维管理方面,新增SQL编辑器、历史SQL诊断等运维场景,并进行交互的全面优化。
依托于在产品力上不断的迭代,当前Vastbase已经成为openGauss商业发行版用户最多,覆盖最广的DBV,逐步走进了很多行业用户的核心场景中,如制造行业核心MES系统、保险行业的理赔系统以及上文提到的交通计费系统、民航数据中心等。
此外,生态建设是让数据库产品长期生存及发展下去的重要基石,海量数据依托鲲鹏和openGauss打造Vastbase繁荣生态,目前已与874家生态伙伴打造了1352个解决方案。
“研发的不断累积和突破提升了海量数据的产品力,丰富了产品功能和应用场景,在满足不断变化的用户需求的同时驱动技术研发和内核打磨,为生态建设带来了无限的机遇和可能性。正是在“研发-产品-用户-生态”的一次次循环中,海量数据实现了高速发展。”海量数据解决方案部总监白玥总结到。
而除了“飞轮效应”形成的“研发-产品-用户-生态”闭环之外,海量数据库G100管理系统V2.2已经过国家权威评测入围《安全可靠测评》,全面满足信创要求。
03 结语
涓流虽寡,浸成江河;爝火虽微,卒能燎野。
随着行业数字化信创化转型的逐渐深入,数据库正从原先部分行业走向全行业,从外围系统走向核心系统,未来国产数据库的市场占比会逐步提升。业界看到,openGauss在持续打造内核能力,以及面向全场景的竞争力,从而构筑面向数字基础设施的开源数据库。
肖枫表示,海量数据作为openGauss社区理事会首批单位之一,愿与社区、伙伴、用户一起努力,打造最好的企业级数据库!沿着客户的需求走,使openGauss社区生态发展更加壮大、更加完善,并与上下游伙伴携手并进,一起为数字新时代建设跑出“加速度”,逐梦数字时代的星辰大海。我们在一起一定可以,我们在一起未来可期!