华为GaussDB数据库，会是新的国产之光吗？

　　7月20日，华为云TechWave技术峰会上，华为云数据库业务总裁苏光牛正式发布两大云原生数据库新品，包括关系型数据库GaussDB（for MySQL）和非关系型数据库GaussDB NoSQL系列。更重要的是，华为数据库在品牌和业务方面也进行了全面升级。

　　仅办个月后，GaussDB又迎来了新一轮更新。在TechWave技术峰会·数据库专题日上，华为云专家苏光牛详细介绍了GaussDB这个华为的战略性数据库产品的来历，并发表了他对于数据库发展的一些看法。

　　GaussDB数据库升级下的大调整

　　苏光牛谈到，在宣布战略性调整之前，外界还有人在质疑，华为在做数据库的态度上并不坚定，GaussDB算不上是华为的战略性产品。品牌升级后，这种质疑很快被打消。

　　其实这从华为对数据库的战略性投入可以看到，比如数据库专业人才的投入和高端专家布局，数据库是人才专家密集型高门槛基础研究，华为有1000+数据库研发专业人才，还有100+布局全球7大区域的数据库内核引擎、算法等高级专家和大咖，这只是数据库的研发人员，并不包含内部为华为云/流程IT/消费者云等数据库底座服务的DBA、SRE运维人员、工具平台开发人员，还有华为云数据库的销售、交付与服务人员；比如数据库研发历史和标杆客户的选择，华为从2007年开始已经持续战略投入数据库超过10年，早在2014年开始就持续和工商银行、招行等头部标杆客户长期联创；再比如华为在生态构建上的战略耐心，数据库是讲究生态的产业，华为不仅积极参与推进数据库产业生态发展，而且注重高校生态、开发者生态等建设，开源和持续运营openGauss社区，积极拥抱开放的生态，如MySQL、PostgreSQL、Mongo、Cassandra等。

　　宣布战略升级后，华为在数据库业务、组织、生态上做了重大调整。

　　a）业务上：将传统线下数据库的纯软件销售和交付，调整为依托华为云与华为云Stack，以云服务方式持续为客户服务，加持云后一方面提升交付与运维效率，帮助客户聚焦核心业务创新，同时为客户持续带来创新技术和新服务。

　　b）组织层面：将华为数据库研发组织融合，统归华为云BU和2012高斯实验室，统筹数据库战略与布局全球七大区域11个研究所的1000多数据库专业人才，力出一孔，持续打造世界级数据库。

　　c）生态方面：华为2020年6月30日开源openGauss社区版本并持续运营，与合作伙伴、高校、开发者共同繁荣生态。同时，华为将鼓励有能力的合作伙伴推出基于openGauss的数据库，旨在和业界共同繁荣数据库产业生态。

　　GaussDB数据库的前世今生

　　关注华为云数据库产品的人可能知道，这次华为云发布的GaussDB数据库并非新的产品，GaussDB MySQL实际上是早已发布的TaurusDB，GaussDB NoSQL就是GeminiDB。

　　GaussDB（for MySQL）、GaussDB（for Cassandra）、GaussDB（for Mongo）从2019年Q4开始公测并在少数内外部大客户项目如华为消费者云与WeLink、某大型保险公司、国家某部委等试商用，优化数据库性能和高可用性后，于2020年7月份正式上线规模商用。

　　据苏光牛透露，未来华为云还将推出GaussDB （for Redis）、GaussDB （for Influx）等系列新服务。

　　这次，华为云在品牌命名上统一到GaussDB，代表华为自研数据库品牌，立足创新与自研，基于同一架构，一方面拥抱并兼容MySQL等生态，另一方面打造自己的OpenGauss生态，主要面向政企客户，强调高性能、高可靠、高安全等方面诉求，给客户一个清晰明确的定位认知。所以，GaussDB（for MySQL）并不是简单的改名，而是在融合后，基于架构优化和改进后，结合品牌调整的结果。

　　调整后的GaussDB数据库云服务包含关系型数据库GaussDB（for MySQL）数据库，和非关系型数据库，重点打造云原生GaussDB NoSQL多模数据库系列，支持文档类型（Mongo）、宽表类型（Cassandra）、时序（Influx），K-V（Redis）等多协议接口。

　　如今，最新版本的GaussDB系列产品实现了很多技术上的更新和迭代。

　　GaussDB（for MySQL）基于华为最新一代DFV分布式存储，采用计算存储分离架构，支持1写15读的只读节点的极速扩展，最高支持128TB的海量存储，可实现超百万级QPS吞吐，单节点相比原生MySQL性能提升7倍，业界第一。

　　GaussDB系列数据库支持NDP（near data process）技术，可以让计算和数据进行融合，加速数据的处理，从而大幅提升整体的性能；GaussDB NoSQL拥有极强的多模数据管理能力，在并发读写能力、扩容时间缩、故障重构时间、备份效率、恢复效率等方面也都实现了业界领先，相比纯开源软件能力有了质的飞跃。

　　GaussDB NoSQL拥有极强的多模数据管理能力，在并发读写能力、扩容时间缩、故障重构时间、备份效率、恢复效率等方面也都实现了业界领先，相比纯开源软件能力有了质的飞跃。

　　不断完善的工具生态

　　对于开发者来说，有什么好用的工具是他们很关心的问题。

　　苏光牛介绍到，目前华为的数据库工具服务统一支持开源数据库服务和自研GaussDB数据库服务，当前成熟商用的有为客户提供上云数据迁移复制DRS、数据管理服务DAS、分布式数据库中间件DDM，同时下半年还会发布数据库和应用迁移工具。

　　其中，云数据迁移服务DRS能实现在线数据的迁移，业务切换微中断，业务切换时间可以自由选择，同时还能跨数据库版本热迁移，给出迁移/升级后直观的性能评估报告，从而让客户的原数据库切换到华为云上更加简单，安心；数据管理服务DAS可提供便捷的云上数据库管理与运维服务，核心能力包含数据库查询与开发、运维监控、性能诊断、SQL调优、数据安全管控、智能参数预测等；分布式数据库中间件DDM与RDS结合，把当今成熟的水平扩展分布式数据库能力，用户可以体验单机MySQL数据库；数据库和应用迁移服务，是提供异构数据库对象迁移和应用迁移的专业化工具。

　　替换IOE数据库将是个长期的过程

　　GaussDB的推出，让互联网厂商去IOE，数据库国产化的讨论和呼声再次热烈起来。

　　在苏光牛眼中，数据库国产化的机遇是否已经成熟？要走出一条不同于国外主流数据库厂商的路，中国要怎么走？

　　苏光牛坦承，逐步替换迁移IOE将是个长期的过程，至少未来3年内是这样。

　　为什么大家要放弃用惯了的主流数据库产品，要进行替换迁移？

　　他认为，厂商迁移数据库的核心原因，一是传统scale-up的扩展能力无法满足客户业务的需求、面向互联网+创新等业务，客户需要从集中式转向分布式云化的部署，在迁移到华为云数据库之前，客户主要采用的数据库大多并非一种，而是多种数据库产品结合，比如在金融行业传统核心账务系统，大的银行多使用IBM大机+DB2，这样做的封闭系统扩展能力较弱，且维护费用相当高，未来运维也是问题，所以，未来大机逐步下移会是一个趋势，但需要一个过程。

　　其次，厂商普遍达成了共识，需要业务和数据库一起来进行优化和调整，才能达成目标。

　　再次，互联网的去IOE和其它行业的去IOE挑战不太一样，从完美sharding的分片到复杂查询的场景，数据库的能力需要在严苛的标杆客户场景得到联创验证和孵化，同时要能联合为客户兜底应用的ISV，自身提供完善的系列工具迁移/运维/管理打消客户疑虑，真正地为客户做到平滑迁移。

　　这意味着，数据库国产化是一个循序渐进的过程，不可能一蹴而就。目前国产数据库还不够成熟，要提高国产数据库服务水平，打破Oracle、IBM、微软等国外数据库产品的包围，就需要走一条不同于它们走过的道路。这条道路应该怎么走？从哪些层面着手？苏光牛有自己的思考。

　　他说道，一方面，华为云积极拥抱并完全兼容和支持业界主流的关系型数据库生态如MySQL、PostgreSQL及非关系型数据库 MongoDB、Redis等生态，比如openGauss对外开放，避免让客户从封闭的Oracle走向另外一个封闭的“新的Oracle“，而是与更多“同道中人”一起解决缺陷。

　　“因此，华为GaussDB数据库全面满足不同客户的需求，在架构、软硬件协同方面自主研发，同时生态兼容开放，而非仅支持自有生态，这才是我们认为的真正符合客户需要的国产数据化产品。数据库是需要长期持续战略投入和孵化门槛很高的产品，华为在数据库领域持续研发投入已经超过10年，金融行业和电信运营商这2个行业就是对数据库稳定可靠、性能等各方面要求极为苛刻的典型行业，有上亿用户和高并发海量交易等丰富的应用场景，这些场景的实践帮助GaussDB数据库快速孵化提升了能力，也完成了对世界顶级数据库的替换。”苏光牛说。

　　这一席话并非空谈，而是有数据作为支撑。据华为提供的数据显示，华为云数据库2019年外部收入相比2018年外部收入实现高达400%的增长，GaussDB系列数据库产品已涵盖关系型和非关系型数据库场景，广泛应用于金融，泛政府、电信、能源、交通、医疗、物流、电商等行业。

　　数据库发展方向与趋势

　　过去几年，传统数据库市场份额一直在被不断冲击，而云数据库的增长潜力巨大，GaussDB数据库转向云端，就是顺应数据库云化趋势的典型案例。

　　对于云数据库未来发展方向，苏光牛判断，云数据库将向着云原生、分布式、多模、智能化等方向发展。而一个好的云数据库产品，至少应该具备以下几个特点：

　　● 高可靠：交易型数据库的首要因素是数据库的可靠，GaussDB基于DFV的分布式存储，数据的可靠性得到11个9；

　　● 超高性能（支持高吞吐强一致性事务能力）：如GaussDB（for MySQL）相比开源，性能从15万QPS提升到100万+级别OPS。

　　● 高可用（同城双活实现集群内HA，数据不丢失，业务秒级中断；同城跨AZ容灾，数据不丢失，分钟级恢复；还有两地三中心高可用）：如GaussDB（for MySQL）实现数据0丢失，故障闪回恢复。

　　● 高扩展（计算与存储分离弹性伸缩、容量和性能按需水平扩展）：如GaussDB（for MySQL）相比开源，从1写3读提升到1写15读。

　　● 高安全：用户数据上云后，数据不仅在存储层是静态加密，在计算态也是加密的。（华为全密态的黑科技揭秘发布在9月23日HC大会数据库专场session，感兴趣可以围观下）

　　 ● 易用性：首先要有完整的工具生态支持迁移/运维/管理无忧。面向未来，通过将AI融入到数据库内核架构和算法中，来降低云数据库的运维管理及开发调优成本，逐步实现数据库自调优、自诊断自愈、自运维能力。当前，AI参数自调优技术已经开源到openGauss社区，同时，在基于AI的SQL调优、故障诊断领域GaussDB也在重点投入，目标是最终实现数据库智能化。

　　GaussDB的出现，让我们看到了国内厂商实现数据库国产化的努力，从 0 到 1 是一个巨大的挑战，从 1 到高精尖，更是一个艰难的蜕变过程。希望在未来，搭乘大数据、云计算、物联网、5G通信等新技术的东风，国内厂商能够消化、吸收和借鉴国外领先的数据库技术和思想，以及自主创新的方式，让市面上出现更多符合中国人使用习惯的数据库产品！

我要反馈

新闻中心

华为GaussDB数据库，会是新的国产之光吗？

相关阅读