GeminiDB Cassandra接口如何高效支撑海量数据复杂查询?
12月22日,Cassandra Day China 2022在线上举行,大会邀请了众多知名企业的技术专家,从实际使用角度带来Cassandra的相关应用经验分享。华为云NoSQL数据库高级工程师马明迪受邀参会并分享了GeminiDB Cassandra接口的核心技术与复杂查询场景最优解,以及优秀实践成果。
华为云NoSQL数据库高级工程师马明迪
数据库技术作为底层支撑之一,正在为世界范围内不同行业的应用带来源源不断的动力。Cassandra作为数据库技术中的佼佼者之一,广泛应用于社交娱乐、IOT、数据仓库等场景。随着业务的迅猛发展,企业随之而来的业务数据量急速攀升,流量洪峰场景频繁出现,业务高可用诉求强烈。
作为国内领先的云原生多模非关系型数据库,华为云GeminiDB接口高度兼容MongoDB、Cassandra、Redis、InfluxDB四款主流NoSQL接口,支持跨3AZ高可用集群,相比社区版具有分钟级计算扩容、秒级存储扩容、数据强一致、超低时延、高速备份恢复等优势。
华为云GeminiDB Cassandra接口基于业界领先的计算存储分离架构,性能较自建数据库平均提升了2倍,单套实例实现百TB存储,适用于海量数据场景下的极致高可用、高扩展;支持分钟级快速扩展,扩容过程性能稳定无抖动;提供极致高可用,容忍最大N-1节点故障,任意盘或节点故障,数据秒级接管,保障业务持续可用;还支持异地双活,实现业务恢复和故障恢复解耦,Region级高可用。
复杂查询作为Cassandra的典型应用场景,通常采用基于主键的查询方式,即通过完整主键的精确查询、指定分区键的范围查询以及简单的聚合能力来处理,对于非主键条件查询的支持度并不友好,即通过原生二级索引、全表扫描、物化视图等方式查询,主要缺点为限制条件较多,资源消耗大,灵活性不足。
为了解决上述问题,华为云GeminiDB Cassandra接口对架构进行升级,内嵌Lucene搜索引擎,与存储引擎搭配,实现KV存储引擎与搜索引擎的深度融合,保持了系统的整体统一,又扩展了复杂查询能力;利用统一接入层承载开源Cassandra语义,并提供JSON接口,易于扩展。同时通过计算层融合管理和双引擎融合存储,提升数据流转效率和强读写能力,并基于云原生架构,提升资源利用效率,节约成本。
华为云GeminiDB Cassandra接口的增强索引解决方案在实际应用场景中表现优异。比如,在某企业应用场景中,GeminiDB Cassandra接口高效承载海量数据处理和高并发写入,提供了极致扩展性,满足业务高速增长;还提供了多维度的查询和统计,以及多个场景的排序需求,轻松应对各种复杂查询场景。
在华为自身业务实践中,GeminiDB Cassandra接口助力华为终端云高效管理10000多个Cassandra节点,轻松支撑PB级数据和千万级并发访问,实现分钟级计算扩容和秒级存储扩容,Lucene加持,实现强大的索引能力,全力保障数据库稳定运行。
随着企业数字化转型进入深水区,未来,企业将更加需要高可靠、强扩展、高可用、简单灵活的数据库服务,华为云GaussDB将持续深耕技术与服务,不断为企业提供数字化转型最优解,让千行百业的用户都能随时、随地、随心地上云和用云。
- 点赞
- 收藏
- 关注作者
评论(0)