Clickhouse适配GaussDB开源开发心得
1 背景介绍
开源for Huawei(参考https://developer.huaweicloud.cn/programs/opensource/contributing/) 通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。开始之前,开发者可以下载 开源for Huawei Wiki(参考下面链接https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview) 了解详细的开发步骤,技术准备,以及开发过程需要的各种资源。
2 需求分析
2.1 开源软件基本情况
ClickHouse 是一个开源的、用于联机分析处理(OLAP)的列式数据库管理系统(DBMS)。它专为快速查询大量结构化数据而设计,能够在短时间内处理复杂的分析查询,广泛应用于数据分析、数据仓库、商业智能等领域。例如,在互联网公司中,可以用于分析用户行为数据,如网站访问记录、用户购买行为等海量数据。它采用列式存储格式。与传统的行式存储不同,列式存储将数据按列进行存储。ClickHouse 的查询速度非常快。它利用了向量化执行引擎,能够同时处理多个数据元素,减少了 CPU 的指令周期。能够处理大量的数据流入和流出。它可以高效地处理每秒数百万甚至更多的查询请求。 |
2.2 任务目的和范围
本任务的主要目的是让ClickHouse支持华为云GaussDB服务,拓展GaussDB影响力,方便ClickHouse的用户使用华为云服务时能够顺利对接ClickHouse服务。同时,该任务也可以为一些项目迁移时候的改造适配打下基础,方便用户在云上做方案选型的时候,可以选择GaussDB服务,缩短开发周期,保证项目迁移进度,降低开发上云成本 。
3 适配验证
3.1 集群搭建
搭建Clickhouse集群。
3.2 适配代码开发
开发Flink代码把Clickhouse数据Sink到GaussDB。
开发Flink代码把GaussDB数据Sink到Clickhouse。
3.3 验证
3.3.1 验证Clickhouse to GaussDB
在Clickhouse中建source表并插入两条数据:
在GaussDB建sink表并插入两条数据:
打包代码提交Flink任务:
从Flink UI界面可以看到Clickhouse的数据已经读取到:
观察GaussDB目标表clickhouse_to_gaussdb_sink_t,结果也已经成功写入:
3.3.2 验证GaussDB to Clickhouse
在GaussDB中建source表并插入两条数据:
在Clickhouse中建sink表并插入两条数据:
打包代码提交Flink任务:
在Flink UI上可以看到数据已经读取成功:
观察目标表gaussdb_to_clickhouse_sink_t,数据也已经成功写入:
- 点赞
- 收藏
- 关注作者
评论(0)