Clickhouse适配GaussDB(For MySQL)开源验证任务

举报
guochengyi 发表于 2024/12/09 15:53:03 2024/12/09
【摘要】 Clickhouse适配GaussDB(For MySQL)开源D验证任务计划书

1      背景介绍

开源for Huawei(参考https://developer.huaweicloud.cn/programs/opensource/contributing/  通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。开始之前,开发者可以下载 开源for Huawei Wiki(参考下面链接https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview) 了解详细的开发步骤,技术准备,以及开发过程需要的各种资源。 

 

2      需求分析

2.1      开源软件基本情况

ClickHouse 是一个开源的、用于联机分析处理(OLAP)的列式数据库管理系统(DBMS)。它专为快速查询大量结构化数据而设计,能够在短时间内处理复杂的分析查询,广泛应用于数据分析、数据仓库、商业智能等领域。例如,在互联网公司中,可以用于分析用户行为数据,如网站访问记录、用户购买行为等海量数据。它采用列式存储格式。与传统的行式存储不同,列式存储将数据按列进行存储。ClickHouse 的查询速度非常快。它利用了向量化执行引擎,能够同时处理多个数据元素,减少了 CPU 的指令周期。能够处理大量的数据流入和流出。它可以高效地处理每秒数百万甚至更多的查询请求。

 

源码地址:https://github.com/ClickHouse/ClickHouse

官网主页:https://clickhouse.com/

主要开发语言:C++

LICENSE:Apache-2.0 license

维护者:开源社区

 

项目数据:Fork 6.9K, Star 37.7K, Contributor 1398,最近一次提交:2024-11-22

star历史(https://star-history.com/):

 


 

2.2      任务目的和范围

本任务的主要目的是让ClickHouse支持华为云GaussDB(For MySQL)服务,拓展GaussDB(For MySQL)影响力,方便ClickHouse的用户使用华为云服务时能够顺利对接ClickHouse服务。同时,该任务也可以为一些项目迁移时候的改造适配打下基础,方便用户在云上做方案选型的时候,可以选择GaussDB(For MySQL)服务,缩短开发周期,保证项目迁移进度,降低开发上云成本 。

  • 能力要求

完成该任务需要熟悉ClickHouse安装和配置,熟悉ClickHouse的常用操作及语法。

熟悉常用的数据结构与算法,ClickHouse的主要开发语言是C++

 

  • 适配任务清单

 

生态

生态细类

是否需要验证

验证逻辑说明

是否需要适配

适配场景说明

昇腾生态

指令

使用昇腾处理器运行应用。

使用昇腾指令实现适配逻辑。

CANN

应用功能依赖于CANN运行。

使用CANN实现适配逻辑。

MindSpore

应用功能依赖于MindSpore运行。

使用MindSpore实现适配逻辑。

鲲鹏生态

指令

使用鲲鹏处理器运行应用。

使用鲲鹏指令实现适配逻辑。

Euler

使用Euler系统运行应用。

使用Euler系统调用实现适配逻辑。

数据库生态

GaussDB(For MySQL)

使用GaussDB(For MySQL)功能。

使用GaussDB(For MySQL)的驱动和SQL实现适配逻辑。

 

GaussDB(DWS)

使用GaussDBDWS)功能。

使用GaussDB(DWS)的驱动和SQL实现适配逻辑。

存储生态

OBS

使用OBS功能。

基于OBS API访问实现适配逻辑。

鸿蒙生态

HarmonyOS

使用HarmonyOS系统运行应用。

使用HarmonyOS系统调用实现适配逻辑。

 

3      工作量评估

 

任务

/

基于华为云ECS完成ClickHouse安装和部署

1

完成GaussDB(For MySQL)适配功能开发

4

完成DEMO设计和代码开发并部署验证

2

输出开发资料和博客

2

代码推送上游社区和更新社区资料

1

总计

10人天

 

4      任务分解

4.1      完成华为云GaussDB(For MySQL)适配功能开发

  • GitCode完成项目Fork,并完成GaussDB(For MySQL)适配需要的脚本和代码开发。
  • 提供ClickHouse镜像,使用该镜像,能够对接GaussDB(For MySQL)服务实现数据的读写

参考FlinkCDC数据同步mysql->clickhousehttps://www.cnblogs.com/kods/p/18278598

 

4.2      完成华为云GaussDB(For MySQL)DEMO设计演示

1.    Gauss(For MySQL)作为source端,需要设计一个FlinkCDC对接Gauss(For MySQL)connector

2.    ClickHouse作为sink端,可以利用Flink已提供了连接器进行数据传输

3.    启动部署好FlinkCDC,UI界面创建一个任务,用于数据同步

4.    进行数据验证,确认在数据同步的过程中,没有出现数据丢失

 

参考下面的用例图:


 

DEMO的简单部署图如下:


 

4.3      DEMO开发、部署和验证

根据DEMO设计,完成演示功能开发和部署

访问FlinkWebUI界面,创建一个任务流用于Gauss(For MySQL)的数据同步到ClickHouse


 

 

4.4      在华为云开发者论坛输出博客

访问华为云开发者论坛(参考:https://bbs.huaweicloud.cn/blogs)发表博客,介绍完成这些任务的过程和心得。

 

内容包括不限于如下内容:

  • 开源for Huawei的背景
  • 开源软件的功能介绍
  • 开发适配过程及碰到和解决的问题
  • DEMO设计、开发、部署过程
  • 代码推送开源社区及互动过程

 

博客打上如下标签:

  • 开源(必选)
  • 开发者(必选)
  • 鲲鹏(可选)
  • Gauss(For MySQL)(可选)

 

4.5      代码推送上游社区

将代码合并到Clickhouse官网主干代码;更新Clickhouse官网资料,包括版本说明、开发指南等。

 

5      验收材料

 

验收细则

评分说明

是否为验收必选项

结果(通过/不通过)

开发者举证

功能开发:完成与华为三大根技术生态(鲲鹏云、昇腾云、鸿蒙)适配的功能开发和验证。

完成Gauss(For MySQL)适配功能开发。举证提供PR链接。

 

 

代码质量:适配华为三大根技术生态的代码质量经过工具检测达标

推送给开源社区的代码符合开源社区关于代码风格、功能、自动化测试等要求。

 

 

提供相关文档,比如部署文档、使用文档、配置文档等

根据社区要求,完善相关的开发指南和部署指导

 

 

合入到开源项目主仓:代码推送上游社区

代码合并到当前主干分支。举证提供代码仓库链接。

 

 

Deomo设计&开发:完成功能演示Demo的开发

举证提供DEMO仓库地址和DEMO开发提交记录。

 

 

Demo部署&验证:完成功能演示DEMO基于华为云鲲鹏环境的部署和功能验证

提供DEMO部署验证结果的关键截图进行举证。提供DEMO运行环境和资源的规格清单。

 

 

发布博客:发布博客介绍适配心得。

提供博客的地址。

 

 

制作单机版无高危开源镜像。

上架云商店。

 

 

单机版镜像上架时支持模板部署。

 

 

 

制作集群版无高危开源镜像

上架云商店。

 

 

集群版镜像上架时支持模板部署

 

 

 

 

 

 

 

 

 

6      参考资料

  1. 开源for Huawei介绍、环境搭建、示例项目、开发和部署指南:

https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview

  1. 完成任务过程中,碰到问题可以在这里查询或者提问:

https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/issues

  1. Spring Data JPA适配GaussDB开源验证任务心得:

https://bbs.huaweicloud.cn/blogs/438331

4.Flink快速入门

https://nightlies.apache.org/flink/flink-cdc-docs-release-3.2/zh/docs/get-started/introduction/

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。