Doris适配GaussDB开源开发任务

举报
guochengyi 发表于 2024/12/03 16:02:46 2024/12/03
【摘要】 1 背景介绍开源for Huawei(参考:https://developer.huaweicloud.cn/programs/opensource/contributing/)  通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。开始之前,开发者可以下载 开...

1 背景介绍

开源for Huawei(参考:https://developer.huaweicloud.cn/programs/opensource/contributing/)  通过和公司、高校、社区的开发者合作,完成鲲鹏、昇腾、欧拉、鸿蒙、高斯、云服务等与开源软件的适配开发,帮助繁荣Huawei的基础生态,同时让开源软件能够更加简单、高效的运行于华为云上。
开始之前,开发者可以下载 开源for Huawei Wiki(参考:https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview) 了解详细的开发步骤,技术准备,以及开发过程需要的各种资源。

2 需求分析

2.1 项目影响力
Doris 是一个现代化的MPP(Massively Parallel Processing)大规模并行处理的分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。它由百度大数据研发,于2018年捐赠给Apache软件基金会,所属 Apache 社区。

源码地址:https://github.com/apache/doris
官网主页:https://doris.apache.org/
主要开发语言:
JAVA 37.6%
Groovy 30.8%
C++ 24.7%

维护者:Apache 社区

项目数据:Fork 3.3K, Star 12.8K, Contributors 664+,最近一次提交:2024-11-21
star历史(https://star-history.com/):
 
2.2 任务目的和范围
本任务的主要目的是让Doris与华为云GaussDB数据库互通,打破数据孤岛,实现数据的自由流动和共享整合,拓展GaussDB数据库服务的影响力。同时,该任务也可以为一些项目迁移时候的改造打下基础,方便用户在云上做方案选型的时候,可以选择华为云GaussDB数据库服务,缩短开发周期,保证项目迁移进度,降低开发上云成本 。 
能力要求
本任务计划由Flink CDC完成Doris和GaussDB的数据互通,所以任务需要熟悉Flink安装和配置,熟悉Flink的代码编程及部署,熟悉Doris、GaussDB数据库的原理和使用方法。
适配任务清单
生态 生态细类 是否需要验证 验证逻辑说明 是否需要适配 适配场景说明
昇腾生态 指令 使用昇腾处理器运行应用。 使用昇腾指令实现适配逻辑。
CANN 否 应用功能依赖于CANN运行。 否 使用CANN实现适配逻辑。
MindSpore 否 应用功能依赖于MindSpore运行。 否 使用MindSpore实现适配逻辑。
鲲鹏生态 指令 使用鲲鹏处理器运行应用。 使用鲲鹏指令实现适配逻辑。
Euler 是 使用Euler系统运行应用。 否 使用Euler系统调用实现适配逻辑。
数据库生态 GaussDB 使用GaussDB功能。 使用GaussDB的驱动和SQL实现适配逻辑。
GaussDB(DWS) 否 使用GaussDB(DWS)功能。 否 使用GaussDB(DWS)的驱动和SQL实现适配逻辑。
存储生态 OBS 使用OBS功能。 基于OBS API访问实现适配逻辑。
鸿蒙生态 HarmonyOS 使用HarmonyOS系统运行应用。 使用HarmonyOS系统调用实现适配逻辑。

3 工作量评估和任务分解

3.1 工作量评估
任务 人/天
基于华为云ECS完成Doris安装和部署 1
完成GaussDB数据库适配功能开发 3
完成DEMO设计和代码开发并部署验证 2
输出开发资料和博客 2
代码推送上游社区和更新社区资料 1
总计 9人天

3.2 基于华为云ECS完成Doris安装和部署
华为云部署参考:
 
Doris架构图:
 
1、Frontend(FE),存储、维护集群元数据;负责接收、解析查询请求,规划查询计划,调度查询执行,返回查询结果。主要有三个角色:
1)Leader 和Follower:主要是用来达到元数据的高可用,保证单节点宕机的情况下,元数据能够实时地在线恢复,而不影响整个服务。
2)Observer:用来扩展查询节点,同时起到元数据备份的作用。如果在发现集群压力非常大的情况下,需要去扩展整个查询的能力,那么可以加observer 的节点。observer 不参与任何的写入,只参与读取。
2、Backend(BE),负责物理数据的存储和计算;依据FE 生成的物理计划,分布式地执行查询。数据的可靠性由BE 保证,BE 会对整个数据存储多副本或者是三副本。副本数可根据需求动态调整。
3、MySQLClient:Doris借助MySQL协议,用户使用任意MySQL的ODBC/JDBC以及MySQL的客户端,都可以直接访问Doris。
4、Broker:Broker为一个独立的无状态进程。封装了文件系统接口,提供Doris读取远端存储系统中文件的能力,包括HDFS,S3,BOS等。


3.3 完成GaussDB数据库适配功能开发
申请开通华为云GuassDB服务,并获取相应的配置信息。
生成相关jar包并部署,执行Flink-CDC工作流,实现Doris与GuassDB数据库的数据互通。

参考:
Doris官网:https://doris.apache.org/
Doris仓库地址:https://github.com/apache/doris
Doris学习参考:https://blog.csdn.net/qq_44696532/article/details/128341972
Doris、GuassDB数据互通参考:https://blog.csdn.net/u014494148/article/details/141949027?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-141949027-blog-130302584.235^v43^pc_blog_bottom_relevance_base1&spm=1001.2101.3001.4242.2&utm_relevant_index=4

3.4 完成DEMO设计和代码开发并部署验证
参考DEMO设计结构:
 
1、 在Doris和GaussDB中创建同一结构的测试表,并在GaussDB插入数据;
2、 运行程序,查看Doris数据是否实现同步。
通过整个流程完成使用 Doris 和 GuassDB 的数据互通。
3.5 在华为云开发者论坛输出博客
在华为云开发者论坛发表博客,介绍完成这些任务的过程和心得。包括如下内容:Doris和GaussDB功能介绍;安装部署指导;验证DEMO功能等。

3.6 代码推送上游社区
将代码合并到Doris官网主干代码,更新Doris官网资料,包括版本说明、开发指南等。

4 验收材料

验收细则 评分说明 是否为验收必选项 结果(通过/不通过) 开发者举证
功能开发:完成与华为三大根技术生态(鲲鹏云、昇腾云、鸿蒙)适配的功能开发和验证。 完成GaussDB数据库适配功能开发。
代码质量:适配华为三大根技术生态的代码质量经过工具检测达标 推送给开源社区的代码符合开源社区关于代码风格、功能、自动化测试等要求。
提供相关文档,比如部署文档、使用文档、配置文档等 根据社区要求,完善相关的开发指南和部署指导
合入到开源项目主仓:代码推送上游社区 代码合并到当前主干分支。
Deomo设计&开发:完成功能演示Demo的开发 提供DEMO仓库地址。
Demo部署&验证:完成功能演示DEMO基于华为云鲲鹏环境的部署和功能验证 提供DEMO部署验证结果的关键截图进行举证。提供DEMO运行环境和资源的规格清单。
发布博客:发布博客介绍适配心得。 提供博客的地址。
制作单机版无高危开源镜像。 上架云商店。
单机版镜像上架时支持模板部署。
制作集群版无高危开源镜像 上架云商店。
集群版镜像上架时支持模板部署

5 参考材料

1. 开源for Huawei介绍、环境搭建、示例项目、开发和部署指南:
https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/overview
2. 完成任务过程中,碰到问题可以在这里查询或者提问:
https://gitcode.com/HuaweiCloudDeveloper/OpenSourceForHuaweiWiki/issues
3. Doris适配GaussDB开源验证任务心得:
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。