【DTSE Tech Talk 精选问答】NO.43丨备份恢复全掌握,数仓数据更安全

举报
云小宅 发表于 2024/02/26 15:41:43 2024/02/26
【摘要】 大数据时代,数据的备份恢复是一项不可忽视的系统工作。相对于集群级备份恢复海量的文件操作,物理细粒度备份恢复能够从更小的粒度、以更少的数据文件操作,对数据库对象进行备份与恢复。GaussDB(DWS) Roach工具提供了丰富的物理细粒度备份恢复功能,帮助您更加精确高效地备份恢复指定数据,为您的数据安全保驾护航。

大数据时代,数据的备份恢复是一项不可忽视的系统工作。相对于集群级备份恢复海量的文件操作,物理细粒度备份恢复能够从更小的粒度、以更少的数据文件操作,对数据库对象进行备份与恢复。GaussDB(DWS) Roach工具提供了丰富的物理细粒度备份恢复功能,帮助您更加精确高效地备份恢复指定数据,为您的数据安全保驾护航。

直播链接:https://bbs.huaweicloud.cn/live/DTT_live/202309131900.html

Q:“物理细粒度备份回复不支持恢复表的依赖,如索引等”说的表的依赖,除了索引还有哪些?存储过程、函数、触发器,这些会恢复吗?

A:目前只支持恢复表定义和表数据,其他相关依赖都不支持恢复。

Q:dws 备份是否支持基于时间点恢复?

A:roach基于备份集恢复,备份集具有时间属性,不同时间点对应不同的备份集。

Q:GaussDB(DWS) Roach工具的物理细粒度备份恢复功能对系统资源有哪些要求?

A:物理细粒度备份恢复都是在线进行,备份恢复过程中会连接数据库进行一些查询等操作,但整体不会影响业务的正常运行。

Q:GaussDB(DWS) Roach工具对数据库对象的物理细粒度备份恢复操作需要具备哪些知识基础?

A:掌握对应的物理细粒度备份恢复方法就可以,无需特别的数据库知识。

Q:GaussDB(DWS) Roach工具进行物理细粒度备份恢复时如何保证恢复效率?

A:恢复时间取决于表的数量以及表的数据量大小,可以根据数据量分批对数据进行恢复。

Q:GaussDB(DWS) Roach工具提供了丰富的物理细粒度备份恢复功能,它的这项功能跟别的数据库产品比起来优势和劣势各是什么?

A:物理细粒度备份恢复相比于其他备份恢复可以聚焦更小粒度的数据文件,对指定文件做到快速准确的备份和恢复,同时走物理文件拷贝的方式,更加简洁高效。

Q:GaussDB(DWS) Roach工具提供了哪些具体的物理细粒度备份恢复功能?

A:物理细粒度备份恢复支持schema级全量和增量备份,支持集群级备份带细粒度参数,支持细粒度单表或多表恢复,支持schema级灾难恢复。

Q:GaussDB(DWS) Roach工具在备份恢复过程中如何处理数据一致性问题?

A:通过在备份过程中创建全局一致性点,并记入xolg文件,恢复是各节点通过redo xlog到一致性点达到全局一致性。

Q:GaussDB(DWS) Roach应用哪个版本中了?

A:物理细粒度备份恢复功能在8.1.1版本开始使用,在8.2.1版本之前都是受限使用的状态。8.2.1版本正式商用。

Q:GaussDB(DWS) Roach有没有相关使用教程和案例讲解图文?

A:GaussDB(DWS)的产品文档上有关于roach工具的详细介绍以及使用说明,可参考产品文档进行学习。

Q:pmk和scheduler这两个schema,只有postgres数据库中才有吗?

A:不是,跟数据库没有关系。

Q:restore-new-cluster参数不是备份参数,是将集群恢复到另一主机上之后用来启动集群的?

A:该参数是恢复参数,将集群恢复到新的集群上面。

Q:roach工具适用于哪些工作负载,不适用的情况原因是什么?

A:roach工具是GaussDB(DWS)的备份恢复工具,数据的备份建议在业务量较小的时间段进行。

Q:schema表恢复,原表所属zjw(普通用户)用户,恢复新表变成所属omm(管理用户)用户,这个是需要设置吗?

A:不需要,细粒度恢复是在线进行的,通过连接当前数据库创建出新表,新表默认为当前用户,无需设置。

Q:schema是不是不支持多表备份恢复?

A:支持schema级备份,单表或多表恢复。

Q:备份到新集群,是不是要求新集群的节点布局啥的要跟原集群一致?

A:对,需要新集群与原集群完全同构。

Q:备份恢复容错率大概能达到多少?

A:细粒度备份恢复功能在经过了充分的测试,容错概率基本可以保证,可放心使用。

Q:从schema细粒度物理备份集恢复部分表 可以恢复到异集群上面么?

A:目前单表或多表支持恢复到原集群,恢复到新集群可以使用schema级灾难恢复的方式将整个schema恢复到新集群。

Q:大家都知道备份和备份计划的重要性,请问专家,在大数据主流技术中关于备份技术有哪些成熟的方案,分别有什么特点?

A:目前比较成熟的备份方式是数据库备份,也是GaussDB(DWS)使用的备份技术,可以通过数据库自带的备份工具或自己开发的第三方备份工具进行备份。备份数据可以存储在本地磁盘或远程存储设备中。 此外磁盘备份也是比较成熟的备份方式,将整个磁盘或分区备份到另一个磁盘或存储设备中。这种备份方式可以快速恢复整个系统,但需要大量的存储空间。类似的还有镜像备份。

Q:集群备份集恢复部分表的时候不用重启集群,如果恢复之前集群挂了,那还能恢复么?

A:不可以。细粒度恢复是在线进行的,恢复过程中连接数据库创建新表,因此在细粒度恢复之前需要保持集群处于一个可用的状态。

Q:您提到GaussDB(DWS) Roach工具提供了丰富的物理细粒度备份恢复功能,请问这些功能主要包括哪些方面?在实际应用中,这些功能能够带来哪些具体的好处?

A:物理细粒度备份恢复主要包括备份和恢复两个方面。备份功能包括schema级全量和增量备份,集群级备份带细粒度参数等。恢复功能包括细粒度恢复单表或多表,schema级灾难恢复等。实际使中,物理细粒度备份恢复可以关注重点数据,节省大量空间,同时针对想要恢复的表精准恢复,这些都是其他功能所不具有的。

Q:请问8.1.1支持schema灾难恢复吗?

A:不支持,813支持

Q:请问下A集群的备份集恢复到B集群恢复成功之后启动B集群时需要指定的这个配置文件是A集群的还是B集群的?

A:B集群

Q:请问一下,我在GaussDB 8.1.1尝试了schema级别物理备份到DISK本地,发现只有个别schema可以备份成功,是有什么备份约束条件吗?

A:8.1.1版本支持基本的schema级备份恢复任务,没有特别的约束。同时该版本为受限使用版本,使用中出现的问题可联系技术人员确认。

Q:如何辨别是否系统schema呢?比如我的环境有很多个内置的schema。

A:参考以下条件:1. schema oid < 16384 但不包含 public (oid 为2200); 2. pmk和scheduler这两个系统schema。

Q:如何确定哪些工作负载适合于物理细粒度备份 ,以及哪些不适合?

A:可根据表或者schema的使用频率,以及数据的重要程度来决定是否对schema进行物理细粒度备份。

Q:如何验证GaussDB(DWS) Roach工具的物理细粒度备份恢复结果的准确性?

A:细粒度备份恢复功能在8.2.1版本经过了充分的测试,可放心使用。也可以通过校验备份前后表数据的checksum值来验证表数据的一致性。

Q:数仓备份恢复的原理是什么?如何做到快速备份和恢复?

A:华为云GaussDB(DWS)备份恢复工具采用的是物理文件拷贝和日志redo相结合的方式备份。备份开始之前的所有数据直接通过物理文件拷贝的方式进行,备份过程中产生的数据会对其xlog进行备份。在恢复时直接进行物理文件的替换,同时对备份过程中产生的xlog进行redo来达到一致性点。由于大部分数据走物理文件拷贝的方式,因此备份恢复十分高效,同时保留了redo xlog的逻辑,可以恢复到一致性点。

Q:数据备份我经常使用,但在物理备份过程中会出现因数据量大卡顿现象嘛,如果有,有什么解决方法。在大量数据备份时会出现丢包情况嘛。

A:数据大发可以考虑提高备份的并发数,通过--parallel-process参数指定。

Q:数据库里有没有哪个字段可以区分系统表和用户表?

A:系统表一般保存在系统schema:pg_catalog下。

Q:问什么物理细粒度备份恢复只能在CN节点执行?

A:在备份过程中会生成每个备份集对应的table.list文件,用来记录改备份集可支持哪些表的恢复。在生成的过程中主节点需要连接CN去获取完整的表信息,因此执行节点也就是主节点需要有CN。

Q:物理备份大多应用哪些应用场景备份?

A:现在GaussDB(DWS)的备份恢复方式都采用物理备份的方式,逻辑备份不建议再使用了。

Q:物理细粒度备份恢复的主要优势有哪些?

A:(1)节省大量空间:相比于集群级备份海量的数据备份恢复,物理细粒度备份针对重点文件进行备份,省去了无关数据的备份,节约大量的空间 (2)节约时间:走物理文件拷贝的流程,相对于逻辑备份更加简单高效。 (3)精准恢复:恢复想要恢复的数据,无需对整个集群数据进行恢复。

Q:系统schema是不是不支持备份和恢复?

A:物理细粒度备份不支持系统schema的备份,集群级备份可以。

Q:相对于其他数据库管理系统,GaussDB(DWS)在物理细粒度备份恢复方面有何特点?

A:粒度更小,更加精准;走物理文件拷贝的方式,更加高效。

Q:想问下目前是否支持多schema备份恢复(非全库)?

A:支持,物理细粒度备份支持单个或多个schema备份。

Q:异机备份恢复可以用细粒度备份恢复方案替代嘛?

A:可以使用schema级物理细粒度备份,schema级灾难恢复的方式恢复到新集群。

Q:有什么办法知道给定的一些 process 是否属于同一个备份作业?

A:roach工具在备份恢复的过程中,每个节点有一个gs_roach的进程进行备份恢复工作。

Q:原集群主节点的hostname 是host1,新集群恢复的时候我在新集群的host2上面恢复 这样可以么?

A:可以。

Q:灾难恢复功能,目前测试发现要提前删除目标数据库的同名schema才能正常恢复,否则日志会报错执行某些sql时约束名重名。 我发现有些schema无法删除,比如postgres.scheduler,是这样吗?

A:细粒度灾难恢复到新集群无需手动删除同名schema,此外物理细粒度备份不会备份系统shcema。

Q:在进行物理细粒度备份恢复时,您认为需要注意哪些关键点?如何保证备份恢复的准确性和完整性?

A:按照正确的备份流程,同时参考物理细粒度备份恢复的关键约束,理解备份恢复的基本原理都是保证备份恢复准确性和完整性的前提。

Q:在什么情况下适合使用物理细粒度备份恢复?

A:物理细粒度适用于各种备份恢复场景。特别是对数据库部分元素比较关注,当发生数据丢失希望快速恢复这部分元素使用物理细粒度备份恢复是比较好的选择。

Q:增量备份有没有默认参数?

A:增量备份与全量备份命令函参数基本一致,只是多了--prior-backup-key参数来指定基于哪个备份集进行增量备份任务。

Q:之前的查询日志,是否会一起恢复。然后后面时刻的查询日志,是被删除,还是用upset的方式插入所以还会在?

A:新表物理文件拷贝+数据清洗后,不会保留原来的事务信息。

想要了解更多相关知识,欢迎观看DTSE Tech Talk系列技术直播

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。