GBase 8a MPP Cluster提供基于集群级的主备模式灾备方案,其原理为主集群承担应用,对数据进行批量操作(包括数据加载和数据加工),在主集群加工完数据之后,每天特定时间点, 主备集群间通过比对数据库元数据的 SCN 信息,获取哪些表发生变化,得到需要同步的表,能实现不依靠数据库表中的时间戳字段获取增量数据,并通过GBase 自主研发的Rsynctool工具完成数据自动同步,主备两个数据库集群间以表为单元进行增量同步,将指定数据库表的增量数据从一个数据中心的数据仓库系统传输并写入另一数据中心的数据仓库系统的对应数据库表中,Rsynctool同步无延时,直接同步底层增量变动的DC块。
备集群采用与主集群完全一样的拓扑架构,这样方便实现主备集群间点对点的数据同步,提升数据同步的效率和稳定性。
主备集群间采用异步方式进行数据同步。异方式通过对数据同步和批量加工进行解耦来实现数据同步。该方式建立数据传输的管道机制,通过增加传输作业队列的方式,将数据同步操作和主集群批量加工过程分开,主集群的批量完成时向一个任务队列中增加待同步任务,由专门的调度程序控制数据同步的状态及并发,从而降低数据同步操作与主集群耦合度。
灾备环境按照现有集群架构搭建一套同架构集群,在主集群加工完数据之后,定时或外部调用自动同步程序,主备集群间通过比对数据库元数据的 SCN 信息获取哪些表发生变化,获取需要同步的表,通过GBase 自主研发的 Rsynctool 工具完成数据自动同步。
灾备进行数据传输的方式为主备集群间点对点的方式传输,最大利用各节点磁盘IO和带宽,根据以往实施案例经验,点对点传输速度不低于50M/S,同步过程对CPU资源消耗较小,可控制在5%以内。
根据目前已知网络带宽不小于30MB,GBase 8a主备集群同步能力远大于跨城带宽,因此计算同步时间只需按跨城带宽计算即可, 10GB的待同步数据(压缩前)可在10分钟内完成同步。
根据同步时间计算,10分钟内可完成当日批量产生的增量数据同步,如果故障发生时数据已完成同步, RTO=0,RPO=0,如果故障发生时数据未开始同步或已完成部分同步,RTO<10分钟,RPO<10分钟。