(2)达梦数据库守护集群架构部署教程
一、达梦数据库守护集群介绍
达梦数据库通过守护集群可以实现主备模式或读写分离集群,二者在搭建过程上基本一致,区别在于:
· 数据守护集群:通常使用实时归档 + ARCH WAIT APPLY=0 (高性能模式)
· 读写分离集群:通常使用即时归档 + ARCH WAIT APPLY=1 (数据一致性模式) + 客户端读写分离与读写百分比配置
截止2024年6月20日,DM8使用的数据守护版本为 V4.0 。在进行集群部署时必须先通过备份与还原的方式确保主备节点数据一致,主节点可以是刚完成初始化的新实例、也可以是生产环境中的实例。一定不能采用拷贝数据文件的方式来让主备节点数据一致,原因如下:
1、数据库实例在初始化时会生成一个永久魔数(permenant_magic),该魔数生成后就无法改变。主备节点在传送日志时会先判断节点间的魔数是否一样,只有来自同一个数据守护环境中的实例才能收发日志
2、由于 dminit 初始化数据库时,会生成随机密钥用于加密,每次生成的密钥都不相同,备库无法解析采用主库密钥加密的数据
3、每个库都有一个数据库魔数(DB_MAGIC),每经过一次还原、恢复操作,DB_MAGIC 就会产生变化,需要通过这种方式来区分同一个数据守护环境中各个不同的库。
二、达梦数据库主备模式部署教程
1、各节点安装数据库
参考单机部署的方式先正常部署达梦数据库,注意各节点的 INSTANCE_NAME 不能相同
2、数据备份与还原
如果是没有数据的新集群,建议采用主库脱机备份、备库脱机还原的方式来准备数据;如果主库已经处于运行状态,可以对主库进行联机备份,然后对备库脱机还原的方式来准备数据。
· 主节点脱机备份
systemctl stop DmServiceDMSERVER.service su - dmdba mkdir /dmdbms/backup /dmdbms/bin/dmrman CTLSTMT="BACKUP DATABASE '/dmdbms/data/DAMENG/dm.ini' FULL TO FULL_BACKUP_FILE BACKUPSET '/dmdbms/backup/FULL_BACKUP'"
· 备节点脱机还原
#restore /data/dmdbms/bin/dmrman CTLSTMT="RESTORE DATABASE '/dmdbms/data/DAMENG/dm.ini' FROM BACKUPSET '/dmdbms/backup/FULL_BACKUP'" #recover /data/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/dmdbms/data/DAMENG/dm.ini' FROM BACKUPSET '/dmdbms/backup/FULL_BACKUP'" #更新魔数 /data/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/dmdbms/data/DAMENG/dm.ini' UPDATE DB_MAGIC"
3、主节点配置
· dm.ini 配置
vi /dmdbms/data/DAMENG/dm.ini #只需要修改以下内容 INSTANCE_NAME = DMSERVER_MASTER PORT_NUM = 5236 DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间 ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS = 2 #不允许备库OFFLINE表空间 MAL_INI = 1 #打开MAL系统 ARCH_INI = 1 #打开归档配置
· dmmal.ini 配置 (该配置文件主备库配置完全一致)
创建 dmmal.ini文件,MAL_HOST 使用内部网络 IP,MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,MAL_DW_PORT 是各实例对应的守护进程之间,以及守护进程和监视器之间的通信端口
vi /dmdbms/data/DAMENG/dmmal.ini MAL_CHECK_INTERVAL = 5 # MAL链路检测时间间隔 MAL_CONN_FAIL_INTERVAL = 5 # 判定MAL链路断开的时间 [MAL_INST1] # 每个实例信息 MAL_INST_NAME = DMSERVER_MASTER # 实例名,和dm.ini中的INSTANCE_NAME一致 MAL_HOST = 192.168.159.102 # MAL系统监听TCP连接的IP地址 MAL_PORT = 6236 # MAL系统监听TCP连接的端口 MAL_INST_HOST = 192.168.159.102 # 实例的对外服务IP地址 MAL_INST_PORT = 5236 # 实例的对外服务端口,和dm.ini中的PORT_NUM一致 MAL_DW_PORT = 7236 # 实例本地的守护进程监听TCP连接的端口 MAL_INST_DW_PORT = 8236 # 实例监听守护进程TCP连接的端口 [MAL_INST2] MAL_INST_NAME = DMSERVER_BACKUP MAL_HOST = 192.168.159.103 MAL_PORT = 6236 MAL_INST_HOST = 192.168.159.103 MAL_INST_PORT = 5236 MAL_DW_PORT = 7236 MAL_INST_DW_PORT = 8236
· dmarch.ini 配置
dmarch.ini用于进行本地归档和实时归档相关配置。除了本地归档外,其他归档配置项中的 ARCH_DEST 均表示“当实例是 Primary 模式时,需要同步归档数据的目标实例名”。如当前集群中有实例 TEST_MASTER 为主库,有 TEST_SLAVE为实时备库,那么 ARCH_DEST 配置就应为 TEST_SLAVE
vi /dmdbms/data/DAMENG/dmarch.ini [ARCHIVE_REALTIME] ARCH_TYPE = REALTIME ##配置归档类型为实时归档 ARCH_DEST = DMSERVER_BACKUP ##配置归档目标实例名,这里填写为备机 [ARCHIVE_LOCAL1] ARCH_TYPE = LOCAL ##本地归档类型 ARCH_DEST = /dmdbms/dmarch ##本地归档文件存放路径 ARCH_FILE_SIZE = 128 ##单位Mb,本地单个归档文件最大值 ARCH_SPACE_LIMIT = 0 ##单位Mb,0表示无限制,范围1024~2147483647M
· dmwatcher.ini配置 (该配置文件主备库配置完全一致)
修改 dmwatcher.ini 配置守护进程,配置为全局守护类型,使用自动切换模式
vi /dmdbms/data/DAMENG/dmwatcher.ini [GRP1] # 和备库保持一致 DW_TYPE = GLOBAL # 全局守护类型 DW_MODE = AUTO # 自动切换模式 DW_ERROR_TIME = 10 # 远程守护进程故障认定时间 INST_RECOVER_TIME = 60 # 主库守护进程启动恢复的间隔时间 INST_ERROR_TIME = 10 # 本地实例故障认定时间 INST_OGUID = 453331 # 守护系统唯一标识码,即OGUID INST_INI = /dmdbms/data/DAMENG/dm.ini ##dm.ini配置文件路径 INST_AUTO_RESTART = 1 # 实例是否自动重启 INST_STARTUP_CMD = /data/dmdbms/bin/dmserver #自启动命令路径 RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭 RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
· 启动主节点
一定要以Mount方式启动数据库实例,否则系统启动时会重构回滚表空间,生成Redo日志;并且启动后应用可能连接到数据库实例进行操作,破坏主备库的数据一致性。这里执行命令后是前台拉起,当后续操作将oguid和primay standby状态设置完成之后,就可以将前台退出,再使用watcher拉起数据库实例,watcher守护进程会自动将数据库状态修改为Open
su - dmdba ./dmserver /dmdbms/data/DAMENG/dm.ini mount
· 设置 OGUID
启动命令行工具 DIsql,登录主库设置 OGUID 值。系统通过OGUID值确定一个守护进程组,由用户保证OGUID值的唯一性,并确保数据守护系统中,数据库、守护进程和监视器配置相同的OGUID值
su - dmdba /dmdbms/bin/disql SYSDBA/SYSDBA #将手动修改模式的功能打开 SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); #设置OGUID SQL>sp_set_oguid(453331); SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
· 修改数据库模式
/dmdbms/bin/disql SYSDBA/SYSDBA SQL>alter database primary; #启动另一个会话登录数据库,此时状态应该为“主库打开状态”
4、备节点配置
· dm.ini配置
vi /dmdbms/data/DAMENG/dm.ini INSTANCE_NAME = DMSERVER_BACKUP PORT_NUM = 5236 ##数据库实例监听端口 DW_INACTIVE_INTERVAL = 60 ##接收守护进程消息超时时间 ALTER_MODE_STATUS = 0 ##不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS = 2 ##不允许备库OFFLINE表空间 MAL_INI = 1 ##打开MAL系统 ARCH_INI = 1 ##打开归档配置
· 配置 dmmal.ini(该配置文件主备库配置完全一致)
vi /dmdbms/data/DAMENG/dmmal.ini MAL_CHECK_INTERVAL = 5 # MAL链路检测时间间隔 MAL_CONN_FAIL_INTERVAL = 5 # 判定MAL链路断开的时间 [MAL_INST1] # 每个实例信息 MAL_INST_NAME = DMSERVER_MASTER # 实例名,和dm.ini中的INSTANCE_NAME一致 MAL_HOST = 192.168.159.102 # MAL系统监听TCP连接的IP地址 MAL_PORT = 6236 # MAL系统监听TCP连接的端口 MAL_INST_HOST = 192.168.159.102 # 实例的对外服务IP地址 MAL_INST_PORT = 5236 # 实例的对外服务端口,和dm.ini中的PORT_NUM一致 MAL_DW_PORT = 7236 # 实例本地的守护进程监听TCP连接的端口 MAL_INST_DW_PORT = 8236 # 实例监听守护进程TCP连接的端口 [MAL_INST2] MAL_INST_NAME = DMSERVER_BACKUP MAL_HOST = 192.168.159.103 MAL_PORT = 6236 MAL_INST_HOST = 192.168.159.103 MAL_INST_PORT = 5236 MAL_DW_PORT = 7236 MAL_INST_DW_PORT = 8236
· 配置 dmarch.ini
由于当前实例是备库,为了确保以后发生主从切换后还能把数据传送给其他节点,这里就需要将 ARCH_DEST 配置为 原来的MASTER
vi /dmdbms/data/DAMENG/dmarch.ini [ARCHIVE_REALTIME] ARCH_TYPE = REALTIME ##配置归档类型为实时归档 ARCH_DEST = DMSERVER_MASTER ##配置归档目标实例名,这里填写主库 [ARCHIVE_LOCAL1] ARCH_TYPE = LOCAL ##本地归档类型 ARCH_DEST = /dmdbms/dmarch ##本地归档文件存放路径 ARCH_FILE_SIZE = 128 ##单位Mb,本地单个归档文件最大值 ARCH_SPACE_LIMIT = 0 ##单位Mb,0表示无限制,范围1024~2147483647M
· dmwatcher.ini配置 (该配置文件主备库配置完全一致)
vi /dmdbms/data/DAMENG/dmwatcher.ini [GRP1] # 和备库保持一致 DW_TYPE = GLOBAL # 全局守护类型 DW_MODE = AUTO # 自动切换模式 DW_ERROR_TIME = 10 # 远程守护进程故障认定时间 INST_RECOVER_TIME = 60 # 主库守护进程启动恢复的间隔时间 INST_ERROR_TIME = 10 # 本地实例故障认定时间 INST_OGUID = 453331 # 守护系统唯一标识码,即OGUID INST_INI = /dmdbms/data/DAMENG/dm.ini ##dm.ini配置文件路径 INST_AUTO_RESTART = 1 # 实例是否自动重启 INST_STARTUP_CMD = /data/dmdbms/bin/dmserver #自启动命令路径 RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭 RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
· 启动从节点
和主节点一样,也需要以Mount方式启动数据库实例
su - dmdba ./dmserver /dmdbms/data/DAMENG/dm.ini mount
· 设置 OGUID
和主库设置为相同的 OGUID
su - dmdba /dmdbms/bin/disql SYSDBA/SYSDBA SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); SQL>sp_set_oguid(453331); SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
· 修改数据库模式
启动命令行工具 DIsql,登录备库修改数据库为 Standby 模式。如果当前数据库不是 Normal 模式,需要先修改 dm.ini 中 ALTER_MODE_STATUS 值为 1,允许修改数据库模式,修改 Standby 模式成功后再改回为 0。如果是 Normal 模式,请忽略下面的第 1 步和第 3 步
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); //第1步 SQL>alter database standby; //第2步 SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0); //第3步
5、启动守护进程
· 启动DMWATCHER 服务
主备节点都使用守护进程dmwatcher拉起节点,此时开始广播自身和其监控实例的状态信息,然后陆续将本地实例从之前的mount状态切换为 Open 状态。以后启动dmwatcher后,它也将自动拉起对应的数据库实例
su - dmdba #启动后登录数据库查看是否为open状态 /dmdbms/bin/dmwatcher /dmdbms/data/DAMENG/dmwatcher.ini
· DMWATCHER 服务注册
# -p 对应INSTANCE_NAME /dmdbms/script/root/dm_service_installer.sh -t dmwatcher -watcher_ini /dmdbms/data/DAMENG/dmwatcher.ini -p DAMENG systemctl start DmWatcherServiceDAMENG
6、监视器配置
由于主库和实时备库的守护进程配置为自动切换模式,因此还需要配置监视器来实现故障自动切换
· dmmonitor.ini 单实例监视器配置
vi /dmdbms/data/DAMENG/dmmonitor.ini MON_DW_CONFIRM = 1 ##确认监视器模式,1支持自动切换主备,0是只监视 MON_LOG_PATH = /dmdbms/log/ ##监视器日志文件存放路径 MON_LOG_INTERVAL = 60 ##每隔60s定时记录系统信息到日志文件 MON_LOG_FILE_SIZE = 32 ##每个日志文件最大32M MON_LOG_SPACE_LIMIT = 0 ##不限定日志文件总占用空间 [GRP1] #组名要和主备配置一致 MON_INST_OGUID = 453331 ##组GRP1的唯一OGUID值 #以下配置为监视器到组GRP1的守护进程的连接信息,以“IP:PORT”的形式配置,IP对应dmmal.ini中的MAL_HOST,PORT对应dmmal.ini中的MAL_DW_PORT MON_DW_IP = 192.168.159.102:7236 MON_DW_IP = 192.168.159.103:7236
· 前台启动监视器
bin/dmmonitor /dmdbms/data/DAMENG/dmmonitor.ini
· 将监视器注册到系统并启动
由于bin/dmmonitor运行后是前台管理,如果要将DMMONITOR注册为系统服务并且后台启动,可以使用dm_service_installer.sh脚本
# -t 服务类型,这里为dmmonitor # -monitor_ini monitor配置文件路径 # -p 对应INSTANCE_NAME /dm8/script/root/dm_service_installer.sh -t dmmonitor -monitor_ini /dm8/dmmonitor.ini -p Monitor # 启动监视器 DmMonitorServiceMonitor start
· 监视器日常管理命令
#登录集群,使用SYSDBA账号信息 login #查看监视器数据 show #主备切换,切换后登录数据库查看角色以进行验证 switchover
· 自动模式下的集群故障场景
主库故障、备库正常:当集群处于自动模式下,主库出现故障不可用时,监视器会自动选择符合条件的备库进行接管,此时无需人工操作
主库正常、备库故障:主库数据库实例进入suspend暂停状态,此时不可读写。如果需要快速恢复业务,需要让主库恢复为OPEN状态
select status$ from v$instance; alter database open;
评论