✍ Posted by Immersive Builder Seong
1. 개요
Lifekeeper를 이용하여 DBMS를 운용하기 위한 방법을 공유하고자 문서를 작성합니다.
2. 사용 방법
1) Lifekeeper 란?
Lifekeeper는 이중화 구성된 서버를 모니터링하고 서비스의 고가용성을 제공하기 위한 HA 솔루션입니다.
Virtual IP, Fail-Over, 볼륨 복제, 동기화 등의 기능을 제공하고 있습니다.
2) 프로세스 기동 및 정지
2-1) 명령어 실행 경로
# cd /opt/Lifekeeper/bin
2-2) 프로세스 기동
# lkstart
Created symlink from /etc/systemd/system/lifekeeper-graphical.target.requires/lifekeeper.service to /usr/lib/systemd/system/lifekeeper.service.
Created symlink from /etc/systemd/system/lifekeeper-multi-user.target.requires/lifekeeper.service to /usr/lib/systemd/system/lifekeeper.service.
▷ 모니터링 프로세스 기동 및 서비스 자동시작 활성화
2-3) 프로세스 정지
# lkstop
▷ 모니터링 프로세스 및 모든 서비스(DBMS, Volume, VIP 등) 정지
# lkstop -f
Removed symlink /etc/systemd/system/lifekeeper-graphical.target.requires/lifekeeper.service.
Removed symlink /etc/systemd/system/lifekeeper-multi-user.target.requires/lifekeeper.service.
▷ 서비스(DBMS, Volume, VIP)는 유지한 상태에서 모니터링 프로세스만 정지
▷ 리소스에 대해 Fail-Over를 수행하지 않음
▷ 등록된 리소스(DBMS)에 대한 패치, 업데이트 작업으로 DBMS 수동 정지가 필요한 경우 수행함
2-4) 프로세스 확인
# lktest
▷ 화면에 정보가 출력되면 활성화 상태
▷ 화면에 아무것도 출력되지 않으면 비활성화 상태
# systemctl status lifekeeper.service
● lifekeeper.service - SIOS LifeKeeper
Loaded: loaded (/usr/lib/systemd/system/lifekeeper.service; enabled; vendor preset: disabled)
Active: active (exited) since Mon 2021-06-28 15:19:09 KST; 1min 39s ago
Process: 2688 ExecStart=/opt/LifeKeeper/bin/lk-start-stop start (code=exited, status=0/SUCCESS)
Main PID: 2688 (code=exited, status=0/SUCCESS)
Tasks: 0
CGroup: /system.slice/lifekeeper.service
Jun 28 15:19:09 homepg-db-001 systemd[1]: Starting SIOS LifeKeeper...
Jun 28 15:19:09 homepg-db-001 systemd[1]: Started SIOS LifeKeeper.
▷ Active 상태면 활성화
▷ Inactive 상태면 비활성화
3) 수동 절체
Lifekeeper를 이용하여 DBMS를 기동 및 정지하는 것을 권장합니다.
3-1) 수동 절체 (DB#1 -> DB#2)
# perform_action -t [최상위 리소스] -a restore
▷ Standby 서버에서 수동절체 명령을 수행합니다.
ex) perform_action -t rms -a restore
Option | 설명 |
-t | 리소스 태그명 |
-a | 수행할 액션 : restore / remove |
-b | 해당 리소스까지만 기동 |
3-2) 클러스터 상태 확인
# lcdstatus -q
▷ STATE 값이 ISP이면 활성화
▷ STATE 값이 OSU이면 비활성화
STATE | 설명 |
ISP | 리소스 상태 정상(Active) |
OSU | 리소스 상태 비활성화(Standby) |
ex) DB 클러스터 상태
[ 홈페이지 DB#1 (Active) ]
# ./lcdstatus -q
LOCAL TAG ID STATE PRIO PRIMARY
homepg-db-001 okms okms ISP 1 homepg-db-001
homepg-db-001 work work ISP 1 homepg-db-001
homepg-db-001 /data /data ISP 1 homepg-db-001
homepg-db-001 datarep-data /dev/mapper/vg-lvm ISP 1 homepg-db-001
homepg-db-001 vip-192.168.30.100 vip-192.168.30.100 ISP 1 homepg-db-001
homepg-db-001 ip-192.168.30.100 IP-192.168.30.100 ISP 1 homepg-db-001
MACHINE NETWORK ADDRESSES/DEVICE STATE PRIO
homepg-db-002 TCP 192.168.31.10/192.168.31.11 ALIVE 1
homepg-db-002 TCP 192.168.30.10/192.168.30.11 ALIVE 2
[ 홈페이지 DB#2 (Standby) ]
# ./lcdstatus -q
LOCAL TAG ID STATE PRIO PRIMARY
homepg-db-002 okms okms OSU 10 homepg-db-001
homepg-db-002 work work OSU 10 homepg-db-001
homepg-db-002 /data /data OSU 10 homepg-db-001
homepg-db-002 datarep-data /dev/mapper/vg-lvm OSU 10 homepg-db-001
homepg-db-002 vip-192.168.30.100 vip-192.168.30.100 OSU 10 homepg-db-001
homepg-db-002 ip-192.168.30.100 IP-192.168.30.100 OSU 10 homepg-db-001
MACHINE NETWORK ADDRESSES/DEVICE STATE PRIO
homepg-db-001 TCP 192.168.31.11/192.168.31.10 ALIVE 1
homepg-db-001 TCP 192.168.30.11/192.168.30.10 ALIVE 2
'ETC > Solution' 카테고리의 다른 글
[모니터링 솔루션] Datadog(데이터독)을 사용해보자_1편 (1) | 2023.05.11 |
---|