사례를통해본 ORACLE MAA (Maximum Availability Architecture) 2013. 02. Seungtaek Lee( 放浪 DBA)
ORACLE MAA 최고의가용성을보장하기위해 Oracle( 사 ) 의여러솔루션을조합한 Oracle 권고아키텍처 2
ORACLE DB HA Solution Set RAC, Data Guard(ADG), ASM, RMAN, Flashback, GoldenGate, Online operation 등으로구성 Unplanned Downtime ( 장애상황 ) Planned Downtime ( 계획휴지 ) 서버장애 데이터변경 / 손상 시스템변경 데이터변경 어플리케이션변경 RAC (Real Application Clusteres) Flashback RMAN & Secure Backup ASM Data Guard GoldenGate/Streams Online Reconfiguration Rolling Upgrades Online Redefinition Edition-Based Redefinition 3
Standby DB Manual Standby DB 사례 Primary Database Online Redo Logs Redo Buffer SGA LGWR ARCH MQ Archived Redo Logs Archive Log File Shipping MQ Archived Redo Logs Recover Standby DB Standby Database - DB Version : Oracle 8.0 - 전송 : MQ File Adaptor 로 Archive Log 전송. Oracle 8.0 Standby DB 에는 Archive Log File 이나 Redo Log Shipping 기능이없기때문에 MQ File Adaptor 를이용하여 Archive Log File Shipping 기능을구현함. Shipping 된 Archive Log File 을 recover standby database 구문으로 Standby DB 에적용함 SQL> startup nomount SQL> alter database mount standby database; SQL> recover standby database;. Standby DB 로전환시에는 Standby DB 를 Activation 시킴 SQL> alter database activate standby database;. Activation 후에는 Standby DB 를재구성해야함. Online Redo Log 가전송이안되기때문에 Primary Storage 장애시데이터유실이발생할 수있음 4
Tape Clean DVD DAT72 Digital Data Storage hp StorageWorks DAT Run Attention Fault hp Integrity rx8640 Remote SP Present Standby Power Power DataGuard sdev DataGuard/CA 사례 주센터 (Backup Server) 신규 Superdome Backbone Line (10G) DB NAS Snap mirror Data Guard, NAS Snap mirror 용 Line (4G) Data Guard DR 센터 DW Backup Line(4G) DB rx8640 - 서버. Primary DB : HP Superdome (2Node RAC). Standby DB : HP rx8640 (Single DB) - DB Version : Oracle 10gR1 - 전송. Archive Log Shipping/DG 전용 PrivateNW(4Gb). Online Redo Log 는 CA 로복제. Data Guard 를 Archive Shipping 으로전송하고 Online Redo Log 는 CA Async 모드로복제하여 운영 DB 성능영향및데이터유실최소화 8 line XP-CA Line (4G) 평상시 Unmount 평상시 Instance 기동 File System (XP-CA) SMIS DB (Data Guard) PTL (IBM TL3500) VTL (NetApp NearStore) XP12000 평상시 Instance 기동 DW DB XP10000 XP-CA (async 방식 File system, redo log) 5
DataGuard DataGuard/RMAN/ASM 사례 - DB Version : Oracle 10gR2 - 전송. LGWR Shipping/Async/Public NW(1Gb). Online Redo Log 는 CA 로 Sync. Disk Backup 을별도의 ASM Storage 에저장. Primary DB 에서 Incrementally Updated Backup 으로디스크백업수행. Primary DB 에 BCT File 을구성하여백업성능향상. LGWR Async 모드로전송하고 Redo Log 는 CA Sync 모드로복제하여데이터유실을없게함. VTL Backup 을 Standby DB 에서 RMAN Online 백업으로수행하여백업시 Primary DB 의부하 최소화 ( 국내최초 ). Primary DB 서버가모두 Down 시 Primary DB 의 VIP 를 Standby 쿼럼서버로 Fail Over 함. Standby 의 ASM Storage 를이용하여 Duplicate DB 구성 6
Active DataGuard Active DataGuard 사례 코어운영 #1 ADG (Async) 코어운영 DB 코어배치 DB(R/O) 코어운영 #2 배치 SAM ( 코어,CFS) 코어운영 #3 코어용 배치운영 채널용 채널운영 #1 채널운영 DB 채널배치 DB(R/O) 배치 SAM ( 채널 ) ADG 를활용한 BATCH JOB 의수행배치 JOB 이운영 DB WRITE => 배치 DB READ => 운영 DB WRITE 순서로수행 a 수행 (DATA WRITE) 운영 DB 실시간동기화배치 JOB 수행 채널운영 #2 배치 SAM ( 채널,CFS) ADG(Async) b 수행 (DATA READ) 後 배치 DB - 서버. Primary DB : HP Superdome128 (3Node RAC). Standby DB : HP Superdome64 (Single DB). DB Version : Oracle 11gR1. ADG server 를 Read Only 모드로기동, 배치업무수행. 복구용도보다 Read Only 배치업무중심. 복구용서버는 TC 와 UR 솔루션으로구성. Data Guard 을이용한백업은고려되지않음.. Primary DB 에 Switch Over 를위한 Standby Redo Log 는생성되어있음. Primary DB 와 Standby DB 가 Gap 이발생할수 있기때문에 Standby DB 조회시검증 Logic 추가필요 운영계 CORE AP 운영계배치 AP 1 a 작업을통해운영계 DB 에 Write 2 b 수행전기준시간의데이터가운영 DB 로부터배치 DB 로동기화되었는지 Check 3 b, a 작업을통해운영계 DB 에 Write 된 DATA 를사용하여, READ-ONLY MODE 로운영중인배치 DB 에서배치 JOB 수행하여데이터수집 4 c, b 작업으로부터얻은결과를운영 DB 에 Write 7
Active DataGuard Exadata 사례 Oracle Exadata V2 Half Rack Oracle Exadata V2 Half Rack Active Data Guard Max Performance - 서버. Primary DB : Exadata V2 Half Rack. Standby DB : Exadata V2 Half Rack. DB Version : Oracle 11gR2 - 전송. LGWR Shipping/Async/Public NW(1Gb) - 백업. RMAN VTL 백업 - 스토리지. Primary DB : Exadata Storage Server. Standby DB : Exadata Storage Server. 국내최초 Exadata ADG 사례. ADG 전송 NW 을 Public NW 을사용하기때문에 경합발생가능. 백업미디어서버를 InfiniBand 스위치에연결 하여 VTL 백업수행 8
Active DataGuard Fast-Start FailOver 사례 - 서버. Primary DB : Amazon Linux (Single DB). Standby DB : Amazon Linux (Single DB) - DB Version : Oracle 11gR2 Primary. Amazon Cloud 서비스환경하에서구성한 국내최초 FSFO(Fast-Start Failover) 사례 Standby ASYNC Data Guard Observer. Data Guard Observer 가 Primary DB 의상태 를모니터링하여문제발생시자동 Fail Over 수행함. 자동 Fail Over 후에는 Standby DB 를재구성 해야함 자동 Fail Over 후빠른재구성을위해 Flashback DB 로 적용검토필요. Observer 오탐에의한 Fail Over 위험성 Dual Observer 구성검토필요 9
Active DataGuard 품질분석 Data 및시스템 (13TB) Archive (2TB) Exadata/ZFS 사례 엑사데이터서버 -1 품질분석 Data 및시스템 (13TB) Archive (2TB) 엑사데이터서버 -2 복구 / 테스트서버 품질분석 Data 및시스템 (13TB) 품질분석증분 (2TB) Clone (5.4TB) 복구영역 (15.5TB) Archive(Today) (2TB) SANP(T-1) Archive(T-1일 ) SANP(T-2) Archive(T-2일 ) SANP(T-3) Archive(T-3일 ) SANP(T-4) Archive(T-4일 ) SANP(T-5) Archive(T-5일 ) SANP(T-6) Archive(T-6일 ) SANP(T-7) Archive(T-7일 ) 백업및복구지원 Storage Full Full Full Full Backup Backup Backup Backup Archive-1 Archive-1 Archive-1 Archive-1 Archive-2 Archive-2 Archive-2 Archive-2 Archive-3 Archive-3 Archive-3 Archive-3 Archive-4 Archive-4 Archive-4 Archive-4 Archive-5 Archive-5 Archive-5 Archive-5 Archive-6 Archive-6 Archive-6 Archive-6 VTL( 가상테이프라이브러리 ) - 서버. Primary DB : Exadata X3-2 Quarter Rack. Standby DB : Exadata X3-2 Quarter Rack. DB Version : Oracle 11gR2 - 전송. LGWR Shipping/Async/ADG 전용 Private NW(10Gb). Disk Backup 을별도의 ZFS Storage 에저장. Standby DB 를 Incrementally Updated Backup 으로 ZFS Storage 에 1 차저장후 2 차로 ZFS Snapshot 형태로저장. BCT File 은 Standby DB 에만구성. ZFS Snapshot 을이용하여별도의테스트서버에 DB 를구성함. ADG 전용 NW(10Gb) 구성. Standby DB 를 Flashback DB 로구성하여 Logical 장애대응. Quarter Rack 구성 (3 Cell Server) 이라 Cell Server 장애시안정성및성능저하 10