비즈니스중심의서비스관리전략 Date: Sep. 19 (Wed.) SangMee, Ahn BTO Technical Consultant Hewlett Packard 2007 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice
IT 모니터링제품군 NMS/SMS/EMS 인프라 ( 네트워크 + 시스템 ) 측정 사용자 ISP Internet/ WAN Presentation 서버 애플리케이션서버 (WAS) 데이터베이스 애플리케이션상세분석 DB 상세분석 사용자성능 ( 응답속도 ) 가용성 ( 접속성 ) 측정 ( 사용자측에서측정 ) 사용자성능 ( 응답속도 ) 가용성 ( 접속성 ) ( 서버측에서측정 ) J2EE 분석제품 DB 분석제품 사용자성능측정제품 사용자성능측정제품 End-to-End 트래킹툴 2
IT 운영모니터링도입현황 Conducted best practices gap analyses 수많은포인트툴을도입 부서간합의없는투자 ROI 고려하지않은투자 So What? 3
4
통합관제센터의함정 DB 분석 J2EE 분석웹서버분석로그분석 NMS SMS 통합관제센타 메인프레임사용자분석 이벤트 Overloaded Engineers 5
IT 운영에대한관점바꾸기 누구를위해 IT를운영하는가? 무엇을위해 IT를운영하는가? 6
7
INTRODUCTION TO BSM 가장큰과제 : 비즈니스관점확보 말은쉬우나현실적인어려움존재 성능 / 가용성에대한비즈니스의요구 The Business 비즈니스중심의 SLA 에대한요구 사용자 ( 고객 ) 불만 애플리케이션책임자 공통된언어의부재 근본적인관점차이 IT 운영 사용자의성능가시성없음 기술적인지표에의한인프라운영 / 관리 각종유지보수작업 / 성능의점진적저하 IT Ops IT 조직들은전통적으로운영과비즈니스를분리하여운영해왔습니다. 근본적인협업체계가요구됩니다." 8
BSM 의정의 Business Service Management (BSM) is defined by Gartner as a category of IT operations management software products that link the availability and performance status of IT infrastructure components to business-oriented IT services that enable business processes. 비즈니스관점에서 IT 운영을관리 9
BSM vs Business Value No Integration Integration Problem Mgmt. BSM Predictive Outages are predicted with preventative procedures initiated Mode Proactive Alerts are created with procedures initiated to address a potential outage Personnel are made aware of issue Reactive Manual Fix Automation Scripts Automation Automation Process 10
Gartner Maturity for BSM Category Map IT components to business services Integrated process optimization Business Management business service views, business impact analysis, business planning/modeling Service Management baselining, historical analysis, SLA reporting, end-user experience monitoring Siloed processes No processes Operations Management administration, discovery & topology, inventory, fault management, status monitoring, troubleshooting, event console, alarm correlation, root cause analysis Element Management installation, configuration & maintenance of individual IT components 11
효과적인 BSM 구축을위한제안 Ⅰ 비즈니스영향도를관리하라 At a Glance Visibility into State of Business Services 12
효과적인 BSM 구축을위한제안 Ⅰ 비즈니스영향도를관리하라 At a Glance Visibility into State of Business Services 서비스수준관리통합 Dashboard SLA 위반잔여시간 비즈니스영향 Dashboard 13 인프라장애서비스성능서비스가용성비즈니스영향
효과적인 BSM 구축을위한제안 Ⅰ 비즈니스영향도를관리하라 전략적인 Control Point 설정 : 비즈니스와 IT 운영의조화도출 업무프로세스 업무순서에따라특정 BP 측정 Process Flow 중심의가시성확보 사용자 비즈니스프로세스서비스 비즈니스지표 각거래의비즈니스영향점수선정 주요거래응답시간및가용성성능 / 가용성지표 전략적 / 기술적위치선정 시스템연관성에따른거래선정 인프라스트럭쳐 애플리케이션 / DB 하드웨어네트워크 비즈니스지표 잠재적인비즈니스영향을예상할수있는지표예 ) 일별처리건수, Open Ticket 수, 특정파일크기 각종 Application Parameter 기술적지표 성능, 장애 Indicator SMS / NMS 에서 Data Import 해옴 기존운영 Best Practices 중심으로설정 14
효과적인 BSM 구축을위한제안 Ⅰ 비즈니스영향도를관리하라 서비스중심으로연결된 KPI 관리 사용자 Internet 방화벽 네트워크 프런트엔드 Web 애플리케이션레이어 SAP, Siebel, J2EE, Weblogic 백엔드 DB, 메인프레임 KT Boranet Active Monitoring (BPM) Passive Monitoring (Real User Monitor) 지역별성능 / 가용성분포로데이터신뢰성확대및고객눈확보 해당업무와연관있는인프라정보 해당업무의사용자관점의성능 ( 응답속도 ) 해당업무의사용자관점의가용성 해당업무의비즈니스영향 (Impact) - 현단위시간당 Impact - 장애누적시간의 Impact 15 해당업무와연관된총접속자수 ( 지나치게낮으면감지안된장애의징후 )
효과적인 BSM 구축을위한제안 Ⅱ 문제해결최적화체계를구축하라 Proactively Identify, Isolate, and Resolve Problems 질문 서비스장애감지시기? 서비스장애감지후장애범위에대한파악은? 장애대처프로세스는? 서비스장애시관련된 Event 및변경내역을바로리스트할수있는가? 성능이슈발생시느려진구간을바로분리할수있는가? 장애조치시유관부서와의협력은? 16
7 steps to solving a problem 1. Detection Do I have a problem? 2. Recognition Is this a known problem or not? (new problem) 3. Isolation Where is it? 4. Identification What is it? 5. Service restoration How do I restore service? How do I verify that service is restored? 6. Root Cause Analysis What is causing the problem? 7. Remediation How do I fix it? How do I verify that it is fixed? 17
문제해결단계 원인분석 : 80% 문제의발견 Tier 지목 (Tier Isolation) 1차원인분석 진짜문제인가? 누가어떻게영향을받는지? 무엇이가장급히해결해야하나? 내부문제? 외부문제? 원인이되는위치? 티어 (Tier)? 누구에게어떤정보를줘야하나? 어떤요소가문제의원인을제공하고있나? 어떤형태의문제로인한장애인가? Incident 누가 Management 해결해야할문제인가? Problem Management IT 운영서비스지원 애플리케이션정문성부족서비스복구가주요목표근본적문제의해결이지연 의견이쉽게동의안됨 문제해결 : 20% 문제상세분석수정 / 해결 어떻게해결해야하나? 어떻게하면재발을방지할수있나? 효과가있었나? 다른부작용은없었나? 문제의전면재조사가빈번함정확한분석이어려움 서비스개선개발 PMO 18
일반적인장애해소과정 IT 운영 장애보고 운영관리자장애내용확인 인프라 사용자 운영요소확인 지원엔지니어 변경적용 장애확인 지원요청 원인확인 / 통보 수정 / 변경 개발자 / 애플리케이션 테스트환경 장애재연 (Trial & Error) 지원전문가 개발 / 애플리케이션지원 19
일반적인장애해소과정 IT 운영 장애보고 운영관리자장애내용확인 인프라 사용자 운영요소확인 지원엔지니어 변경적용 장애확인 지원요청 원인확인 / 통보 수정 / 변경 개발자 / 애플리케이션 테스트환경 장애재연 (Trial & Error) 지원전문가 개발 / 애플리케이션지원 20
장애를어떻게인지합니까? 수동적인장애감지의보편화 애플리케이션장애 성능저하 사용자불만 인프라 인프라장애 이벤트콘솔 비즈니스관점에서는 21 Business Impact 는이미발생 사후조치만가능함 인프라장애와사용자영향도의연관성부재
효과적인 BSM 구축을위한제안 Ⅱ 문제해결최적화체계를구축하라 신속한장애감지 - 사용자관점모니터링및실시간서비스상황판 ISP Mgmt Firewall Mgmt Load Mgmt Network Mgmt Server Mgmt Firewall Mgmt Server Mgmt Storage Mgmt 최종사용자관점에서성능 / 가용성모니터링 인프라스트럭쳐모니터링내용과최종사용자성능과의연관관계분석 IT 운영관리체계를단순화함 22
효과적인 BSM 구축을위한제안 Ⅱ 문제해결최적화체계를구축하라 신속한장애구간분리 - 장애구간조기분리 (Tier Isolation) Tier 지목 (Tier Isolation) 외부문제 네트워크문제 웹서버 데이터베이스 Apps 혹은 Backend 문제 WHY? 1차원인분석 Application 서버의 CPU 사용율이증가되는것이발견됨 Tier 2 로상세원인분석의뢰 23
효과적인 BSM 구축을위한제안 Ⅱ 문제해결최적화체계를구축하라 Top Down Drill Down 장애원인분석 어플리케이션지연분석 어플리케이션의지연구간분리 응답시간지연이서버응답시간의증가로확인됨 24 소스레벨의지연구간분리 SQL 레벨
효과적인 BSM 구축을위한제안 Ⅱ 문제해결최적화체계를구축하라 Top Down Drill Down 장애원인분석 네트웍지연시간분석 응답시간상세분석보고서를통해네트워크의지연이확인됨 Hop 별 Delay Time 측정 : 특정네트워크구간에서의지연으로전체서비스응답시간이지연된것을확인 25
효과적인 BSM 구축을위한제안 Ⅱ 문제해결최적화체계를구축하라 연관된 IT 요소의변경및이벤트 Corelation 서비스의장애시장애의원인이되는 IT 인프라의이벤트확인 26
ITIL 프로세스 vs 솔루션매핑 Help ticket Service Management Create call Incident Management Create incident Problem Management Know Error Closure Change Management Create request unresolved? Troubleshoot Permanent fix found? Document resolution Document close Create problem Events - System Perform Triage and Isolation Determine root cause Events End User 장애감지 어플리케이션상세진단 인프라상세진단 27 SC 모니터링
효과적인 BSM 구축을위한제안 Ⅲ 비즈니스서비스중심의 CMDB 를구축하라 어플리케이션과인프라간의연관성파악 사용자및비즈니스프로세스 Quote to cash 비즈니스서비스포탈 Service 재무 B 인사 어플리케이션 SAP Oracle J2EE Web- Logic.NET 서버 Windows Unix Mainframe AS400 Linux 네트웍및기반인프라 Federated CMDB 28
효과적인 BSM 구축을위한제안 Ⅲ 비즈니스서비스중심의 CMDB 를구축하라 비즈니스서비스중심의연관관계에기반한영향도파악 비즈니스서비스중심의연관관계에기반한영향도파악 Loans 비즈니스서비스구성요소의 KPI 상태 29
효과적인 BSM 구축을위한제안 Ⅲ 비즈니스서비스중심의 CMDB 를구축하라 자동화된 Discovery 기능을제공하는 CMDB Layer 6 and 7 Windows: WMI, xcmd, pstools... Linux/Unix: Snmp, telnet... Application specific queries (SQL, exchange logins, JMX, ADSI etc)... Spiral Discovery Minimizes Impact App App App App App Layer 4 and 5 SNMP, Telnet, WMI, xcmd, pstools... SPIRAL DISCOVERY Host Host Host Host Host Layer 2 and 3 SNMP, IP Sweep, Telnet... Scan Routing, Switching tables... Network Infrastructure 30
HP Business Service Management 제안 사용자 서울 방화벽 네트워크 프런트엔드 Web, Citrix etc. 애플리케이션 SAP, Siebel, J2EE, Weblogic 데이터베이스 Oracle, DB2 etc. 대전 부산 사용자성능 / 가용성 BPM RUM CM 인프라스트럭쳐모니터링 ( 시스템, 네트워크, 애플리케이션 ) 애플리케이션매핑 (Application Mapping) 문제원인분석 (Triage/Breakdown) Business Availability Center (BAC) 상세분석엔진 (J2EE/.NET Diagnostics) 서비스수준관리 (SLM) 실시간상황판 (Dashboard) 보고서 (Reporting) 31
HP Business Service Management 제안 최종사용자관점에서제공되는비즈니스서비스의가시성확보 서비스수준 (SLA) 을비즈니스관점에서관리 애플리케이션과인프라스트럭쳐관계를자동감지, 매핑 자동으로인프라스트럭쳐요소및변경감지 깊이있는분석으로능동적인문제해결 서비스수준향상 비즈니스영향관리 고객의다운타임최소화 32
Q & A 33 단기 4340 년 9 월 27 일 HPS Services Portfolio v3.0