지난 1회와 2회에서는복잡해진 IT 인프라의관리를위해차세대 APM에주목해야하는이유와함께, 웹및모바일사용자경험을제고하기위한방안을소개했다. 또한 3회에서는빅데이터환경에서의애플리케이션성능관리법및평균응답시간관리의중요성을알아보았다. 마지막연재이자 4회차인이번기고문은실제사례로알아보는차세대 APM의필요성을소개할계획이다. 실제사례로알아보는차세대 APM 의필요성 한국컴퓨웨어기술영업본부우정훈상무 Compuware.Korea@compuware.com 연재순서 1 회 2013. 4 복잡해진 IT 인프라관리위해차세대 APM 에주목할때 2 회 2013. 5 웹및모바일사용자경험상승방안 3 회 2013. 6 빅데이터환경에서의성능관리법및평균응답시간관리의중요성 4 회 2013. 7 실제사례로알아보는차세대 APM 의필요성 차세대 APM 을도입하면기업비즈니스개선에어떤효과를얻을수있는지살펴보자 스와로브스키, 차세대 APM으로고객서비스개선세계최고의크리스탈유리제품업체인스와로브스키 (Swarovski) 는다른기업들과마찬가지로 e- 커머스 ( 전자상거래 ) 경쟁력확보에주력하고있다. 스와로브스키는온라인에서제품판매가가능한웹사이트구축을하고얼마지나지않아서 6개언어를사용하는 23개국의연간방문자 6,000 만명에게제품을판매하는단계까지발전하게되었다. 스와로브스키는이단계에서여러번의운영상의어려움을겪게되었다. 특히스와로브스키는온라인비즈니스가성장해갈수록사이트방문고객들에게최상의서비스를제공하기위하여실제로애플리케이션이어떻게작동되는지에대한보다정확하고적절한검증이필요하게되었다. 이미스와로브스키는 CPU와메모리등의주요 IT 인프라의활용상황에대한통계정보를제공하는 SMS와같은모니터링도구를가지고있었으며모니터링을위한 IT부서도운영되고있었지만문제분석및만족스러운성능개선이이루어지지않는실정이었다. 스와로브스키는이러한과제를해결하기위해애플리케이션성능관리 (APM) 를고려했다. APM 은비즈니스요건을충족하여점차진화하는고객의기대에부응하는동시에만족도높은 1
사용자경험을유지하는데반드시필요한솔루션이다. 이에스와로브스키는 컴퓨웨어다이나트레이스엔터프라이즈 (Compuware dynatrace Enterprise) 를도입하여많은고객정보를담은빅데이터기반의카산드라 (Cassandra) NoSQL과하둡맵리듀스빅데이터 (Hadoop Map/Reduce Big Data) 환경등을모두모니터링하고있다. 이를통해실시간애플리케이션운영가시성과함께신속한장애파악및문제해결에소요되는시간을최소화할수있게되었고결과적으로쇼핑몰고객이탈을기존대비 20% 이상줄일수있게되었다. 그러나성능개선을위한모든해결과정이처음부터쉽진않았다. 스와로브스키가해결해야했던 과제, 그리고 APM 을도입하게된이유를한번알아보도록하자. 스와로브스키의과제스와로브스키는웹서버, 애플리케이션서버, SAP, 데이터베이스서버, 외부시스템, 네트워크등대다수모든시스템에전통적인개념의개별구성요소별모니터링시스템을갖추고있었다. 이러한각구성요소의가동률이 99.99% 라고할경우상당히높다고생각할지모르지만이것만으로는충분하지않았다. 각구성요소의가동이중단될경우온라인구매자의사용자경험에는얼마나많은영향을끼치게될까? 최종사용자경험에실제로책임을지는담당자는누구일까? 그리고개별구성요소뿐아니라전체수행경로까지모니터링하려면어떻게해야할까? 스와로브스키는 e-커머스사이트에서더욱많은고객을유치하다보니이런저런궁금증이생겨났고이어서사용자경험에대한불만도뒤따랐다. <APM 은완전한수행경로에대한총체적인관점까지제공하므로 최종사용자경험을책임질수있는담당자가필요하다.> 2
사용자컴플레인을즉시해결해야되는부분이외에도바로해결해야하는문제로는아래와같은 것들이있었다. IT 부서가문제를인지하기전에지원센터가불만전화를얼마나자주받는가? 시스템오류를검색할때와새로운기능을개발할때얼마나많은시간이소요되는가? 고객이불만을제기할때근본원인을찾아낼수있는프로세스가있는가? 고객의관점에서서비스를어떻게시각화하는가? IT부서가문제를찾고있는동안에도위험에처하거나손실되는매출, 브랜드이미지및생산성은얼마나되는가? ' 속도가느리다 ' 는얘기가나올때어떤조치를취해야하는가? 앞서얘기한이러한문제들의해답을찾기위해서는전통적인모니터링시스템보다는사용자 경험관리를위한새로운접근방식이필요했다. 아래의조건들은새로운사용자경험관리를위한 차세대 APM 의요건들이다. 최신아키텍처지원스와로브스키는현재나미래에도시스템아키텍처와호환될수있는접근방식이필요했다. 그리고웹애플리케이션이나모바일애플리케이션의액세스포인트사용여부와상관없이여러장치에서최종사용자를모니터링하기위해서는인터랙티브 Web 2.0 및모바일애플리케이션의증가도감안해야했다. < 브라우저에서다시데이터베이스까지이르는모든트랜잭션을추적해야하므로분산트랜잭션 지원이매우중요하다. 이러한접근방식은아키텍처및구축문제를바로찾아내는데도움이 된다 > 3
비즈니스가시성확보 e- 커머스플랫폼의성공에대한스와로브스키의관심이커지자 IT 부서는각요건을충족하기 위해무엇이필요한지, 그리고애플리케이션수행경로의가용성이나이에대한투자부재가 비즈니스에얼마나영향을끼치는지증명해야했다. 이에스와로브스키는방문수및주문과 애플리케이션성능의상관관계를알아보고성능이매출이나비즈니스에끼치는영향을파악할수 있었다. < 스와로브스키는방문수및주문과애플리케이션성능의상관관계를알아보고성능이 매출이나비즈니스에끼치는영향을파악할수있었다 > 외부서비스및 CDN 영향분석스와로브스키의데이터센터관련트랜잭션외에도회사웹사이트와사용자간의모든인터랙션까지추적해야했다. 심지어 CDN이나외부서비스와의인터랙션도예외는아니었다. 이모든인터랙션이바로사용자경험이므로하나도빠짐없이분석해야만한다. 4
< 모든사용자의거래추적으로스와로브스키는지역별또는외부서비스구성요소나 CDN 콘텐츠의실제부하에미치는영향을파악한다.> 라이프사이클전반의협업지원및사일로해체스와로브스키는운영단계에서문제가발생했을때사후대처방식을따랐었기때문에이를위한새로운 APM 전략이필요했다. 운영단계에서문제가발생한다면비즈니스타격으로이어지기때문에운영단계이전에개발또는테스트단계에서이러한문제를찾아수정하는사전대책방식이궁극적인목표가되어야한다. 또한기능도제각각인여러도구에의지해서는안된다. 지금필요한것은애플리케이션라이프사이클 ( 개발자 PC, 지속적통합, 테스트, 스테이징및운영 ) 을통틀어사용하도록설계된단일솔루션이다. 단일솔루션을사용할경우각라이프사이클단계마다애플리케이션성능데이터의공유가더욱용이하므로누구나다른단계의데이터를쉽게볼수있고버전업데이트마다각단계의데이터를비교하여코드변경의효과와특성을확인할수있다. 소스코드통찰력확보스와로브스키의운영및개발팀이문제해결속도를높이려면코드수준의통찰력을최대한높여야했다. 일부입력파라미터나특정시스템부하에서어느애플리케이션코드의성능이저하되는지알수있으면번거롭게문제가반복되는것을피할수있다. 이러한요건은평균복구시간 (Mean Time To Repair, MTTR) 을수일에서수시간으로줄이는데효과적이다. 제로 / 수용가능한오버헤드유지운영시스템에서정보를수집하는순간부터일정량의오버헤드는피할수없다. 따라서 ' 제로오버헤드 ' 보다더적절한말을찾는다면아마 ' 감지되지않는오버헤드 ' 라고해야겠다. 즉너무나미세해서알수조차없는오버헤드들은존재한다는사실이다. 그렇다면정확한오버헤드수치는얼마일까? 이는비즈니스나사용자에따라다르다. 따라서정확한수치는데이터센터에 5
추가되는 CPU, 메모리또는네트워크대역폭보다는최종사용자경험에미치는영향을근거로 밝혀내야한다. 오버헤드는비즈니스에해가될수있으므로운영단계에서페이지로드시간을 유지하려면 2% 미만의오버헤드관리가필요하다. 데이터수집및관리의중앙화지원구축된 e-커머스애플리케이션을실행하려면데이터수집및관리의중앙집중관리가지원되는 APM 시스템이필요하다. 이유는애플리케이션들이다른지역으로확장될가능성이있기때문이다. 다른시스템, 서버또는데이터센터에서각유형의성능정보를수집하는것은불가능하다. 이경우올바른분석을하려면다양한분석도구가필요하거나단일형식으로데이터를변환해야하기때문이다. 따라서스와로브스키는이방법대신에단일통합 APM 시스템을원했다. 마찬가지로관리의중앙화역시중요했다. 기업이수집된데이터레벨변경이나새버전으로의업그레이드등모니터링시스템변경작업을원격 IT 관리자에게의존하는것을피해야하는이유에서다. 단일중앙저장소에성능데이터를저장하거나이데이터에액세스함으로써빠르고강력한분석과시각화가가능하다. 예를들어 CPU 활용도같은시스템메트릭스는최종사용자응답시간이나데이터베이스실행시간과관련이있는데이모든것이단일대시보드를통해표시된다. 코딩작업이필요없는자동설정식도구스와로브스키의애플리케이션코드대부분은직접개발된것이아니라인터샵 (Intershop) 에서제공한것이므로애플리케이션에대한통찰력을발굴할때도코드를수동으로변경할수없었다. 따라서 APM 시스템은변경사항에따라자동으로설정되어새버전의애플리케이션이구축되더라도구성을수동으로변경할필요가없도록해야한다. 다시말해스와로브스키는애플리케이션이비즈니스실적에긍정적인효과를낼수있도록전력을다할수있다. IT 시스템유지에시간을허비할필요가없다. 새로운환경으로의확장능력겸비스와로브스키의애플리케이션은쉬지않고진화하면서 IT 환경을바꾸고있다. 지금까지물리적으로구축되었던제품들은이제퍼블릭클라우드등의가상환경으로옮겨갈것이다. 환경과는상관없이 APM 솔루션은이러한변화에적응하여아마존클라우드서비스의성능지표 ( 메트릭스 ), 또는 VMware, 카산드라및기타빅데이터솔루션등새로운유형의데이터소스를수용 ( 소비 ) 할수있도록확장성을겸비해야한다. 혹은기준메인프레임애플리케이션까지확장한다음이러한지표를 ( 메트릭스를 ) 중앙데이터저장소로구현함으로써애플리케이션성능에대한새로운가시성을 ( 통찰력을 ) 찾아내야한다. 6
< 애플리케이션모니터링기능을아마존 EC2, 마이크로소프트윈도우애져 (Microsoft Windows Azure) 또는기타퍼블릭및프라이빗클라우드까지확장함으로써이러한가상환경이최종 사용자경험에미치는성능영향을분석할수있다. > 스와로브스키는새로운프로세스및트렌드로써 APM 을비즈니스에적용시켰으며지금은성능 우수센터구축이라는두번째단계를진행중이다. 이우수센터의구축은사후처리방식의 성능문제해결에서사전예방으로바뀌는중요한계기가될것이다. 지금까지 4회에걸쳐차세대 APM에대해알아보았다. 차세대 APM 솔루션을사용하면시장에서요구하는최신제품의빠른출시는물론, 사용자경험을정확히측정하여문제해결시간을기존대비최대 100배까지단축할수있다. 이제차세대 APM솔루션으로신속하고확실한애플리케이션성능관리를통해비용절감과수익극대화에나서보자. 7