2012.06.22 Daishin Hedge Fund * Market Analysis www.deri.co.kr Daishin Economic Research Institute + Senior Analyst 김훈길 02) 769-3023 hgkim@deri.co.kr 호가창 (limit order book) 분석 HFT 전략 Summary 컴퓨터시스템을이용해초단기에대량으로매매하는 HFT 는최근국내시장에서도중요성이높아지고있다. 미국의경우규제수준이높아지기전인 2010 년까지는전체주식거래량의 70% 를 HFT 가차지하기도했으며우리나라의경우에도거래세가없는파생상품시장을중심으로주로외국계거래자에의해 HFT 가활발하게이용되고있다. 그러나 HFT 프로그램은운용사들이공개를매우꺼리기때문에구체적인매매로직은잘알려져있지않다. 본보고서에서는호가창데이타를활용한 HFT 매매전략을소개하고시뮬레이션결과를분석해보았다. 본보고서에서소개하는전략은호가창데이타를수집해 MMSE( 최소평균자승오차 ) 방법을통해최적매매호가를계산해내고이를신속하게주문집행해매매를하는구조를가지고있다. 낮은시장변동성을선호하는전략의특성상시장쇼크를 SVM(Support Vector Machin) 을통해미리확인해매매여부를결정하는리스크관리모듈을추가로갖추고있다. 시뮬레이션결과는매매종목의유동성에영향받는매매체결확률 (edge clearing probability) 에크게의존하는것으로나타나고있다.
HFT 의중요성과활용도가증가하고있는추세 국내파생시장거래에서외국계매매자에의한 HFT 비율 80% 육박 IT기술술이발달하면서주식및파생상품매매시장에도계속변화가이어지고있다. 그중최근몇년간가장두드러지는것이 HFT(High Frequency Trad ding, 고빈도매매 ) 이다. HFT 는알려져있다시피컴퓨터알고리즘을이용한초단기대량매매를의미한다. 시장데이터를실시간으로처리해매매가격을예측해서전략에따라주문절절차를실행하는데이과정들이매우짧은시간내에완료된다. HFT 는미국계대형 IB들에의해대략 1990 년대초반부터시작된것으로추정되나그간대중에공개되지는않았으며 2009 년여름골드만삭스의프로그그래머세르게이알레이니코프 (Sergey Aleynikov) 가 HFT코드유출혐의로 FBI에체포되되면서비로소세상에알려지게되었었다. 역사는짧지만 HFT가시장에서차지하는비중은매우크다. 2010 년기준미국주식시장에서일별거래량 100억주의약 70% 가 HFT에의한것으로추산되고있다. 대형 HFT업체의경우많게는하루에 10억주씩거래를하기도하며이런거래를통해주당 0.1~0.5 센트의이익을남긴다. 한국의경우주식시장은 0.3% 의거래세때문에 HFT를적용하하기어려운구조이지만파생시장에에서의매매는상당량이 HFT에의한것으로파악되고있다. 그대부분은외국인투자자에의해발생한다. 지난해 12월만기기준으로하루 2만건이상고빈도매매자중외국인의비중은옵션시장에서 75.6%, 선물시장에서 98% 를차지했했다. 일반적적으로 HFT업체들은자신들의프로그램모듈보호에대한의욕이과잉되어외부에비밀주주의로비쳐지는경우가많다. 스스로를은폐하는듯한이러한경향은결국 HFT에대한다소부정적인이미지를형성했지만 HFT가시장의비효율율적요소를제거하고풍부한유동성성을제공해준다는순기능역시인정받고있다. 본보고서에서는이러한 HFT 전략중하나를소개하고로직구조와벡테스트결과를비교해보보기로한다. 2
호가창데이터를이용한 HFT 전략 호가창데이터가표현하는시장움직임분석을통한시장예측본보고서에서소개하는 HFT전략 ( 이하 ALH전략 ) 은스탠포드경영대학원저널에발표된호가창정보를활용한고빈도매매전략이다 (<Adaptive strateg gies for High Frequency Trading ng>, Erik Anderson,..). HFT시장의특성상이전략이실제로매매에활용되고있는지는확인하기어렵지만최근호가창데이터분석을통한전략이 HFT의한영역을차지하고있는것은사실이다. 호가창으으로부터얻을수있는정보는주문시간과가격, 수량등이있다. ALH전략은호가창데이터로로부터크게두가지형태의정보를활용한다. 첫번째는매수, 매도잔량데이터이다. 매수, 매도호가의잔량합계는각각 barrier 로표현되며 barrier r의두께와매매강도는비례관계에있는것으로가정한다. 두번째는매수, 매도주문유입량의변화속도데이터이다. ALH 전략은주문유입량의변화를각각의상황에서의시장참여여자의반응을표현하는것으로파악한다. MMSE 통해최적매도, 매수호가계산 ALH 전략은실시간으로데이터를수집하여바로다음순간의최적매도, 매수호가를예측해서주문을내는간단한구조로구성되어있다. 최적매도, 매수호가는아래와같이최소평균자승오차 (MMSE, minimum mean squared error estimation) 방법을통해계산해낸다. Å(k+M) = x T (k)c a (k) B (k+m) = x T (k)c b (k) ( A = 최적매도호가 (best ask), B = 최적매수호가 (best bid), x T = 호가창데이터의 1*P 벡터, (ca,cb) = 변수값변환필터 ) 비용함수 C를아래와같이표현할때, C = Σ k m=k-l+1 L+1(y(m) ẙ(m) (m)) 2 ( y(k) = 이전기최적매도, 매수호가 L*1행렬, L = 과거시간범위 ) C를최소화하는추정치를도출하면된다. 3
각파라미터값들은아래와같이표현된다. c a (k) = (Q T (k)q(k) + λi) -1 Q T (k)y(k) y(k) = (A(k); ; ; A(k-L+1)) Q T (k) = (x T (k-m); ; ; x T (k-m-l+1)) ) ( λ = 변수값표준화계수 y(k) = 이전기최적매도, 매수호가 L*1행렬, L = 과거시간범위 ) 가령호가창에서 0.25 초간격으로데이터를수집해서이중에매수호가, 매수호가잔량, 총잔량대비매수호가잔량비율 3개의변수를과거시간 100 구간을활용한다고하면 P는 3, L은 100이될것이다. 주식매매매전산시스템은주문후실제집행이되기까지짧은시간의지체가발생한다. 대략 0.25~0 0.3초의시간이걸리는데 M을이주문잠복시간값으로지정하면된다. 그렇게본본다면위의 MMSE 가추정하는다음기의최적호가값은직관적으로과거일정기간호가창의데이터를통한최적호가추정치와실제호가의차이를최소화하게해주는 c a (k) 를도출해이를현재 (k) 의호가창데이터에적용해서 M시간후의값을계산해낸다는의미가된다. M시간후의최적호가값이지만실제주문이전달되는데걸리는시간이 M과동일하기때문에계산후즉시주문을실행해야한다. 만약추정한최적매수호가값이현재의실제매수호가보다더큰값이라면유동성이풍부하고호가간갭이없다는가정하에이주문은 100% 체결되게될것이다. 반대로추정한최적매수수호가값이현재의실제매수호가보다작은값이라면주문이들어간다하더라도매매되지않고호가창에남아있게될것이다. 중요한것은추정한값과현재의실제매수호가가동일할때발생한다. 이경우주문한매매가체결될확률을 p(edge clearing probability) 로둘때이 p값의크기는매매수익률에큰영향을미치게된다. p값은매매하는종목의유동성규모와매매규모에따라변동하게될것이다. 4
Edge clearing probability 에따라누적수익률은큰차이를보임벡테스트트는 CME( 시카고상업거래소 ) 에서거래되는미니 S&P5 P500 선물인 ES를대상으로 2008 년 2월 12일부터 3월 26일사이의데이터를통해수행했다. 해당기간데이터중 2월 12일부터 3월 19일까지의데이터로계수값을추출해서 3월 20일부터 26일까지매매를했고결과는아래 < 그림1> 과같다. MMSE 방법으로계산한최적매매호가를이용해매매한결과 (blu ue line) 가매매호가의이동평균값을적용해매매한결과 (red line) 나직전호가를적용해매매한결과 (green line) 와엇비슷한누적수익을보이고있다. < 그림1> 에서확인할수있는것은누적수익의차이를발생시키키는것은거의전적으로 edge clearing probability p 값이라는것을확인할수있다. 즉, 추정된최적매매호가의값이현재호가와일치할때이주문이얼마나많이체결되는가에따라수익률은크게좌우된다는의미이다. 그러나데이터의더고차적인가공을통해수익률을크게향상시킬수도있음을 < 그림2> 는보여주고있다. 그로직의구조는공개하지않았으나시장에서일반적으로사용하는방법인 MMSE 나이동평균등의방법이아닌더복잡하고정교한데이터처리를통해높지않은 p값에에도월등한수익률을달성하고있음을 < 그림2> 에서확인할수있다 (pink line). HFT 의관건은체결될가격을미리알아내서조금이라도더빨리주문을내는것이므로이경우 pink line 의비결은알고리즘모듈은동일하되좀더우수한 cpu를갖춘시스템일수도있고, 아니면로직자체가더고도화된시스템일수도있을것을것이다. 그림 1 Edge clearing probability 차이비교 그림 2 동일 p-value 하의전략별퍼포먼스비교 p=30% p=40% p=20% 자료 Erik Anderson 자료 : Erik Anderson 5
시장쇼크크에대응하기위해 SVM 모듈추가 ALH 전략은기본적으로시장의쇼크에취약한구조를가지고있있다. 일반적인 HFT전략들은시장변동성이확대되는시기에더많은매매기회를얻을수있는는데반해 ALH전략은추정된최적매수수호가를통해매수한후단기간에매도하는방법을택하고하고있기때문에시장이갑자기급락하면매수이후적정매도가격을놓치게되어기준이상의손실이발생하게된다. 물론갑작스건시장급등에는반대로이익이발생할수있지만예상치치못한시장변동은낮은변동성기에유용한 ALH전략의특성에배치된다. 이런이유로 ALH전략은정상데이터와쇼크데이터를구분하기위위해 SVM(Support Vector Machin ne) 모듈을이용한다. 기존이항분류방법이두종류의데이터집합의각각의중심부로부터중립의거리에 hyperplane 을설정하는것과는달리가장경계에있는데이터값을기준으로 hyperplane 을설정하는 SVM은데이터분류의효율이더높다고알려져있다. ALH 전략은 SVM을통해현재입력된데이터값이쇼크데이터로판단될경우쇼크발생 2 초후에매매를중지하게된다. SVM 을통해 ALH는리스크관리를하며퍼포먼스를향상시킬수있게된다. 6