논문 KNOM Review '19-01 Vol.22 No.01 기계학습기반비트코인네트워크트랜잭션수예측에 관한연구 지세현, 백의준 *, 신무곤 *, 박준상 **, 김명섭 A

Similar documents
THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

09권오설_ok.hwp

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

12 김명섭 B-RN (2).hwp

°í¼®ÁÖ Ãâ·Â

I

DBPIA-NURIMEDIA

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

exp

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 27(12),

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Feb.; 29(2), IS

DBPIA-NURIMEDIA

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

04 최진규.hwp

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Sep.; 30(9),

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

14.531~539(08-037).fm

<31372DB9DABAB4C8A32E687770>

김기남_ATDC2016_160620_[키노트].key

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

05( ) CPLV12-04.hwp

< FBEC8B3BBB9AE2E6169>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jun.; 27(6),

- 1 -

DBPIA-NURIMEDIA


THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., -

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

DBPIA-NURIMEDIA

디지털포렌식학회 논문양식

<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jun.; 27(6),

???? 1

<C7A5C1F620BEE7BDC4>

인문사회과학기술융합학회

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 25(3),

45-51 ¹Ú¼ø¸¸

<35335FBCDBC7D1C1A42DB8E2B8AEBDBAC5CDC0C720C0FCB1E2C0FB20C6AFBCBA20BAD0BCAE2E687770>

#유한표지F

The characteristic analysis of winners and losers in curling: Focused on shot type, shot accuracy, blank end and average score SungGeon Park 1 & Soowo

±èÇö¿í Ãâ·Â

DBPIA-NURIMEDIA

V28.

DBPIA-NURIMEDIA

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 30(3),

09È«¼®¿µ 5~152s

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jan.; 26(1),

08김현휘_ok.hwp

무선데이터_요금제의_가격차별화에_관한_연구v4.hwp

DBPIA-NURIMEDIA

에너지경제연구 제13권 제1호

자연채무에대한재검토 1. 서론 2. 선행연구 9 Journal of Digital Convergence 214 May; 12(5): 89-99

R을 이용한 텍스트 감정분석

???? 1

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Sep.; 26(10),

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 27(7),

04_이근원_21~27.hwp

12권2호내지합침

Journal of Educational Innovation Research 2017, Vol. 27, No. 1, pp DOI: * The

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Sep.; 26(10),


Buy one get one with discount promotional strategy

<31362DB1E8C7FDBFF82DC0FABFB9BBEA20B5B6B8B3BFB5C8ADC0C720B1B8C0FC20B8B6C4C9C6C32E687770>

, ( ) 1) *.. I. (batch). (production planning). (downstream stage) (stockout).... (endangered). (utilization). *

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: A Study on the Opti

歯1.PDF

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 35~55 학술 전력시장가격에대한역사적요인분해 * 35

433대지05박창용


<B9CCB5F0BEEEB0E6C1A6BFCDB9AEC8AD5F31322D32C8A35FBABBB9AE5FC3CAC6C731BCE25F6F6B5F E687770>

untitled

<352EC7E3C5C2BFB55FB1B3C5EBB5A5C0CCC5CD5FC0DABFACB0FAC7D0B4EBC7D02E687770>

2019_2nd_guide_kr_0619.indd

1. KT 올레스퀘어 미디어파사드 콘텐츠 개발.hwp

Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ

<313920C0CCB1E2BFF82E687770>

DBPIA-NURIMEDIA

6.24-9년 6월

딥러닝 첫걸음

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석

<30312DC1A4BAB8C5EBBDC5C7E0C1A4B9D7C1A4C3A52DC1A4BFB5C3B62E687770>

03-서연옥.hwp

서론 34 2

박선영무선충전-내지

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 26(3),

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 27(7),

1 : HEVC Rough Mode Decision (Ji Hun Jang et al.: Down Sampling for Fast Rough Mode Decision for a Hardware-based HEVC Intra-frame encoder) (Special P

09오충원(613~623)

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2

µðÇÃÇ¥Áö±¤°í´Ü¸é

γ

BSC Discussion 1

Transcription:

논문 19-22-01-08 https://doi.org/10.22670/knom.2019.22.1.68 기계학습기반비트코인네트워크트랜잭션수예측에 관한연구 지세현, 백의준 *, 신무곤 *, 박준상 **, 김명섭 A Study on the Prediction of Number of Bitcoin Network Transactions Based on Machine Learning Se-Hyun Ji, Ui-Jun Baek, Mu-Gon Shin, Jun-Sang Park, Myung-Sup Kim 요 약 블록체인기술을기반으로만들어진비트코인은 Satoshi Nagamoto에의해개발된온라인암호화폐이다. 2009년 1월 3일최초로발행된비트코인은트랜잭션수의증가와함께급속도로발전중이다. 그러나비트코인트랜잭션수의증가에따른부작용이발생하고있다. 비트코인트랜잭션수를예측하는것은비트코인네트워크에발생하는부작용에대비하기위해중요하다. 본논문은두가지기계학습알고리즘을적용하여비트코인트랜잭션수를예측하는모델을설계한뒤, 실험을통해비트코인트랜잭션수를예측하는모델을제안한다. Key Words : Blockchain, Bitcoin transaction, Machine Learning ABSTRACT Bitcoin, based on the blockchain technology is an online crypto-currency developed by Satoshi Nagamoto. Bitcoin, which was first issued on January 3, 2009, is rapidly evolving with increasing number of transactions. However, untoward incidents are occurring due to an increase in the number of Bitcoin transactions. Predicting the number of Bitcoin transactions is important to prepare for any issues that can occur in the Bitcoin network. This paper proposes to design model for predicting the number of Bitcoin transactions by applying two machine learning algorithms and then a model for predicting the number of Bitcoin transactions through experiments. 이논문은 2018 년도정부 ( 교육부 ) 의재원으로한국연구재단의지원을받아수행된기초연구사업 (NRF-2018R1D1A1B07045742) 과 2018 년도정부 ( 과학기술정보통신부 ) 의재원으로정보통신기술진흥센터의지원을받아수행된연구임 (No.2018-0-00539-001, 블록체인의트랜잭션모니터링및분석기술개발 ) Korea University Department of Computer and Information Science, sxzer@korea.ac.kr Corresponding Author : Korea University Department of Computer and Information Science, tmskim@korea.ac.kr * Korea University of Department of Computer and Information Science, {pb1069, tm0309}@korea.ac.kr ** LG Electronics CTO, jusang.park@lge.com 논문번호 :KNOM2019-01-14, Received June 24, 2019; Revised July 6, 2019; Accepted August 15, 2019 68

기계학습기반비트코인네트워크트랜잭션수예측에관한연구 Ⅰ. 서론 Satoshi Nagamoto에의해개발된비트코인은정부, 금융기관의개입없이개인간의빠르고안전한거래를하기위한목적으로발행된온라인암호화폐이다 [1]. blockchain.com에서제공한그림 1에서보듯이 24시간단위로확인된비트코인트랜잭션수는갈수록증가하는추세를보인다 [2]. 비트코인트랜잭션수가증가와함께비트코인네트워크는급속도로발전중이다. 비트코인트랜잭션수를예측하는모델을설계하여실험을통해제안한다. 기계학습모델의성능을결정하는것은학습데이터와모델을구성하는 Hyper-parameter이다. 학습데이터의종류와모델을구성하는 Hyper-parameter의설정에따라모델의성능은달라지기때문에, 적합한학습데이터와 Hyper-parameter를설정하는것은중요하다 [5]. 본논문은 1장서론에서연구배경과목표를서술하고, 2장관련연구에서기계학습을적용하여비트코인데이터를예측하는연구에관하여서술한다. 3장본론에서기계학습기반비트코인트랜잭션수예측방법에관하여서술하고, 4장실험및결과에서두가지방법의기계학습을적용한모델의실험결과를보여준다. 마지막 5장에서결론및향후연구를언급한뒤논문을마친다. Ⅱ. 관련연구 그림 1. 24 시간단위확인된비트코인트랜잭션수 Fig. 1. Bitcoin Transaction Counts in 24-hour Increments 그러나비트코인네트워크가급속도로발전하고 있지만, 그에따른부작용이발생한다. 예를들자면, 비트코인트랜잭션을처리하는비용은증가했지만, 트랜잭션을확인하는시간은지연되고있다 [3]. 비 트코인네트워크에서발생한트랜잭션수는비트코 인의가치에영향을끼치는요소이다. 이러한이유 로비트코인트랜잭션수를예측하는것은비트코 인네트워크에서발생하는부작용에대비및유지 하기위해중요하다. 비트코인트랜잭션수는시간 의흐름순으로발생하는시계열 (Time-Series) 데이 터이다. 보편적으로시계열데이터를예측하는데 사용하는기법은 ARIMA(Auto-regressive Integrated Moving Average) 모형을이용한다. 그러나 ARIMA 모델은안정적시계열 (Stationary Series) 데이터에만 우수한성능을보일뿐만아니라, 비안정적시계열 (Non Stationary Series) 데이터에대해서는안정화 를거쳐예측을시도해야하는복잡함이있다. 따라 서비안정적시계열데이터인비트코인트랜잭션 수를기계학습을적용하여예측하는것은불규칙 적인패턴으로발생하는트랜잭션수를자동으로 학습하여기존의 ARIMA 모델보다우수한성능을 보일수있다 [4]. 본논문은기계학습을적용하여 기계학습을적용하여비트코인데이터를예측하 는다양한연구가진행중이다. 예측에사용된기계 학습모델은선형회귀모델, Recurrent Neural Network(RNN) 모델과 RNN 모델의구조를개선한 Long-Short-Term-Memory(LSTM) 모델이다. 1. 선형회귀모델기반예측 선형회귀는종속변수와한개이상의독립변수와 의선형상관관계를분석하는기계학습기법이다 [6]. 선형회귀모델의구조는그림 2 와같다. 선형회귀 모델은종속변수 Y 와한개이상의독립변수 x 에 대해가설을세운뒤, 학습을통해가설에가장적 합한 W 와 b 값을찾는방법이다. 그림 2. 선형회귀모델구조 Fig. 2. Structure of Linear Regression Model [7] 은비트코인트랜잭션데이터를선형회귀모델 의학습데이터를사용하여비트코인의가격을예측 한다. 학습된모델은비트코인가격의상승또는하 락에대해 55% 의예측정확도를나타낸다. [8] 은 비트코인가격을예측하는선형회귀모델을설계한 69

뒤, 선형회귀모델의예측한결과를바탕으로비트코인에투자한다. 학습된모델을이용한투자는기존의기계학습을적용하지않은기존투자방식보다향상된결과를얻는다. 또한, 선형회귀모델의학습데이터의종류에따라모델의성능이바뀌는것을확인한다. 2. RNN 모델기반예측 RNN은시계열데이터를학습하는데특화된기계학습기법이다 [9]. RNN 모델의구조는그림 3과같다. RNN Cell 내부에는쌍곡선탄젠트 (Hyperbolic Tangent) 함수를사용하며, t는시간의흐름, x는입력값, y는결과값 h는 RNN Cell의출력값, w는가중치를의미한다. 따라서시간 t의학습결과인 h t 는 t-1에서의학습을통해나온 h t-1 과입력값 x t 에대해각각의가중치 w x,, w h 와의연산을통해나온다. 그림 4. LSTM 모델구조 Fig. 4. Structure of LSTM Model [13] 은비트코인가격관련데이터를 LSTM 모델 의학습데이터로사용하여 ARIMA 모델과의성능 을비교한다. LSTM 모델의성능이 ARMIA 모델 보다우수한성능을보인다. [14] 는선형회귀모델 을설계하여비트코인의환율을예측하였다. 선형회 귀모델에사용된학습데이터를 LSTM 모델에사 용한다면더좋은성능을보일수있음을언급한다. Ⅲ. 본론 그림 3. RNN 모델구조 Fig. 3. Structure of RNN Model [10] 은비트코인의환율을예측하는 RNN 모델을 설계한다. RNN 모델의학습데이터로비트코인블 록데이터를사용한다. 시계열데이터인비트코인블 록데이터가 RNN 모델에효과적인학습데이터로사 용할수있음을보인다. [11] 은비트코인의가격을 예측하기위해 RNN 모델을설계할때트위터에대 한정서를학습데이터로사용한다. 설계된 RNN 모 델의가격예측정확도는 77.62% 를나타낸다. 기계학습기반비트코인트랜잭션수예측모델설계과정은그림 5와같다. 비트코인블록및트랜잭션데이터수집, 통계처리, 데이터분석, 학습데이터생성, 기계학습모델선정, Hyper-parameter Optimization의과정을통해기계학습모델을생성하고검증과정을통해기계학습모델의성능을평가한다. 3. LSTM 모델기반예측 LSTM은 RNN 모델의구조를개선한학습기법이다 [12]. LSTM 모델의구조는그림 4와같다. LSTM Cell은기존 RNN Cell의구조에서시그모이드 (Sigmoid) 함수와곱셈연산, 덧셈연산을추가한구조이다. c는시간 t일때 LSTM Cell의상태를말한다. 그림 5. 기계학습모델설계과정 Fig. 5. Design Process of Machine Learning Model 70

기계학습기반비트코인네트워크트랜잭션수예측에관한연구 1. 비트코인블록및트랜잭션데이터수집 비트코인코어로부터비트코인블록에담긴블록 데이터와트랜잭션데이터를수집하는과정이다. 수 집을위해 CentOS 운영체제를사용하고, 데이터베 이스소프트웨어는 MongoDB 를사용한다. 수집한 총 12 종류의블록및트랜잭션데이터종류에대한 자세한설명은표 1 과같다. 표 1. 비트코인블록 / 트랜잭션데이터종류 Table 1. Category of Bitcoin Block/Transaction Data 데이터항목 ntx Weight Size vsize nvin nvout Value Fee Tx.Size Tx.Vsize Vin.value Vout.value 의미블록에포함된트랜잭션수블록의 Weight 블록의사이즈블록의가상크기트랜잭션이포함하고있는 input 의수트랜잭션이포함하고있는 Output 의수트랜잭션의거래금액트랜잭션수수료트랜잭션의크기트랜잭션의가상크기트랜잭션의입력값트랜잭션의출력값 표 1 로부터수집한비트코인블록및통계데이터 로부터통계정보를얻기위해통계처리를한다. 트 랜잭션단위에대해서통계처리를적용하고, 통계처 리의종류는합, 곱, 최대, 최소, 평균값을구한다. 통계처리를통해수집한데이터에대한자세한설 명은표 2 와같다. 트랜잭션단위의데이터 6 가지 항목은 1 번의통계처리를하고, 2 가지항목은 2 번 의통계처리를한다. 총 84 종류의비트코인블록 및트랜잭션의통계데이터로구성한다. 표 2. 비트코인블록 / 트랜잭션통계데이터 Table 2. Statistical Data of Bitcoin Blcok/Transaction 데이터 단 블록 위 트랜잭션 데이터 항 목 통계처리 통계처리항목수 ntx 1 Weight 1 1 st 2 nd Size 1 Vsize 1 nvin 5 nvout 5 Value 5 Fee Sum Max 5 Tx.Size Min Avg 5 Tx.Vsize Stdv 5 Vin.value Sum Max 25 Min Avg Vout.value 25 Stdv 2. 비트코인통계데이터상관분석 상관분석은두변수사이의선형적관계유 / 무를 분석하는방법이다. 두변수는서로독립적인관계 이거나상관된관계일수있으며이때두변수사 이의관계강도를상관관계라한다 [15]. 본논문에 서기계학습모델에적합한학습데이터선정을위 해 2 가지상관분석을이용한다. 첫번째상관분석은 피어슨상관계수 (Pearson correlation coefficient) 를 이용하는것이고, 두번째상관분석은스피어만상 관계수 (Spearman correlation coefficient) 를이용하 는것이다. 수집한 84 종류의비트코인블록및트 랜잭션통계데이터에상관분석을적용하여학습데이 터를선정한다. 2.1 피어슨상관계수 피어슨상관계수는두변수사이의선형상관관 계를계량화한수치이다 [16]. 피어슨상관계수는 1 부터 +1 사이의값을갖고수식 1 에의해값을 구한다. p 는피어슨상관계수, B 는블록통계데이 터, T 는트랜잭션수, n 은데이터의수, S 는표준편 차, bar 는표본평균이다. 피어슨상관계수의값이 1 인경우완벽한음의선형적관계, +1 인경우 완벽한양의선형적관계를의미한다. 2.2 스피어만상관계수 (1) 스피어만상관계수는변수의값대신순위를이 용하는경우의상관계수로써, 값을작은것부터차 례로순위를매겨서열순서로바꾼뒤순위를이 용해값을구한다 [17]. 스피어만상관계수는수식 2 에의해값을구한다. p 는스피어만상관계수, n 은 데이터의수, Bi 는블록통계데이터에서 i 번째데이 터순위, Ti 는트랜잭션수에서 i 번째데이터순위, bar 는표본평균이다. 스피어만상관계수의값은 1 과 +1 사이의값을갖는다. -1 인경우두변수의 순위가완전히반대이고, +1 인경우두변수의순 위가완벽히일치함을의미한다. (2) 71

2.3 상관분석을적용한학습데이터선정 초기비트코인블록은비트코인네트워크가본격 적으로활성화되기이전의단순한데이터만포함하 고있다. 따라서 100,001 높이의블록부터, 200,000 높이의비트코인블록데이터를사용한다. 두가지 상관분석을통해선정된학습데이터는그림 6, 7 과 같다. 트랜잭션수예측을위해 n 번째블록의 84 종 류의비트코인블록및트랜잭션통계데이터와 n+1 번째비트코인트랜잭션수와의상관분석을한뒤, 상관계수값의크기에따라오름차순으로나열한다. 학습데이터에따른기계학습모델의성능비교를 위해피어슨상관분석의경우양의선형적관계가 있는데이터 3 개와선형적관계가없는데이터 3 개 를선정한다. 84 종류의비트코인블록및트랜잭션 통계데이터중트랜잭션수와음의선형적관계를 나타내는데이터는없다. 스피어만상관분석의경우 1 또는 +1 에가까운 4 개의데이터와상관관계가 없는데이터 3 개를선정한다. 두가지상관분석을 통한상관계수의값이큰상위 3 개의항목은 sum.nvout, sum.vin, sum.vsize 로일치한다. 그러나 피어슨상관분석의경우 sum.nvin 의상관계수값이 가장크고, 스피어만상관분석의경우 sum.vsize 의 상관계수값이가장크다. 그림 6. 피어슨상관분석을적용한학습데이터선정항목 Fig. 6. Selected Data from the Pearson Analysis 3. 실험데이터 두가지상관분석을적용해선정된학습데이터 선정항목에대해실험데이터로구성한다. 실험데이 터구성에대한정보는표 3 과같다. 기계학습모 델의학습을위한학습데이터와모델의성능을평 가하기위한검증및시험데이터로구성한다. 100,001 높이의블록부터 180,000 높이의블록은 학습데이터, 180,001 높이의블록부터 190,000 높이 의블록은검증데이터, 190,001 높이의블록부터 그림 7. 스피어만상관분석을적용한학습데이터선정항목 Fig. 7. Selected Data from the Spearman Analysis 200,000 높이의블록은시험데이터가된다. 학습데 이터를통해학습한모델은학습에사용되지않은 검증및시험데이터를통해성능을평가한다. 4. 기계학습모델선정 본논문에서두가지기계학습모델을선정한다. 표 3. 실험데이터구성 Table 3. Set of the Experimental Data 기계학습알고리즘중가장단순한알고리즘이적 용된선형회귀모델과시계열데이터예측에특화된 LSTM 모델이다. 두가지모델을사용하는이유는 같은학습데이터를사용하는것으로인해선형회귀 모델과 LSTM 모델의성능을비교할수있고, 상관 분석을통해선정한데이터항목에대한각모델의 성능비교를하기위함이다. 두가지모델의차이점 은표 4 와같다. 선형회귀모델의경우학습할때, 입력데이터로비트코인블록및트랜잭션의통계 데이터만을사용하여비트코인트랜잭션수예측을 한다. 그러나 LSTM 모델의경우학습할때, 비트 코인블록및트랜잭션통계데이터와트랜잭션수 모두를입력데이터로사용하여예측한다. 기계학습 모델선형회귀 모델 LSTM 모 델 블록의높이 입력 비트코인블록및트랜 잭션통계데이터비트코인블록및트랜 잭션통계데이터, 잭션수 트랜 구분 100,000~180,000 학습데이터 180,001~190,000 검증데이터 190,001~200,000 시험데이터 표 4. 기계학습모델의입력 / 출력 Table 4. Input/Output of Machine Learning Model 출력 트랜잭션수 트랜잭션수 72

기계학습기반비트코인네트워크트랜잭션수예측에관한연구 5. Hyper-parameter Optimization Hyper-parameter 는기계학습모델을구성에서임 의로설정할수있는요소이다. 모델별 Hyper-parameter 에대한정보는표 5 와같다. 선형 회귀모델의경우 Neural Network 의수, 모델의성 능을평가하는 Loss Function, Loss Function 을줄 이기위한함수인 Optimize Function 이있다. LSTM 모델의경우 1 회학습에사용할데이터의 길이인 Sequence Length, LSTM Cell 에존재하는 Hidden Unit 의수를추가로설정한다. 학습된모델 의성능을평가하기위해생성한검증및시험데이 터에대한 Loss Function 을적용한값을분석하여 Hyper-parameter Optimization 을한다. 표 5. 기계학습모델의 Hyper-parameter 항목 Table 5. Hyper-parameter of Machine Learning Model Hyper param eter 항목 선형회귀모델 Number Neural Networks Loss Function Ⅳ. 실험및결과 상관분석을적용한실험데이터를사용하여실험 을진행한다. 데이터항목별성능을비교한뒤, 가 장좋은성능을보이는데이터항목및기계학습 모델을사용하여 Hyper-parameter Optimization 을 진행한다. 예측모델의성능평가를위해각모델의 Loss Function 은 Mean Square Error(MSE) 를사용 한다. 선형회귀모델과 LSTM 모델의데이터항목 별실험결과는표 6, 7 과같다. 표 6 의경우피어 슨상관분석을통해선정된데이터를사용한결과 이고, 표 7 의경우스피어만상관분석을통해선정 된데이터를사용한결과이다. LSTM 모델 Number of Neural 피어슨상관분석을적용한경우두가지모델모 두비트코인트랜잭션수와의피어슨상관계수의 값이가장큰 sum.nvin 을사용한경우가장좋은 성능을보인다. 스피어만상관분석을적용한경우 of O p t i m i z e Function Network Loss Function Optimize Function Sequence Length Number of Hidden Units 표 6. 피어슨상관분석을적용한실험결과 Table 6. Performance of Machine Learning Model with the Pearson Correlation Analysis. 데이터항목실험선형회귀 LSTM 모단계모델 MSE 델 MSE avg.nvout 검증 0.0201 0.0219 시험 0.0227 0.0251 sum.std.vin 검증 0.0200 0.0204 시험 0.0226 0.0235 avg.fee 검증 0.0199 0.0219 시험 0.0225 0.0251 sum.nvout 검증 0.0177 0.0130 시험 0.0201 0.0154 sum.vsize 검증 0.0164 0.0130 시험 0.0188 0.0154 sum.nvin 검증 0.0163 0.0130 시험 0.0187 0.0153 표 7. 스피어만상관분석을적용한실험결과 Table 7. Performance of Machine Learning Model with the Spearman Correlation Analysis. 데이터항목실험선형회귀 LSTM 모단계모델 MSE 델 MSE min.sum.vin 검증 0.0199 0.0174 시험 0.0225 0.0202 std.min.vout 검증 0.0200 0.0133 시험 0.0226 0.0156 avg.avg.vout 검증 0.0200 0.0134 시험 0.0226 0.0157 std.nvout 검증 0.0201 0.0139 시험 0.0227 0.0163 sum.nvout 검증 0.0177 0.0130 시험 0.0201 0.0154 sum.nvin 검증 0.0163 0.0130 시험 0.0187 0.0153 sum.vsize 검증 0.0164 0.0130 시험 0.0188 0.0154 보편적으로스피어만상관계수의값이큰데이터 항목좋은성능을나타내지만, 스피어만상관계수가 가장큰 sum.vsize 보다 sum.nvin 을사용했을때, 더좋은성능을보인다. 또한, LSTM 모델을사용 한경우선형회귀모델을사용한경우보다더좋은 성능을보인다. 따라서비트코인트랜잭션수예측 을위한데이터분석방법은피어슨상관분석방법 이적합하고, 선형회귀모델보다는 LSTM 모델을 사용하는것이적합하다. 첫번째실험을통해비트코인트랜잭션수를예 측하는데가장좋은성능을나타내는데이터항목 인 sum.nvin 을학습데이터로사용하여 LSTM 모델 의 Hyper-parameter Optimization 을위한실험을한 다. LSTM 모델의 Sequence Length 를 1 로설정하 73

고, Hidden Unit 의개수를증가시키며모델을학습 하여적합한 Hidden Unit 의개수를구한뒤, Sequence Length 를증가시켜모델을학습하여적합 한 Sequence Length 를구한다. 실험결과는표 8, 9 와같다. 표 8. Hidden Unit 의수최적화실험결과 Table 8. Experimental Results for Optimizing the Number of Hidden Units Hidden Unit의수 실험단계 MSE 1 검증 0.0130 시험 0.0153 2 검증 0.0127 시험 0.0151 4 검증 0.0124 시험 0.0149 8 검증 0.0123 시험 0.0148 16 검증 0.0123 시험 0.0148 32 검증 0.0123 시험 0.0148 표 9. Sequence Length 최적화실험결과 Table 9. Experimental Results for Optimizing the Sequence Length Sequence Length 1 2 4 8 16 32 64 실험단계 MSE 검증 0.0123 시험 0.0148 검증 0.0115 시험 0.0135 검증 0.0109 시험 0.0122 검증 0.0105 시험 0.0112 검증 0.0103 시험 0.0111 검증 0.0102 시험 0.0110 검증 0.0102 시험 0.0110 Hidden Unit 의수의경우 8 개까지는 MSE 값이 줄어들지만, 8 개를초과하는개수를설정해도값이 줄지않는다. 따라서가장적합한 Hidden Unit 의 수는 8 개이다. Hidden Unit 의수를 8 개인상태에서 Sequence Length 를늘리는경우 32 까지는 MSE 값 이줄어들지만, 32 를초과해도값이줄지않는다. 따라서적합한 Sequence Length 는 32 이다. 두개의 실험에서의 MSE 값의변화를보았을때, Sequence Length가 Hidden Unit의수보다 LSTM 모델의성능에더영향을주는 parameter임을알수있다. Ⅴ. 결론및향후연구본논문은비트코인네트워크를유지및성장시키는데중요한비트코인트랜잭션수를예측하는방법으로두가지기계학습방법을적용하여실험하였고, 실험을통해적합한기계학습모델을설계하였다. 향후연구로는 Stacked-LSTM, Stateful-LSTM 모델을설계하여현재모델보다성능이더좋은비트코인트랜잭션수예측을하는모델을설계할계획이다. References [1] NAKAMOTO, Satoshi, et al. Bitcoin: A peer-to-peer electronic cash system. 2008. [2] Blockchian.com, last Modified June 17, 2019, accessed June 17, 2019, https://www.blockchain.com/ko/charts/n-transactions. [3] Gabriel Bianconi, Mahesh Agrawal, Predicting Bitcoin Transactions with Network Analysis, snap.stanford.edu, last modified Sep 10, 2018, accessed May 20, 2019, https://snap.stanford.edu/class/cs224w-2017/projects/c s224w-65-final.pdf. [4] 지세현 ; 심규석 ; 김명섭. 효율적인통신망관리를위한기계학습알고리즘을적용한트래픽발생량예측. 한국통신학회학술대회논문집, 2018, 824-825. [5] 지세현, 백의준, 신무곤, 김명섭, 합성곱신경망기반웹응용트래픽분류모델설계, The Journal of Korean Institute of Communications and Information Sciences(J-KICS), accepted April 21, 2019. [6] 선형회귀 Wikipedia, last modified April, 19, 2019, accessed June, 17, 2019, https://ko.wikipedia.org/wiki/%ec%84%a0%ed%98 %95_%ED%9A%8C%EA%B7%80. [7] GREAVES, Alex; AU, Benjamin. Using the bitcoin transaction graph to predict the price of bitcoin. No Data, 2015. [8] NAKANO, Masafumi; TAKAHASHI, Akihiko; TAKAHASHI, Soichiro. Bitcoin technical trading 74

기계학습기반비트코인네트워크트랜잭션수예측에관한연구 with an artificial neural network. Physica A: Statistical Mechanics and its Applications, 2018, 510: 587-609. [9] Recurrent neural network Wikipedia, last modified May 03, 2019, accessed May 15, 2019, https://en.wikipedia.org/wiki/recurrent_neural_netwo rk. [10] KODAMA, Osamu; PICHL, Lukáš; KAIZOJI, Taisei. Regime change and trend prediction for Bitcoin time series data. In: CBU International Conference Proceedings. 2017. p. 384-388. [11] PANT, Dibakar Raj, et al. Recurrent Neural Network Based Bitcoin Price Prediction by Twitter Sentiment Analysis. In: 2018 IEEE 3rd International Conference on Computing, Communication and Security (ICCCS). IEEE, 2018. p. 128-132. [12] Long short-term memory Wikipedia, last modified June 7, 2019, accessed June 17, 2019, https://en.wikipedia.org/wiki/long_short-term_memor y. [13] KARAKOYUN, E. S.; CIBIKDIKEN, A. O. Comparison of ARIMA Time Series Model and LSTM Deep Learning Algorithm for Bitcoin Price Forecasting. In: The 13th Multidisciplinary Academic Conference in Prague 2018 (The 13th MAC 2018). 2018. p. 171-180. [14] PICHL, Lukáš; KAIZOJI, Taisei. Volatility analysis of bitcoin. Quantitative Finance and Economics, 2017, 1: 474-485. [15] 상관분석, Wikipedia, last modified May 11, 2019, last accessed June 17, 2019, https://ko.wikipedia.org/wiki/%ec%83%81%ea%b4 %80_%EB%B6%84%EC%84%9D. [16] Pearson correlation coefficinet Wikipedia, last modified April 30, 2019, accessed May 15, 2019, https://en.wikipedia.org/wiki/pearson_correlation_coe fficient#cite_note-1. [17] Spearman s rank correlation coefficient Wikipedia, last modified April 2, accessed May 15, 2019, https://en.wikipedia.org/wiki/spearman%27s_rank_co rrelation_coefficient. 지세현 (Se-Hyun Ji) 2018년 : 고려대학교 컴퓨터정 보학과학사 2018년 ~ 현재 : 고려대학교 컴 퓨터정보학과석사과정 < 관심분야 > 네트워크관리및 보안, 트래픽 모니터링 및 분석 < 관심분야 > 전자공학, 통신공학, 광통신공학 백의준 (Ui-Jun Beak) 2018년 : 고려대학교 컴퓨터정 보학과학사 2018년 ~ 현재 : 고려대학교 컴 퓨터정보학과석사과정 < 관심분야 > 네트워크관리및 보안, 트래픽 모니터링 및 분석신무곤 (Mu-Gon Shin) 2019년 : 고려대학교 컴퓨터정 보학과학사 2019년 ~ 현재 : 고려대학교컴퓨 터정보학과석사과정 < 관심분야 > 네트워크관리및 보안, 트래픽 모니터링 및 분석박준상 (Jun-Sang Park) 2008년 : 고려대학교컴퓨터정 보학과학사 2011년 : 고려대학교컴퓨터정 보학과석사 2014년 : 고려대학교컴퓨터정 보학과박사 2015년 ~ 현재 : LG Electronics, CTO < 관심분야 > 네트워크관리및보안, 트래픽분석 75

김명섭 (Myung-Sup Kim) 1998년 : 포항공과대학교전자계산학과학사 2000년 : 포항공과대학교전자계산학과석사 2004년 : 포항공과대학교전자계산학과박사 2006년 : Dept. of ECS, Univ of Toronto Canada 2006년 ~ 현재 : 고려대학교컴퓨터정보학과교수 < 관심분야 > 네트워크관리및보안, 트래픽모니터링및분석, 멀티미디어네트워크 76