논문제출양식

Similar documents
<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

PowerPoint 프레젠테이션

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

딥러닝 첫걸음

(JBE Vol. 22, No. 2, March 2017) (Special Paper) 22 2, (JBE Vol. 22, No. 2, March 2017) ISSN

주요국 에너지 Profile 분석_아랍에미리트

정보기술응용학회 발표

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

DBPIA-NURIMEDIA

04김호걸(39~50)ok

2 : CNN (Jaeyoung Kim et al.: Experimental Comparison of CNN-based Steganalysis Methods with Structural Differences) (Regular Paper) 24 2, (JBE

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

(JBE Vol. 24, No. 4, July 2019) (Special Paper) 24 4, (JBE Vol. 24, No. 4, July 2019) ISSN

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

다중 곡면 검출 및 추적을 이용한 증강현실 책

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션

Delving Deeper into Convolutional Networks for Learning Video Representations - Nicolas Ballas, Li Yao, Chris Pal, Aaron Courville arXiv:

Ch 1 머신러닝 개요.pptx

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

290 정보과학회컴퓨팅의실제논문지제 24 권제 6 호 ( ) 1. 서론음성인식시스템은모바일디바이스의보편화로음성데이터에대한접근과확보가용이해짐에따라지난몇년간크게발전하였다. 화자식별 (Speaker Identification) 은개인성도의음성학적특징을모델링하고분류

(JBE Vol. 24, No. 2, March 2019) (Special Paper) 24 2, (JBE Vol. 24, No. 2, March 2019) ISSN

<C7A5C1F620BEE7BDC4>

2 : (EunJu Lee et al.: Speed-limit Sign Recognition Using Convolutional Neural Network Based on Random Forest). (Advanced Driver Assistant System, ADA

R을 이용한 텍스트 감정분석

빅데이터_DAY key

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jul.; 29(7),

2 : (Seungsoo Lee et al.: Generating a Reflectance Image from a Low-Light Image Using Convolutional Neural Network) (Regular Paper) 24 4, (JBE

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

4 : (Hyo-Jin Cho et al.: Audio High-Band Coding based on Autoencoder with Side Information) (Special Paper) 24 3, (JBE Vol. 24, No. 3, May 2019


위해 사용된 기법에 대해 소개하고자 한다. 시각화와 자료구조를 동시에 활용하는 프로그램이 가지는 한계와 이를 극복하기 위한 시도들을 살펴봄으로서 소셜네트워크의 분석을 위한 접근 방안을 고찰해 보고자 한다. 2장에서는 실험에 사용된 인터넷 커뮤니티인 MLBPark 게시판

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB0FBB3EBC1D8>

김기남_ATDC2016_160620_[키노트].key

°í¼®ÁÖ Ãâ·Â

BSC Discussion 1

untitled

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

무선데이터_요금제의_가격차별화에_관한_연구v4.hwp

기업은행현황-표지-5도

PowerPoint Presentation

ø©º∫∞˙ ∞Êøµ0

Reinforcement Learning & AlphaGo

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Study on the Pe

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

I

에너지경제연구 Korean Energy Economic Review Volume 11, Number 2, September 2012 : pp. 1~26 실물옵션을이용한해상풍력실증단지 사업의경제성평가 1

<B9CCB5F0BEEEB0E6C1A6BFCDB9AEC8AD5F31322D32C8A35FBABBB9AE5FC3CAC6C731BCE25F6F6B5F E687770>

Data Industry White Paper

서론 34 2

2 : (JEM) QTBT (Yong-Uk Yoon et al.: A Fast Decision Method of Quadtree plus Binary Tree (QTBT) Depth in JEM) (Special Paper) 22 5, (JBE Vol. 2

09권오설_ok.hwp

Electronics and Telecommunications Trends 인공지능을이용한 3D 콘텐츠기술동향및향후전망 Recent Trends and Prospects of 3D Content Using Artificial Intelligence Technology


6 : (Gicheol Kim et al.: Object Tracking Method using Deep Learing and Kalman Filter) (Regular Paper) 24 3, (JBE Vol. 24, No. 3, May 2019) http

06_ÀÌÀçÈÆ¿Ü0926

264 축되어 있으나, 과거의 경우 결측치가 있거나 폐기물 발생 량 집계방법이 용적기준에서 중량기준으로 변경되어 자료 를 활용하는데 제한이 있었다. 또한 1995년부터 쓰레기 종 량제가 도입되어 생활폐기물 발생량이 이를 기점으로 크 게 줄어들었다. 그러므로 1996년부

Energy Insights Vol. 1, No. 12

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

(, sta*s*cal disclosure control) - (Risk) and (U*lity) (Synthe*c Data) 4. 5.

슬라이드 1

Figure 4.2 컨볼루션 (C) 과서브샘플링 (S) 그림 4.3 은컨볼루션의아이디어를설명하고있다. 완전연결층, 지역연결층과비교하여컨볼루션층이어떻게다른지를설명한다. 완전연결층은이웃한층의뉴런간에연결선이존재하는데, 하나의층에있는모든뉴런과이웃한층에있는모든뉴런이연결된다. 즉

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

001지식백서_4도


-

±¹¹® »ï¼º Ç¥Áö ¹Û

09오충원(613~623)

슬라이드 1

232 도시행정학보 제25집 제4호 I. 서 론 1. 연구의 배경 및 목적 사회가 다원화될수록 다양성과 복합성의 요소는 증가하게 된다. 도시의 발달은 사회의 다원 화와 밀접하게 관련되어 있기 때문에 현대화된 도시는 경제, 사회, 정치 등이 복합적으로 연 계되어 있어 특

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

<31342EBCBAC7FDBFB52E687770>

<34342D342D B9DAC0E7BCB120B1E8C1D8C8AB20B1E8C7FCBCAE20B8F0B0E6C7F620B0ADC7CABCBA2E687770>

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: NCS : * A Study on

kt_³»Áö1019

논문제출양식

에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 35~55 학술 전력시장가격에대한역사적요인분해 * 35

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

À±½Â¿í Ãâ·Â

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (

노동경제논집 38권 4호 (전체).hwp

<BCBCC1BEB4EB BFE4B6F72E706466>

(JBE Vol. 24, No. 1, January 2019) (Special Paper) 24 1, (JBE Vol. 24, No. 1, January 2019) ISSN 2287-

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

MVVM 패턴의 이해

DBPIA-NURIMEDIA

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

07.045~051(D04_신상욱).fm

LG Electronics Inc. I 2002 I Based on its insight into the needs of the digital age and on its innovative technology, LG Electronics is aiming t

exp


PowerPoint 프레젠테이션

4 : CNN (Sangwon Suh et al.: Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset) (Regular Paper) 23 6, (J

인문사회과학기술융합학회

<353420B1C7B9CCB6F52DC1F5B0ADC7F6BDC7C0BB20C0CCBFEBC7D120BEC6B5BFB1B3C0B0C7C1B7CEB1D7B7A52E687770>

2 : (Rahoon Kang et al.: Image Filtering Method for an Effective Inverse Tone-mapping) (Special Paper) 24 2, (JBE Vol. 24, No. 2, March 2019) h

무제-1

Transcription:

DenseNet 을이용한 P2P 소셜대출에서상환예측 김지윤, 조성배 Department of Computer Science, Yonsei University 50, Yonsei-ro, Seodaemun-gu, Seoul, 03722, South Korea Tel: +82-2-2123-3877, Fax: +82-2-365-2579, E-mail: jiyoon_kim@yonsei.ac.kr, sbcho@yonsei.ac.kr 연세대학교컴퓨터과학과 03722, 서울특별시서대문구연세로 50 Tel: +82-2-2123-3877, Fax: +82-2-365-2579, E-mail: jiyoon_kim@yonsei.ac.kr, sbcho@yonsei.ac.kr Abstract Peer-to-Peer(P2P) 대출플랫폼에서는투자자가대출자의채무불이행시에발생하는신용위험을직접부담하기때문에대출자의채무이행여부를예측하는것은중요하다. 하지만대출자와대출상품에대한많고복잡한정보를기반으로예측해야하는어려움이있다. 이전연구에서는컨볼루션신경망을이용하여대출자의상환을예측하였다. 다른기법에비해높은성능을보였지만과적합현상이발생했으며층을많이쌓을수록학습이되지않았다. 본논문에서는이전연구의문제를해결하기위해 P2P 소셜대출에서대출자의상환예측하기위한 DenseNet 의구조를제안한다. DenseNet 은기존컨볼루션신경망에서모든레이어를직접연결한구조를가지며, 정보의흐름을보장하고과적합현상문제에효과적이다. 소셜대출데이터의특성을고려하여 DenseNet 의구조를설계하고, 하이퍼파라미터를분석하였다. 실험결과 79.5% 로이전연구보다높은성능을보였으며, 과적합현상이사라진것을확인하였다. 또한성능을평가하기위해 5- 겹교차검증법을수행하여제안하는방법의유용성을입증하였다. [ blank line] Keywords: DenseNet; Peer-to-Peer; Social Lending; Repayment 1. 서론 Peer-to-Peer(P2P) 대출은어떤금융기관의도움없이온라인플랫폼을통해대출자와투자자를연결해주는핀테크서비스를의미한다. 이때, 투자자는금융기관대신에신용을부담해야되기때문에채무를이행할수있는대출자를선택해야하며, 이러한대출자를예측하는것은중요하다 [1]. 기존은행과달리 P2P 대출플랫폼은정보비대 칭이나투명성등의문제를해결하기위해대출자에대한많은정보를제공한다 [2]. 미국의 Lending Club 에서는 2007 년부터 2016 년까지 111 가지의속성으로이루어진약 1 백만개의데이터를제공하며, 이러한많고복잡한정보를기반으로이행여부를예측하기위해서는이를수용할수있는모델이필요하다. 이전연구 [3] 에서는 Lending Club 에서제공하는데이터를기반으로심층컨볼루션신경망을이용하여소셜대출에서대출자의상환을예측하였다. 컨볼루션신경망은딥러닝기법중하나로, 가중치를가진필터를통해데이터의특징을자동으로추출하는방법이다 [4]. 컨볼루션신경망은크고복잡한데이터 ( 이미지, 비디오등 ) 에대한강력한솔루션을제공하지만, 모델이복잡하거나층을깊게쌓을수록과적합현상이나타나며정보의흐름이약해진다 [5]. 이전연구에서도학습을진행할수록약간의성능은향상되었지만, 과적합현상이발생했으며층을많이쌓을수록학습이진행되지않았다. 그림 1 은컨볼루션신경망의정확도와손실그래프를보여준다. 이러한문제를해결하기위해드롭아웃 [6] 이나정규화 [7] 와같은최적화기법과새로운구조가꾸준히제안되고있다. 본논문에서는소셜대출에서대출자의상환예측을위한 DenseNet 구조를제안한다. DenseNet[8] 은기존의컨볼루션신경망에서향상된방법으로어떤레이어에서후속레이어로피드 - 포워드형식으로직접연결된구조를가진다. 모든레이어사이의연결을통해정보의흐름을보장하고, 과적합문제를해결하였다. Lending Club 데이터는다양한사람들에대한정보를포함하고있어대표성을띄지않으며, 데이터간의상관관계가낮아데이터의특징을보존할필요가있다. 따라서본논문에서는 DenseNet 을이용하여데이터의정보를유지하고과적합을방지하는모델을제안한다.

(a) 정확도 (b) 손실그림 1. 컨볼루션신경망의정확도및손실 2. 관련연구 2.1 컨볼루션신경망컨볼루션신경망은꾸준히다양한구조들이제안되어왔다. 표 1 은대표적인컨볼루션신경망의구조들을보여준다. 표 1. 컨볼루션신경망구조도관련연구 연도 방법 저자 설명 1998 LeNet 최초의컨볼 LeCun 등 [9] 루션신경망 2012 GPU를병렬 AlexNet Krizhevsky 적으로사용 [10] 등높은성능 2015 VGGNet Simonyan 깊은네트워 [11] 등크설계 2015 GoogLeNet 인셉션모듈 Szegedy 등 [12] 제안 2016 Skip ResNet He 등 connection [13] 제안 2017 모든레이어 DenseNet Huang 등를연결한구 [8] 조를제안 LeCun 등 [9] 은최초의컨볼루션신경망을제안 했다. LeNet은컨볼루션-풀링구조의단순한구조 를가지며, 6개의얕은네트워크를형성하였다. Krizhevsky 등 [10] 과 Simonyan 등 [11] 은기존의컨볼루션신경망을기반으로네트워크를보다깊게형성하고높은성능을보이기위한구조를제안했다. Szegedy 등 [12] 과 He 등 [13] 은이러한컨볼루션신경망을활용하여새로운구조를제안했다. Szegedy 등은다양한크기를가진컨볼루션필터를사용하는인셉션모듈을제안했으며, 인셉션모듈과보조분류기 (Auxiliary classifier) 를사용하여과적합문제를해결하였다. He 등은 skip connection을도입하여깊은네트워크를형성하고, 빠르게학습할수있는구조를제안하였다. 하지만네트워크가깊어질수록특징-맵의재사용률이하락하는단점이제기되었다 [14]. Huang 등 [8] 은기존구조와달리모든레이어를연결하여정보의흐름을향상시키고과적합현상을막을수있는구조를제안하였다. 실험을통해특징-맵의재사용률이높은것을입증하였다. 이처럼깊은네트워크를형성하고정보의흐름을향상시키기위해기존의컨볼루션신경망의구조를기반으로짧은경로를추가하거나네트워크를넓게설계하는연구들이수행되었다. 이전연구에서도데이터의정보의흐름을보장하기위해네트워크의구조를변경하는과정이필요하다. 따라서본연구에서는 DenseNet의구조를기반으로최적화하여 Lending Club 데이터의특징을추출한다. 2.2 P2P 소셜랜딩 P2P 대출플랫폼이증가함에따라채무불이행의증가가능성이중요해지고있다 [21]. 표 2는소셜랜딩에서대출자의채무예측및신용평가에대한연구들을보여준다. 표 2. P2P 소셜랜딩관련연구연도저자데이터방법 Serrano-Cinca Lending 회귀분석, 2016 등 [15] Club 결정나무 Lending 2016 Michal 등 [16] 회귀분석 Club 로지스틱 2017 Chen 등 [17] Paipai 회귀분석로지스틱 2017 Lin 등 [18] Yooli 회귀분석 Lin 등 [18] 은중국의 P2P 대출플랫폼인 yooli 데이터를이용하여신용위험평가모델을제안하였다. 대출자의인구통계학적특정을파악하여채무불이행에영향을미치는요소를탐색하였다. 성별, 나이, 결혼상태등총 10개의변수를추출하였고, 로지스틱회귀분석을이용하여신용평가모델을설계하였다. Serrano-Cinca 등 [15] 은비선형관계를고려하기위해의사결정나무를이용하여투자자에게유용한규칙을탐지하였고, 26개의변수를기반으로다변량회귀분석를통해 Lending Club 데이터에대한

그림 2. 제안하는방법의구조도 내부수익률을예측하였다. 위와같이회귀분석을활용하여채무이행에대한예측모델을제안한연구가많았으며, 대부분데이터분석을통해추출된일부변수를사용하였다. 이러한전통적인기계학습방법이나피쳐엔지니어링알고리즘은빅데이터에서일반적으로관찰되는비선형적인패턴을추출하기어렵기때문에많은데이터를사용하지않는다 [19]. 하지만대출자의채무이행에대해더정확히예측하기위해서는모든정보를고려하는것이좋다. 따라서많은정보를다룰수있으며보존할수있는방법이필요하다. 3. 제안하는방법 그림 2는 DenseNet을이용한 P2P 소셜랜딩에서상환예측을위한전체구조도를보여준다. Lending Club 데이터를전처리하여 DenseNet을이용하여학습한다. 컨볼루션층과풀링층을통해특징을추출하며, softmax 분류기를통해분류된다. DenseNet은하나의레이어에서모든후속레이어로서로직접연결된구조를가지며, 식 (1) 과같이 concatenation으로특징-맵을합친다. xl Hl ([ x0, x1,, xl 1]) (1) 이때, concatenation 은크기가동일한특징 - 맵에대해적용할수있기때문에풀링레이어를사용하기때문에어렵다. 따라서 DenseNet 은 dense block 와 transition layer 로나누어 dense block 에서컨볼루션층과활성화함수를통해특징을추출하고, transition layer 에서는풀링층을사용하여특징 - 맵의크기를줄이는구조를가진다. 본논문에서도 dense block와 transition layer로이루어진구조를 가지며, 표 3은 P2P 소셜랜딩에서상환예측을위한 제안하는구조를보여준다. 표 3. DenseNet 구조 레이어 출력크기 구조 Convolution (70, 64) 3 1 conv, stride 1 Pooling (71, 64) 2 1 max pool, stride 1 Dense block (71, 512) 1 1conv 3 3 1conv Transition layer Dense block (70, 608) Classification layer (70, 224) 1 1 conv, stride 1 2 1 max pool, stride 1 1 1conv 3 3 1conv (2) Global average pool Fully-connected, softmax Dense block 는컨볼루션층과활성화함수로이루어져있으며, 1 1 컨볼루션필터를사용하여연산량을줄였다. Transition layer 에는컨볼루션층과풀링층으로구성되어있으며, 풀링층으로특징 - 맵의크기를줄였다. 마지막분류층에서는완결연결층과 softmax 를통해데이터가분류된다. DenseNet 에는성장률 (k) 과압축 (θ) 등의하이퍼파라미터가있다. 성장률 k 는 dense block 의특징 - 맵의크기를결정하며각레이어에기여하는새로운

정보의양을제어한다. 식 (2) 는성장률 k에따른 l 번째층에서특징-맵의수를나타낸다. l th layer k k ( l 1) (2) 0 여기서 k 0 는입력층의특징-맵의수를의미한다. 본논문에서는 128 의 k 값을사용하였다. Lending Club 의데이터가다양성을가지고있어특징을추출하기위해서는많은특징 - 맵의수가필요하다. 또한압축 θ 는 transition layer 에서특징 - 맵의수를줄이는정도를의미하며, 본논문에서는 0.5 값을사용하여특징 - 맵의수를반으로줄였다. 4. 실험 4.1 Lending Club 데이터본논문에서는미국의 Lending Club 에서제공하는 P2P 소셜대출거래데이터를수집했다. 2015-2016 년까지총 855,502ro 데이터를사용하였고, 데이터는예측변수인채무이행여부와대출금액, 지불금액, 대출기간등 110 개속성으로이루어져있다. 대출자의 ID 나 URL, 대출설명등예측에사용할수없는속성과결측값이 80% 이상인속성, 대출자가상환을시작한후에채워지는속성을제외하여 [20] 72 개의속성과 143,823 개데이터를사용하였다. 표 4 는속성설명의일부를보여준다. 표 4. 데이터속성요약 구분 변수명 유형 설명 Loan status Binary Current Predictor status of loan Annual inc Numeric Annual income Emp length Nominal Employment length in Borrower years Info Home Nominal Rent, own, ownership mortgage, other Total pymnt Numeric Payments received to date for Loan total amount Info funded Loan amnt Numeric The amount of the loan Term Nominal 36 or 60 Tot cur bal Numeric Total current balance Credit Tot bc Numeric Total Info limit bankcard high credit limit 컨볼루션신경망은 0에서 1사이의입력형식을가 지기때문에예측에사용되는 72개의속성에대해 전처리한다. 연속형변수는 1% 의이상치를제거하여식 (3) 과같이표준화하고, 범주형변수는이진형변수를가지도록더미변수를생성하였다. X ' X X X X min (3) max 4.2 결과및분석본논문에서는모든구조에대해 1D-DenseNet 을이용하였고, 하이퍼파라미터인 k 는 16~128 으로실험하였다. 그림 3 은컨볼루션신경망과제안하는방법에대한성능을보여준다. 그림 3. 컨볼루션신경망과 DenseNet 의성능실험결과는제안하는방법이기존의컨볼루션신경망보다전체적으로좋은성능을보였다. Lending Club 의데이터는 72 1 의입력크기를가지기때문에레이어를깊게쌓기가어렵다. 따라서기존의컨볼루션신경망보다모든레이어의연결을통해특징 - 맵의정보를보존할수있는 DenseNet 이유용하다. 그림 4. 성장률에따른성능그림 4 는하이퍼파라미터실험에대한성능을보여준다. 성장률 k 가증가할수록높은성능을보였다. 3 장에서언급했듯이, 데이터가다양한정보를가지고있기때문에많은특징 - 맵을사용하여특징을추출하는것이좋으며, 결과적으로 128 일경우높은성능을보였다. 하지만 Recall 의경우 k 가커질수록 min

작아지는경향을보였다. 이것은상환하지못한대출자의수가상환한대출자의수보다적기때문에나타난것으로보인다. 제안하는방법의유용성을보이기위해다른기계학습방법들과 5- 겹교차검증법을수행하였다. DenseNet 은다른방법에비해가장높은성능을보였으며, 다음으로 CNN, MLP, Decision tree 의순서로높은성능을보였다. 그림 5 는 5- 겹교차검증법의상자그림을보여준다. 그림 5. 5- 겹교차검증법상자그림 5. 토의및결론 본논문에서는 P2P 소셜대출에서상환예측을위한 DenseNet 의구조를제안하였다. 컨볼루션신경망을이용한이전연구에서는과적합현상이있었으며, DenseNet 의구조를활용하여문제를해결하였다. 실험을통해기존의기계학습방법과컨볼루션신경망보다높은성능을입증하였다. 하이퍼파라미터실험에는성장률 k 가증가할수록 recall 이작아지는현상이발생하였다. 이것은상환하지못한대출자의수가상환한대출자의수보다적기때문에나타난것으로보인다. 이러한문제를해결하기위해서는상환하지못한대출자의데이터가필요하지만실제로상환하지못한대출자의수가더적기때문에데이터를균형을맞추기가어렵다. 따라서관찰데이터가적은측의데이터 ( 상환하지못한대출자 ) 에더큰가중치를주거나, 이데이터에대해큰손실을부과하여보완할필요가있다. 데이터불균형에대한문제는향후연구에진행할계획이다. 또, 결과에대한추가적인분석이필요하다. 컨볼루션신경망과비교하여정분류및오분류데이터에대해분석하고, 과적합에대한분석을향후에진행할계획이다. 참고문헌 [1] C. Serrano-Cinca, B. Gutiérrez-Nieto, and L. López- Palacios, Determinants of default in P2P lending, PloS One, vol. 10, no.10, e0139427, 2015. [2] J. Yan, W. Yu, and J. L. Zhao, How signaling and search costs affect information asymmetry in P2P lending: The economics of big data, Financial Innovation, vol. 1, no.1, pp. 19, 2015. [3] C.-S. Lee, S.-M. Jo, and S.-B. Cho, Repayment prediction of borrowers in online social lending using deep convolutional neural network, Proceeding of the KIIS, pp. 663-665, 2015. [4] Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner, Gradient-based learning applied to document recognition, Proceeding of the IEEE, vol. 86, no.11, pp. 2278-2324, 1998. [5] R. Caruana, S. Lawrence and L. Giles, Overfitting in neural nets: Backpropagation, conjugate gradient, and early stopping, Advances in Neural Information Processing Systems, pp. 402-408, 2000. [6] N. Srivastava, G. Hinton, A. Krizhevsky, I. Sutskever, and R. Salakhutdinov, Dropout: A simple way to prevent neural networks from overfitting, Journal of Machine Learning Research, vol. 15, no.1, pp. 1929-1958, 2014. [7] S. Ioffe and C. Szegedy, Batch normalization: Accelerating deep network training by reducing internal covariate shift, International Conference on Machine Learning, pp. 448-456, 2015. [8] G. Huang, Z. Liu, L. Matten, and K.-Q. Weingerger, Densely connected convolutional networks, IEEE conference on Computer Vision and Pattern Recognition, pp. 4700-4708, 2017. [9] Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner, Gradient-based learning applied to document recognition, Proceeding of the IEEE, vol. 86, no.11, pp. 2278-2324, 1998. [10] A. Krizhevsky, I. Sutskever, and G. E. Hinton, Imagenet classification with deep convolutional neural networks, Advances in neural information processing systems, pp. 1097-1105, 2012. [11] K. Simonyan and A. Zisserman, Very deep convolutional networks for large-scale image recognition, International Conference on Learning Representations, 2015. [12] C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, and A. Rabinovich, Going deeper with convolutions, IEEE conference on computer vision and pattern recognition. pp. 1-9, 2015. [13] K. He, X. Zhang, S. Ren, and J. Sun, Deep residual learning for image recognition, IEEE conference on computer vision and pattern recognition, pp. 770-778, 2016. [14] G. Huang, Y. Sun, Z. Liu, D. Sedra, and K. Q. Weinberger, Deep networks with stochastic depth, In European Conference on Computer Vision, pp. 646-661, 2016. [15] C. Serrano-Cinca and B. Gutiérrez-Nieto, The use of profit scoring as an alternative to credit scoring systems in peer-to-peer (P2P) lending, Decision Support Systems, vol. 89, pp. 113-122, 2016. [16] P. Michal and R. Tobias, Determinants of borrowers' default in P2P lending under consideration of the loan

risk class, Jena Economic Research Papers, pp. 1-30, 2016. [17] Y. Chen, Research on the credit risk assessment of chinese online peer-to-peer lending borrower on logistic regression model, DEStech Transactions on Environment, Energy and Earth Science, pp. 216-221, 2017. [18] X. Lin, X. Li, and Z. Zheng, Evaluating borrower s default risk in peer-to-peer lending: Evidence from a lending platform in China, Applied Economics, vol. 49, no. 35, pp. 3538-3545, 2017. [19] M.-M. Najafabadi, F. Villanustre, T.-M. Khoshgoftaar, N. Seliya, R. Wald, and E. Muharemagic, Deep learning applications and challenges in big data analytics, Journal of Big Data, vol. 2, no.1, pp. 1-21, 2015. [20] K. L. Vinod, S. Natarajan, S. Keerthana, K. M. Chinmayi, and N. Lakshmi, Credit risk analysis in peer-to-peer lending system, IEEE International Conference on Knowledge Engineering and Applications, pp. 193, 196, 2016. [21] A. Milne and P. Parboteeah, The business models and economics of peer-to-peer lending, European Credit Research Institute, no. 17, pp. 1-31, 2016.