<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB1E8B1A4BFEB>

Similar documents
<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

Ch 1 머신러닝 개요.pptx

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

PowerPoint 프레젠테이션

보고싶었던 Deep Learning과 OpenCV를이용한이미지처리과정에대해공부를해볼수있으며더나아가 Deep Learning기술을이용하여논문을작성하는데많은도움을받을수있으며아직배우는단계에있는저에게는기존의연구를따라해보는것만으로도큰발전이있다고생각했습니다. 그래서이번 DSP스마

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

REP - CP - 016, N OVEMBER 사진 요약 25 가지 색상 Surf 를 이용한 사진 요약과 사진 배치 알고리즘 Photo Summarization - Representative Photo Selection based on 25 Color Hi

PowerPoint 프레젠테이션

다중 곡면 검출 및 추적을 이용한 증강현실 책

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

Reinforcement Learning & AlphaGo

Introduction to Deep learning

Investment Proposal

2 : (Seungsoo Lee et al.: Generating a Reflectance Image from a Low-Light Image Using Convolutional Neural Network) (Regular Paper) 24 4, (JBE

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (

Delving Deeper into Convolutional Networks for Learning Video Representations - Nicolas Ballas, Li Yao, Chris Pal, Aaron Courville arXiv:

Electronics and Telecommunications Trends 인공지능을이용한 3D 콘텐츠기술동향및향후전망 Recent Trends and Prospects of 3D Content Using Artificial Intelligence Technology

KAKAO AI REPORT Vol.01

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

ICT EXPERT INTERVIEW ITS/ ICT? 차량과 인프라 간 통신(V2I) Nomadic 단말 통신(V2P) 차량 간 통신(V2V) IVN IVN [ 1] ITS/ ICT TTA Journal Vol.160 l 9

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

표상학습을이용한딥러닝이미지특성의범용분류성에대한실험적분석 지도교수장병탁 이논문을공학학사학위논문으로제출함 년 12 월 21 일 서울대학교공과대학컴퓨터공학부한동식 2016 년 2 월

김기남_ATDC2016_160620_[키노트].key

09( ) CPLV16-04.hwp

RNN & NLP Application

(JBE Vol. 24, No. 2, March 2019) (Special Paper) 24 2, (JBE Vol. 24, No. 2, March 2019) ISSN

<C0CCBCF8BFE42DB1B3C1A4BFCFB7E12DB1E8B9CCBCB12DC0DBBCBAC0DAB0CBC1F5BFCFB7E12DB8D3B8AEB8BBB3BBBACEC0DAB0CBC1F52E687770>

02본문

PERFORMANCE technology the all-new bmw 5 series. dynamic 06 business 14 comfort 20 safety 22 model LineuP 24 TecHnicaL data 26 bmw service 28 bmw kore

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C8F1BCF8>

빅데이터_DAY key

Data Industry White Paper

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

Art & Technology #5: 3D 프린팅 - Art World | 현대자동차

PowerPoint 프레젠테이션

02( ) SAV12-19.hwp

C O N T E N T S 목 차 요약 / 3 Ⅰ. 브라질소비시장동향및특성 경제현황 2. 소비시장의특성 Ⅱ. 브라질소비시장히트상품분석 최근히트상품 년소비시장, 이런상품을주목하라! Ⅲ. 우리기업의 4P 진출전략

<4D F736F F D203033B0EDC1BEB1B928C6AFC1FD292DBFCFB7E1>

SuaKITBrochure_v2.2_KO

<BFACB1B831382D31355FBAF2B5A5C0CCC5CD20B1E2B9DDC0C720BBE7C0CCB9F6C0A7C7E820C3F8C1A4B9E6B9FD20B9D720BBE7C0CCB9F6BBE7B0ED20BFB9C3F8B8F0C7FC20BFACB1B82D33C2F7BCF6C1A E687770>

07.045~051(D04_신상욱).fm

,. 3D 2D 3D. 3D. 3D.. 3D 90. Ross. Ross [1]. T. Okino MTD(modified time difference) [2], Y. Matsumoto (motion parallax) [3]. [4], [5,6,7,8] D/3

(a) Tilted image (b) Adjusted image Figure 1. Examples of tilted and adjusted images 기울임을측정한다. 이런방법은알고리즘에서미리정의한특징을포함하고있지않은일반적이고복잡한영상이입력으로주어졌을때, 기울임측정이

PowerPoint Presentation

(JBE Vol. 22, No. 2, March 2017) (Regular Paper) 22 2, (JBE Vol. 22, No. 2, March 2017) ISSN

DBPIA-NURIMEDIA

<494354BDC5B1E2BCFA2DBCDBBAB4C3B62E687770>

Microsoft Word - 김정훈

2016년 신호등 3월호 내지A.indd

때문이다. 물론가장큰이유는, 다음절에서살펴보겠지만최근들어딥러닝구조를학습하는데필요한여러가지테크닉들이개발되었기때문이다 [6,7]. 딥러닝이산업현장에서선호되는데는몇가지이유가있다. 일단은어려운문제를잘해결한다는것이다. 예를들어서, 물체인식과음성인식등전통적인패턴인식의문제에서딥러닝

<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

1-tta 142(컬러)_.indd

02본문

PowerPoint 프레젠테이션

Chap 6: Graphs

<B1E2C8B9BDC3B8AEC1EE2DC0CCC8ABBCAE2D30342E687770>

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB1E8B1A4BCAE>

Visual recognition in the real world SKT services

제1강 인공지능 개념과 역사

DBPIA-NURIMEDIA

02본문

(JBE Vol. 24, No. 4, July 2019) (Special Paper) 24 4, (JBE Vol. 24, No. 4, July 2019) ISSN

ch3.hwp

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

PowerPoint Presentation

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

2. 인공지능관련주요기술분야와응용영역 2-1. 인공지능기술분류 2-2. 인공지능기술의특성 2-3. 인공지능응용영역및어플리케이션 2-4. 국내기술수준현황 3. 인공지능분야 Key Player 들의주요비즈니스동향 3-1. 주요동향 3-2. 인공지능관련인수합병 (M&A) 현

슬라이드 1

Structural SVMs 및 Pegasos 알고리즘을 이용한 한국어 개체명 인식

Ch 8 딥강화학습

- 2 -

딥러닝 첫걸음

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

PowerPoint 프레젠테이션

MPEG-4 Visual & 응용 장의선 삼성종합기술원멀티미디어랩

서현수

R을 이용한 텍스트 감정분석


목 차 Ⅰ. 사업개요 5 1. 사업배경및목적 5 2. 사업내용 8 Ⅱ. 국내목재산업트렌드분석및미래시장예측 9 1. 국내외산업동향 9 2. 국내목재산업트렌드분석및미래시장예측 목재제품의종류 국내목재산업현황 목재산업트렌드분석및미래시

19_9_767.hwp

4 : CNN (Sangwon Suh et al.: Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset) (Regular Paper) 23 6, (J

PowerPoint 프레젠테이션

39호뉴스레터.indd

03.Agile.key

수출및수입액현황 (2016) 6억 1,284 만달러억 1 7,045 만달러 4억 4,240 만달러 2015 년대비 15.4 % 증가 2015 년대비 11.1 % 증가 2015 년대비 1.3 % 증가 수출액 수출입차액 수입액 지역별수출액 ( 비중 ) 일본 4,129만달러

2 : (Juhyeok Mun et al.: Visual Object Tracking by Using Multiple Random Walkers) (Special Paper) 21 6, (JBE Vol. 21, No. 6, November 2016) ht

내지(교사용) 4-6부

논문제출양식

Microsoft Word - ICT Reprot

_KrlGF발표자료_AI

(JBE Vol. 23, No. 5, September 2018) (Special Paper) 23 5, (JBE Vol. 23, No. 5, September 2018) ISSN

Chap 6: Graphs

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB0FBB3EBC1D8>

클라우드컴퓨팅확산에따른국내경제시사점 클라우드컴퓨팅확산에따른국내경제시사점 * 1) IT,,,, Salesforce.com SaaS (, ), PaaS ( ), IaaS (, IT ), IT, SW ICT, ICT IT ICT,, ICT, *, (TEL)

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

ecorp-프로젝트제안서작성실무(양식3)

INSIDabcdef_:MS_0001MS_0001 5kW - ㅇ * 2 ( 14) 6, % % ( 7, 15.07) -, ㅇ * (bottoming power unit),, kw MW * - /, GE ㅇ - ㅇ : - 5kW (TRL: [ 시작

2017 1

2 차원단위블록정렬을이용한 내용기반이미지매칭 장철진 O 조환규부산대학교컴퓨터공학과 {jin, Content-based image matching based on 2D alignment of unit block tessellation C

Transcription:

기획시리즈 기획시리즈 인공지능 딥러닝기반영상처리응용기술개발및서비스동향 김광용한국전자통신연구원미디어클라우드연구실 / 책임연구원 kwangyk@etri.re.kr 조기성한국전자통신연구원 1. 서론 2. 딥러닝기반영상처리응용기술개발동향 3. 딥러닝기반영상처리응용서비스동향 4. 결론및시사점 1. 서론최근글로벌시장컨설팅업체프로스트앤셜리번 (Frost & Sullivan) 에서는딥러닝기술을기계가대량의데이터로부터고도의추상화를해결하는알고리즘을이해하고사용하기위한기계학습의한형태라고정의하고있다. 또한, 딥러닝기술의주요응용분야 5 가지를자연어처리, 약물성분및독성판단, 고객중심관리, 영상인식및음성인식으로분류하였다 [1]. 여기서, 영상인식에는이미지또는비디오영상으로부터어떤대상을검출하고식별하고분석하는컴퓨터비전기술등영상처리응용전반을포괄하고있다. 특히, 딥러닝을이용한영상처리응용기술은특정이미지나비디오내의패턴분석을수없이많은학습을통해목표로하는성능을얻기위해스스로무엇인지를인지하는기술이라정의할수있다 [2]. 이와같이영상처리응용서비스개발에딥러닝기술이효과적으로사용될수있는이유는딥러닝기술이가진특징으로부터도출된다. 영상내분석대상의복잡한특징을추출하는기능을학습하기위해서는데이터로부터고수준특징 (highlevel feature) 을학습할수있는능력이필요한데딥러닝기술이이러한특징을가지고있다. 예를들면, 사람의얼굴을인식할때기존 PCA, HoG, Gabor, SIFT, SURF 등특징추출및 SVM 등의분류모델들은화소, 에지 (edge), 명도변화의방향, 좁은영역의텍스 * 본내용과관련된사항은한국전자통신연구원김광용책임연구원 ( 042-860-5241) 에게문의하시기바랍니다. ** 본내용은필자의주관적인의견이며 IITP 의공식적인입장이아님을밝힙니다. 13

주간기술동향 2016. 4. 27. 처등의저수준특징 (low-level feature) 을이용할경우높은성능을얻기어려울뿐아니라, 대상간겹침 (occlusion) 등노이즈에따른환경변화에잘적응하지못한다. 따라서, 눈, 코, 입의형태및위치와같은고수준특징을이용할경우딥러닝기술을적용하면훨씬정확하고안정적인성능을얻을수있기때문에영상처리응용서비스분야와같은고수준특징을학습하기위한서비스분야에도입하면만족할만한성능을얻어낼수있다 [3]. 본고에서는딥러닝을이용한영상처리응용기술개발및서비스동향에대해논의하고자한다. 2. 딥러닝기반영상처리응용기술개발동향 2015 년 10 월에 ETRI 창의미래연구소에서발간한보고서에따르면, 영상처리응용 기술과관련한국내외기술수준조사결과는 < 표 1> 과같다 [1]. < 표 1> 에서조사된기 술들은모두영상처리기술과접목하여응용할수있는기술들이고현재까지세계적기술 수준과국내개발기술간의격차를먼저살펴봄으로써영상처리응용기술들이어떻게사 용될수있을지고찰해볼수있는의미있는자료이다. 첫번째시각인지기술은객체인 식, 컴퓨터비전, 행동및상황이해, 영상지식처리및동영상검색기술에활용되는기술 을의미하고, 두번째공간인지기술은 2 차원및 3 차원영상에서의거리및깊이분석, 공 간상의사물을이해하거나인지하는데활용될수있다. 세번째스토리압축및창작기 술은영상으로부터스토리를이해하거나사물객체를구분하거나영상으로부터의미있는 내용을요약하고영상을자동으로편집하는기술에활용된다. 그리고기계학습기술은영 상내사물에대한통계처리, 사물간클러스터링, 영상처리를위한기계학습용비감독학 습, 강화학습에활용될수있다. < 표 1> 영상처리접목기술분야및해당기술수준동향 비교항목 기술수준 기술수준 Hype cycle( 단계 ) 기술도달 접목기술 국외 국내 격차 ( 년 ) 국외 국내 소요시간 시각인지 95.0% 70.9% 3.6 3.1 2.6 2~5 년 공간인지 93.1% 66.3% 3.6 2.9 2.3 5~10 년 스토리압축 / 창작 90.6% 63.1% 3.8 2.5 1.8 5~10 년 감성인지 92.2% 64.7% 3.8 2.4 1.9 5~10 년 기계학습 95.3% 68.8% 3.7 3.2 2.4 2~5 년 < 자료 > 인공지능기술과산업의가능성, Issue Report 2015-04, ETRI, 2015. 10., 이용해재구성 14 www.iitp.kr

기획시리즈 인공지능 NIPS, ICML, 컴퓨터비전분야의전문컨퍼런스인 CVPR 이나 ICCV, 그리고 CNN (Convolutional Neural Network) 의연구를위해서 2013 년에창출된 ICLR 컨퍼런스의논문들을검색해보면, 딥러닝기술을이용한다양한영상처리응용기술들이제안되고있음을확인할수있다 [5]. 이들논문들을딥러닝적용방식별로분류해보면, 첫번째는감독학습 (Supervised Learning) 기반의 CNN 을이용하는방식으로주로이미다른데이터셋을사용하여학습된 CNN(pre-trained CNN) 을사용하는방법이다 [5],[6]. 가장널리응용되는이방식은이미지내사물분류를위해서 ImageNet 데이터로학습시킨 CNN 을이용하여 ImageNet 이아닌다른데이터셋에서사물을검출하는형태로응용이된다 [6]. 이러한검출방식을프레임단위의시간축을가진비디오로적용하면비디오의매프레임마다이미지의특징들을추출하여그값을평균내어특징값으로사용하거나매프레임별이미지와광류 (optical flow) 의특징값을인식에사용하고그결과값을평균내는방식으로사용된다 [6]. 또다른방법은비디오를 2 차원이미지데이터가아닌이미지가시간축을따라서쌓인 3 차원데이터로해석하여시간축에대해서도컨볼루션을적용해나가는 3D convolution 을처리하는방식이다. 이방식은인접한프레임들간에유용한패턴들이각프레임에만있는것이아니라프레임시작이나중간및끝어느곳에서도등장할수있기때문에일정한시간간격 ( 예로 5 프레임간격 ) 의커널을두어시간축으로컨볼루션연산을수행하게된다. 문제는학습해야할파라메터가더많아지고학습을위한다수의데이터가더필요하다는것이다 [6],[7]. 최근에는다수의데이터가부족한경우를보완하기위해매프레임별로추출된 CNN 의특징값을시계열 (time series) 형태로 Vision Deep CNN Language Generating RNN A group of people shopping at an outdoor market. There are many vegetables at the fruit stand. < 자료 > O. Vinyals et al., Show and Tell: A Neural image caption generator, CVPR 2015, 2015. ( 그림 1) 이미지분석을통한이미지설명문장생성구조 15

주간기술동향 2016. 4. 27. Raw Frames CNN-Object pretrained CNN Outputs LSTMs Our LSTM network is connected to a CNN for RGB frames or a CNN for optical flow images. Flow images A man is cutting a CNN-Action bottle pretrained <eos> < 자료 > S. Venugopalan et al., Sequence to Sequence Video to Text, arxiv preprint arxiv:1505.00487, 2015. pp.3156~3164. ( 그림 2) 비디오분석을통한이미지설명문장생성구조변환한후에각특징값별시계열데이터에대해 temporal pooling 연산을적용하여비디오를분석하는방법이제안되었다 [6]. 두번째는입력데이터와출력데이터를동일하게하는것을목표로하는오토인코더 (autoencoder) 를다층으로쌓은 Stacked autoencoders 를사용하는방법이있다 [5]. 세번째는비디오와같이시간축을포함한영상처리를위해 RDNN(Recurrent Deep Neural Network) 이나 LSTM(Long-Short Term Memory) 을이용하는순환적딥러닝방법이다. 이방식은출력으로나오는특징패턴들의인식결과들사이의시간적연관성을다시순환신경망의일종인장단기기억모델 (LSTM) 을이용하여학습과추론을결합한방식이라볼수있다 [5],[7]. 마지막으로네번째는 CNN 과기존의특징추출방법을결합한방식이다 [8]. 예를들어, 다중스케일 CNN 을이용하여영상의각화소가어떤물체의일부인지를대략적으로판별하고, 판별한화소들을슈퍼픽셀 (superpixel) 단위로군집화한후, 슈퍼픽셀들을연결하여세그먼트그래프를구성한후에세그먼트그래프에대해기존의다층컷 (multi-level cut) 알고리즘을이용하여 CNN 의판별결과와가장잘조화되는분할조합을선택하여장면영상전체를분석하는데사용한다 [8]. 또다른방식은기존의컴퓨터비전기술을이용하여물체가존재할것으로추정되는후보영역들을추출한후각후보영역에대해 CNN 을활용하여실제물체인지를판별하고인식을수행하는 R-CNN(regions with CNN 16 www.iitp.kr

기획시리즈 인공지능 feature) 을제안하였다 [8]. 이밖에 CNN 구조에 Extreme learning machine 의학습방 법을결합하여학습속도를개선하고이를차선검출향상에사용했다 [26]. 여기서, Extreme learning machine 은중국칭화대 Huang 이제안한학습방법으로역전파방식 의오류조절방식이학습속도가느리기때문에의사역행렬 (pseudo inverse) 을사용하여 한번의연산으로최적의출력가중치를계산하는학습방법이다 [26]. < 표 2> 는최근국내외발표된논문들을토대로 3 가지딥러닝적용방식별로딥러닝 응용사례및해당참고문헌들을정리하였다. < 표 2> 딥러닝적용방식별딥러닝응용사례 구분 응용사례 참고문헌 Convolutional Neural Network(CNN) 기반딥러닝 Stacked autoencoder 기반딥러닝 Recurrent Deep Neural Network(RDNN) and/or LSTM(Long- Short Term Memory) 기반딥러닝 CNN 과기존의특징추출결합기반딥러닝 2D 의동작비디오시퀀스를구축하여걷기, 뛰기, 점프, 폴짝뛰기와같은인간행동인식 [12] Cascaded CNN 기반보행자검출 [13] 그림자영역학습방법에의한움직이는그림자검출 [19] 의료이미지로부터피부, 폐병변진단및신체인식 [20]~[23] 복수의영상패치기반의딥러닝 DeepID3 라는얼굴인식알고리즘을제안하여인식률 99.53% LFW(Labeled Face in the Wild) 달성 ( 사람의얼굴인식률은 97.53%) autoencoder 를코드북형태로 (bagging of autoencoder) 사용하여다중카메라감시비디오로부터추출한객체에대한검색 Convolutional Neural Network 와 Stacked denoising Autoencoder 기술을얼굴인식에응용히고 Stacked denoising Autoencoder 기술이처리속도면에서우수함관측 이미지가질의로주어지면주어진이미지는학습된 CNN 에의해다차원의실수인자특징벡터를추출하고이특징벡터를 RNN 의입력으로넣어서이미지를설명하는문장형태생성 이미지프레임별로 RGB 성분을 CNN 으로학습하고광류 (optical flow) 성분을 CNN 으로학습한후 CNN 의출력값을 stacked LSTM 망에입력으로다시학습함으로써비디오데이터를분류하고비디오의내용을설명하는문장을생성 RNN 과 R-CNN(Regions with Convolutional Neural Networks features) 을접목하여 Deep Hypernetwork 라는구조를제안하고만화영화 뽀로로 183 편을학습한뒤연상작용을기반으로 184 번째의 뽀로로 에피소드의스토리를생성 saliency 정보를이용하고시간영역에서다단계의광류히스토그램 (multi-scale histogram optical flow) 을특징값으로사용하여이것을 CNN 으로학습하여군중속에서이상이벤트를검출 기존 sparse coding 기술을 CNN 과접목하여이미지의 super resolution 기술로사용 얼굴검출에기존의 Haar 분류기를사용하고검출된얼굴에대해 R- CNN(Regions with Convolutional Neural Networks features) 을이용하여얼굴표정을인식 [24] [9] [10] [16] [17] [18] [11] [14] [15] 17

주간기술동향 2016. 4. 27. 3. 딥러닝기반영상처리응용서비스동향 Facebook 은 2015 년 6 월에얼굴인식기술을탑재한사진공유서비스모먼트 (Moments) 를공개하고사용자뿐만아니라다른사람이촬영한사진들도수집하여사진을스캔해서사진내특정인물의앨범을자동으로생성하는서비스를내놓고있다. 모먼트는찍은사진을페이스북에올리지않고도개인적으로친구들과공유하며사진에포함된사람들의얼굴을인식하여그룹으로분류하고개별적으로사진을송부할수있다 [3],[25]. Megvii 는 2 만명에대한사진 500 만장이수집된자체얼굴인식 DB 에대해 10 층의 CNN 과총 4 개의얼굴패치를학습한후 99.5% 의인식률을가진 Face++ 라는얼굴인식서비스를하고있다. Microsoft 는딥러닝기술을시각적정보로활용하여사물을인식하는 아담 (Adam) 프로젝트를진행중이며이종의애완견을현장에서촬영한후 코타나 를통해어떤견종인지음성으로물어보면실시간으로견종을알아내스마트폰문자로공지하는서비스를하고있다. 앞으로는카메라로촬영한식품의영양성분을분석하거나숲에서처음본식물의유해성여부를판단하는서비스, 부상및피부질환이미지를바탕으로진료를돕고, 맹인에게주변풍경을설명해주는자동안내서비스로활용될전망이다 [1],[26]. Google 은얼굴인식, 이미지인식, 가상예술기술적용및감성지능기반검색엔진서비스를개발할계획으로알려져있으며, 2015 년 5 월에발표된구글포토 (Google Photo) 서비스는모바일단말기에서촬영한사진을구글클라우드에백업한후자동으로인물, 시간, 위치 ( 장소 ), 주제, 사물별로분류할수있고, 사진을스토리로구성하거나여러장의사진을연결하여파노라마사진을만들어서다른사람들과공유가가능한지능형사진공유서비스를제공한다 [3],[27]. 또한, 딥러닝기반의이미지합성알고리즘 인셉셔니즘 (Inceptionism) 으로사람의예술적인두뇌작용을모사하여이미학습한수많은이미지정보를가지고새로운이미지로합성하여새로운작품들을양산하는가상예술 (Virtually Art) 서비스를발표하였다 [28]. 이밖에영상으로부터감성지능 (Emotional Intelligence) 기술을접목한사용자감정이해를기반으로한검색엔진을개발중이며고객요구이해에필요한전자상거래에활용할계획이다 [1]. Clarifai 는이미지와비디오의태깅 API 기술을가지고있으며, 서비스응용보다는이미지및비디오인식기술을고도로향상시키기위한연구개발중에있다 [25]. 18 www.iitp.kr

기획시리즈 인공지능 Baidu 는자율주행자동차및자전거서비스에활용하고있으며, 2015 년 12 월 11 일에 BMW 3 시리즈를개조한바이두자율주행차로베이징시내및고속도로시험주행성공을보도한바있다 [29]. 시험차내부와지붕에는자율주행기술에필요한각종센서가탑재되어있으며, 베이징시내도로와고속도로를포함해총 30km 거리에대해최고시속 100Km 까지시험주행하며우회전, 좌회전및 U 턴뿐만아니라앞에차량이감지되었을경우감속이나, 차선변경, 추월까지도성공했다고보도하였다 [29]. Baidu 는앞으로 3 년안에자율주행차기술을완성하고상용화할계획이라고한다 [29]. NVIDIA 는딥러닝기반의 Tegra X1 칩이내장된컴퓨터 Driver-PX 를개발하여자동차에장착된 12 개의 HD 카메라 (60Hz, 초당 1.3 기가픽셀처리 ) 영상을인식하여주변상황을파악하여자율주행이가능하도록지원한다. 이시스템의영상처리성능을살펴보면, 근거리에서머리와다리일부분이촬영된신체일부에대해서자동차에가려진사람을보행자로인식이가능하고야간운전에도속도위반감지카메라나속도제한표시등을인식할수있으며, 전방차량상황알림판인지및정체상황을인지가능하게함으로써다중클래스인식이가능하다. 또한, 차종별특징검출기없이승용차와스포츠형다목적차량 (SUV) 등차종구별이가능하다 [3],[28],[30],[31]. Apple 은스마트폰에서이미지분류기술을보유한퍼셉트아이오 (Perceptio) 를인수하여모바일환경에서이미지분류기반의사용자의정기적활동정보와지도앱을이용한실시간교통정보를제공할계획이다 [32]. MetaMind 는이미지와자연어분류를위한클라우드서비스를제공하여의료이미지 (a) 차량, 보행자및도로교통안전표지인식 (b) 차종구별인식 < 자료 > NVIDIA Drive-PX ( 그림 3) NVIDIA Drive-PX 의딥러닝기술기반무인자동차영상인식 19

주간기술동향 2016. 4. 27. 및음식인식용제품을개발하고있다 [25]. 알리바바는이미지에태깅 (Tagging) 된상품설명을텍스트로검색하는것이아니라, 컴퓨터가마치사람의눈과같이제품이미지를직접인지하여알리바바내에서판매중인유사한외관의제품을추출해주는 타오바오앱 을출시하였다 [33]. 넷플릭스는사용자가구매한영화의포스터를이미지로분석한후비슷한느낌을지닌포스터의영화를추천하는서비스를제공하고있으며, 이것은콘텐츠소비와연관성이높지만비정형화되어분석되지못했던정보들을딥러닝을기반으로분석하여추천정확도를향상시키는데의의가있다 [33]. Deepomatic 은사진에서신발과같은물체를인식하여전자상거래사이트에서사용되는동일또는유사상품의이미지를화상으로연결하는추천서비스를개발하고있다 [31],[34]. Camio 는자동차, 사람, 동물의위험장면등이상행동패턴을자동으로선택하고, 이를운영자에게송부하면운영자는특정유형의이벤트를검색하게함으로써범죄를사전에예측하고관리하는지능형 CCTV 기반보안서비스를제공한다 [33]. Affectiva 는웹캠만설치되어있으면외부시각적자극으로부터얼굴표정을분석하는 flagshop 이라는제품을제공한다 [31],[34]. Quantified Skin 는셀카사진을분석해피부상태를인식하고적절한제품과활동을추천한다 [34]. Hyper Verge 는클라우드상에서얼굴검출및인식, 장면인식, 복제된사진검출, 사진앨범요약, 사진클러스터링기술을개발중이며실버라는스마트사진정리앱을제공한다 [25], [34]. Cortexica 는이미지검색기능을통해사진속옷이나장신구등패션아이템과같거나비슷한제품을찾아쇼핑하게해주는리테일서비스를제공한다 [35]. Descartes Labs 과 Orbital Insight 는위성사진을분석하여각각국가별농업현황을분석하거나특정국가및세계적인트렌드를파악하는데활용하고있다 [34]. Enlitic 은방사선사진, MRI, CT 스캔, 현미경사진등사진속피사체를식별하여폐암이나골절진단을분석하고악성종양여부를빠르고정확히판정하는기술을개발하여의료진단의정확도개선, 분석대기시간단축및불필요한추가검사비용을절감하는서비스를제공한다 [31],[33]. 지금까지는해외기업동향을살펴보았고이번에는국내기업의서비스동향을살펴보고자한다. 현대자동차는 2012 년부터음성인식기술을접목하여차선이탈, 경보, 차선유지지원, 후측방경보, 차량속도유지, 자동긴급제동등의기능을가진고속도로주행지원시스템을개발중에있다 [1]. 네이버랩스는 N 드라이브서비스를통해자동으로업 20 www.iitp.kr

기획시리즈 인공지능 로드된사용자의사진들을 CNN 으로분석하여음식, 패션, 동물, 자연, 텍스트등의테마별로검색분류해주는서비스를제공한다. 또한, Q&A 서비스인지식 in 에사진질문이올라오면 CNN 으로사진내용을분석하여그에맞는지식 in 디렉토리를자동추천해주는서비스를개발중에있으며, 네이버메신저서비스인 라인 에서는스티커를사용자의구매이력에기반해구매이력이없는신규스티커의경우 CNN 으로학습된 feature 를사용하여이미구매한스티커들과시각적으로유사한스타일의스티커를추천한다 [4],[36]. 힘스인터내셔널은딥러닝기술기반의음성, 필기, 영상인식기술을가진디오텍을인수하여체성분분석및혈압진단기기등의료서비스에활용할것으로기대한다 [1]. 클디는이미지로부터관련정보를인식및분석하여사용자들이원하는정보를빠르고정확하게찾을수있는정보검색기술을개발 [1] 하고있으며, 서울아산병원은딥러닝기반분석및진단시스템개발신생업체인뷰노 (Vuno) 와제휴하여영상자료로부터폐암여부를진단하는서비스로활용예정이고, 세브란스병원은힘스인터내셔널에인수된딥러닝기반영상인식기술을보유한디오텍과제휴하여의료녹취 (Medical transcription) 솔루션을가지고외래진료시의사의진단과처방, 영상판독소견, 수술시의사의진료내용등각종의료기록을음성인식기술로저장하여문서화하는서비스를제공할예정이다 [25]. 4. 결론및시사점지금까지딥러닝을이용한영상처리응용기술개발과응용서비스동향에대해알아보았다. 대체로영상처리응용기술및서비스는 supervised learning 기반의 CNN 의구조를이용하거나, 이를여러 cascade 형태로변형한구조를사용하거나또는기존특징추출기술과결합하는형태의응용기술및서비스가대부분이고나름대로우수한성능을보이고있다. 그러나사람은복잡한장면이나일부의예제만보아도순발력있게학습하고유연하게추론하고인식하지만 supervised learning 기반의 CNN 은학습을위해많은학습데이터가필요하고느린학습속도계산을요구하므로현재보다좀더간단하고학습속도가개선된학습알고리즘이필요하다. 비디오를기반으로하는응용에는학습을위한많은수의레이블링데이터확보가중요한데실제이러한레이블링된비디오데이터를확보하기가쉽지않고 unsupervised learning 이 supervised learning 과비교하여인식성능면에서큰차이를보이지않으며사람이학습하는과정이레이블링되어있지않 21

주간기술동향 2016. 4. 27. 은데이터를가지고학습하는형태가 Unsupervised learning 이라는측면에서생각해볼때 recurrent neural network 과 long short term memory 기술을결합한 unsupervised learning 기반모델을개선한알고리즘을고려해보는것이추천된다. 또한, 고려해볼수있는영상처리응용서비스로이미지나비디오외에오디오와텍스트등멀티미디어를동시에학습할수있는멀티모달딥러닝방법을모색하여비디오에서자동으로연관된오디오와스토리문장을삽입할수있는응용까지발전할수있을것이다. < 참고문헌 > * [1] Deep Learning Interfaces Future of AI (Technical Insights), Frost & Sullivan, 2015. 7. [2] 인공지능기술과산업의가능성, Issue Report 2015-04, ETRI, 2015. 10. [3] 기계학습의발전동향, 산업화사례및활성화정책방향 -딥러닝기술을중심으로, 소프트웨어정책연구소 2016. 1. 13. [4] 김지원외 4 인, 다양한딥러닝알고리즘과활용, 정보과학회지, 33(8), 2015. 8, pp.25-31. [5] 유병인외 5 인, 인간수준에근접한딥러닝기반영상인식의동향, 정보과학회지, 33(9), 2015. 9, pp.32-41. [6] Micheal S. Ryoo, Computer Vision 연구자가 Deep Learning 의시대를사는법 회, 대한전자공학회지, 42(5), 2015. 5, pp.29-33. [7] 김지섭외 2 인, 딥러닝기반비디오분석기술, 정보과학회지, 33(9), 2015. 9, pp.21-31. [8] 김인중, 시각인식을위한딥러닝기술의최근발전동향, 정보과학회지, 33(9), 2015. 9, pp.15-20. [9] Guo H. et al., Learning deep compact descriptor with bagging auto-encoders for object retrieval, ICIP2015. 2015. 9, pp.3175-3179.. [10] Krit Chaiso et al., Comparison of Deep Learning Algorithms Based on Face Recognition, ITC- CSCC 2015, 2015. 6, pp.579-582. [11] Fang Z. et al., Abnormal event detection in crowded scenes based on deep learning, Multimedia Tools and Applications, 2016. 2, pp.1-23. [12] T. Dobhal et al., Human Activity Recognition using Binary Motion Image and Deep Learning, Procedia computer science, Vol.58, 2015, pp.178-185. [13] Anelia et al. Real-Time Pedestrian Detection With Deep Network Cascades, google.com, 2015. [14] Chao Dong et al., Image Super-Resolution Using Deep Convolutional Networks, arxiv, 2015. 7. [15] Heechul Jung et al., Development of Deep Learning-Based Facial Expression Recognition * 이논문은미래창조과학부및정보통신기술연구진흥센터의방송통신산업기술개발사업의일환으로수행하였음. [R0101-16-293, 방송용영상인식기반객체중심지식융합미디어서비스플랫폼개발 ] 22 www.iitp.kr

기획시리즈 인공지능 System, Korea-Japan Joint Workshop on Frontiers of Computer Vision(FCV), 2015. [16] O. Vinyals et al., Show and Tell: A Neural image caption generator, CVPR 2015, 2015. [17] S. Venugopalan et al., Sequence to Sequence Video to Text, arxiv preprint arxiv:1505.00487, 2015, 2015, pp.3156-3164. [18] 김경민외 3 인, 심층하이퍼네트워크개념구조기반만화영화학습과추론, 한국컴퓨터종합학술대회논문집, 2015. 6, pp.814-816. [19] Jong Taek Lee et al., Moving Shadow Detection from Background Image and Deep Learning, PSIVT, 2015. [20] Premaladha J. et al., Novel Approaches for Diagnosing Melanoma Skin Lesions Through Supervised and Deep Learning Algorithms, Journal of Medical Systems, 2016. [21] Ngo T. et al., Lung segmentation in chest radiographs using distance regularized level set and deep-structured learning and inference, ICIP2015, 2015. [22] Jia, T.,Zhang et al., Benign and malignant lung nodule classification based on deep learning feature, Journal of Medical Imaging and Health Informatics, 5(8), 2015. 12, pp.1936-1940. [23] Yan, Zhennan et al., Bodypart Recognition Using Multi-stage Deep Learning, Information processing in medical imaging, Vol.24, 2015, pp.449-461. [24] Yi.Sun et al., DeepID3 Face Recognition with Very Deep Neural Networks, arxiv: 1502.00873v1, 2015. 2. [25] http://blog.ventureradar.com/2016/01/19/18-deep-learning-startups-you-should-know/, 2016.1. [26] 인공지능시장경쟁, 딥러닝으로재점화, ICT SPOT Issue, 2014. 7. [27] 구글, 딥러닝경쟁력을중심으로인공지능기술분야주도, 과학기술 &ICT 정책ㆍ기술동향, 2015. 11. [28] 사이언스타임즈, 구글인공지능어디까지왔나?, 2016. 3. [29] 中바이두자율주행차시험주행성공.. 최고 100Km ㆍ U 턴까지소화, K-Bench, 2015. 12. [30] 엔비디아, 딥러닝 기반자동주행차량개발플랫폼공개, IITP, 주간기술동향, 2015. 1. [31] Deep learning for enterprise applications, Tractica, Research report, 2015. [32] 인공지능기술동향및발전방향, IITP, 주간기술동향, 2016. 2. [33] 진화하는인공지능또한번의산업혁명, LG Business Insight 2015, LGERI 리포트, 2015. 12. [34] http://wizardsnote.tumblr.com/post/137192641245/ 딥러닝 -관련 -스타트업 -목록 [35] 윤이진, 인공지능기술의화룡점정, 컴퓨터비전, KOTRA & globalwindow.org. 2015. 11. [36] 컨텍스트딥러닝 : 두뇌에도전하는차세대머신러닝기술, 전자정부이슈 / 동향, 2015. 9. 23