DBPIA-NURIMEDIA

Size: px
Start display at page:

Download "DBPIA-NURIMEDIA"

Transcription

1 딥러닝기반비디오분석기술 Deep Learning-based Video Analysis Techniques 저자 (Authors) 김지섭, 남장군, 장병탁 Jiseob Kim, Chang-Jun Nan, Byoung-Tak Zhang 출처 (Source) 정보과학회지 33(9), , (11 pages) COMMUNICATIONS OF THE KOREA INFORMATION SCIENCE SOCIETY 33(9), , (11 pages) 발행처 (Publisher) 한국정보과학회 KOREA INFORMATION SCIENCE SOCIETY URL APA Style 김지섭, 남장군, 장병탁 (2015). 딥러닝기반비디오분석기술. 정보과학회지, 33(9), 이용정보 (Accessed) 서울대학교 /10/13 20:09 (KST) 저작권안내 DBpia 에서제공되는모든저작물의저작권은원저작자에게있으며, 누리미디어는각저작물의내용을보증하거나책임을지지않습니다. 이자료를원저작자와의협의없이무단게재할경우, 저작권법및관련법령에따라민, 형사상의책임을질수있습니다. Copyright Information The copyright of all works provided by DBpia belongs to the original author(s). Nurimedia is not responsible for contents of each work. Nor does it guarantee the contents. You might take civil and criminal liabilities according to copyright and other relevant laws if you publish the contents without consultation with the original author(s).

2 특집원고 딥러닝기반비디오분석기술 서울대학교김지섭 남장군 장병탁 * 1. 서론 1) 최근딥러닝모델은컴퓨터비젼의여러분야에서눈부신성능향상을보이며, 연구패러다임을바꾸고있다. 기존의컴퓨터비젼연구가 SIFT[19], HOG[5] 와같이사람의지식에기반을두어유용한특징 (Feature) 을설계하는데집중했다면, 딥러닝은다층인공신경망을이용해유용한특징들을데이터로부터직접학습하는방식을취한다. 이러한학습기반의방법은사람이미처알지못하는유용한특징들을데이터를통해직접찾아낼수있기때문에성능향상에보다. 특히인터넷을통해큰규모의데이터셋을수집하는것이용이해지고 GPU 컴퓨팅이보편화되어복잡한모델의계산문제가완화됨에따라딥러닝은컨볼루션신경망모델 [18] 을필두로물체인식및검출 [13,25,31], 얼굴인식 [8,30,32] 장소인식 [37], 사람의자세인식및검출, 사람의골격인식 [33,34,4], 깊이 ( 카메라와물체사이의거리 ) 추정 [6] 등이미지를이용한다양한컴퓨터비젼문제에서기존알고리즘의성능을크게넘어서게되었다. 이렇듯딥러닝기술이기존의사람이설계한특징추출방법을대체하는경향은최근비디오데이터에대해서도나타난다. 이미지분석에서널리사용되는컨볼루션신경망모델에시계열정보를채널의형태로응용한모델 [20], 광학적흐름정보를컨볼루션신경망모델의입력으로적용시킨모델 [26], 컨볼루션차원에시간을추가하여시간적가변성을효과적으로다룰수있는 3D 컨볼루션신경망모델 [9, 10, 1, 11], 독립부분공간분석 (ISA), 느린특징분석 (SFA) 등의얕은특징추출알고리즘을컨볼루션신경망과결합시킨모델 [17,29], 다음프레임데이터의예측에유용한특징을학습하는무감독학습모델 [21,28] 등이그예이다. 이와같은딥러닝기반모델들은비디오로부 터직접유용한특징을학습할수있으며데이터가축적됨에따라성능을지속적으로높일수있는장점을지니고있다. 본논문에서는이러한딥러닝기반비디오특징학습모델들을정리하고각모델의아이디어와장단점을비교분석한다. 2장에서는비디오데이터분석의중요성에대해설명하고많은비디오딥러닝모델의기초가되는컨볼루션신경망모델에대해알아본다. 그다음에는비디오데이터에서의딥러닝방법을크게두분류로나누어 3장에서는 3차원컨볼루션신경망에기반을둔감독학습모델들에대해, 4장에서는무감독학습모델들에대해자세히설명한다. 5장에서는실제응용상황에서딥러닝모델을사용하여문제를해결하는본연구실의사례에대해설명한다. 6 장에서는다양한벤치마크데이터셋에서각딥러닝모델의성능을비교분석하며, 마지막으로 7장에서는결론을맺으며앞으로연구가더필요한부분과나아가야할방향을제시한다. 2. 딥러닝기반비디오분석모델기존의많은컴퓨터비젼연구들이이미지데이터의분석에초점이맞추어져있는반면, 인공지능연구자들이보다관심을가지고있는문제는이미지보다는비디오데이터의분석이다. 인지적관점에서볼때비디오는보다사람에게자연스러운형태의데이터라고할수있다. 사람은정지이미지한장이아닌지속적으로입력되는시각정보의흐름, 즉비디오정보를이용해다양한개념을학습한다. 예컨대, 포식자나먹이가다가오거나도망을가는지, 물체에힘을가하면어떻게움직이는지등을파악하는것은생존과직결된원초적인인식문제인데, 이러한문제를해결하는데는시간적정보가필수적이므로비디오를통해서만학습될수있다. 기술적인측면에서도비디오 * 종신회원 정보과학회지 21

3 (a) (b) 그림 1 사람이직접설계한 Gabor 필터 (a) 와컨볼루션신경망이데이터로부터학습한특징필터 (b) [10] 데이터를다루는것이유리한점이있다. 정지이미지에서각픽셀값사이의연관성을파악하는것은어려운문제인데, 비디오에서는각픽셀값들이시간의흐름에따라연관성을가지고변화하므로이를손쉽게파악할수있다. 반면, 비디오데이터를분석하는데어려움도존재하는데그중가장문제가되는것은데이터의높은복잡도이다. 비디오는연속된이미지여러장으로구성되어있으므로이미지에비해몇배의고차원데이터이다. 또한실제로같은데이터인경우에도진행속도나지연에따른시간축의가변성으로인해일관성 있게다루기가어렵다. 샘플링주기, 모션블러로인한노이즈도무시할수없는문제이다. 비디오특징추출방법으로광학적흐름 (Optical Flow; [2]), 3차원으로확장한 HOG[12], 해리스코너 (Harris Corner)[15], SURF[36] 등이기존에제시되었으나, 이들방법은사람이직접설계한것으로비디오데이터의복잡한패턴을모두분석하기에는어려움이있다. 이에, 이미지데이터에서와마찬가지로딥러닝을통해직접특징을학습하는방법들이제시되었다. 그중주류를이루는것은이미지데이터에대해최고수준의성능을보이고있는컨볼루션신경망모델을비디오데이터로확장한모델들이다. 컨볼루션신경망모델 (Convolutional Neural Network) 은다층인공신경망의일종으로이미지와같이각데이터차원간기하적연관성을가지는데이터를효과적으로인식하기위해제안되었다 [18]. 컨볼루션신경망모델은모든데이터차원을동시에모델링하는대신기하학적으로가까이있는국부영역의차원들사이의패턴만을모델링함으로써모델의복잡도를줄인것이특징이다. 이미지데이터의경우이러한특징이특히유용한것을볼수있는데, 이미지에서윤곽선은인접한픽셀들사이에서나타나는한패턴이고도형은인접한윤곽선들이모여서나타내는패턴이므로국부영역을모델링하는것으로충분하기때문이다. 또한이러한국부패턴은이미지의모든영역에서나타날수있는데, 컨볼루션신경망은패턴을영역별로독립적으로모델링하지않고커널 (Kernel) 의형태로모든영역에서공통적으로모델링하므로효율적이다. 이렇게커널을전체이미지영역을움직이면서계산하는것을컨볼루션연산이라고하는데, 컨볼루션신경망모델의가장주요한요소이며여러층의컨볼루션유닛을둠으로써픽셀의조합으로부터윤곽선을, 윤곽선의조합으로부터도형을, 도형의조합으로부터물체를단계적으로찾아낼수있다. 그림 2 ImageNet 데이터셋에대해 Krizhevsky 등이제안한컨볼루션신경망모델의구조 [13] 22 특집원고딥러닝기반비디오분석기술

4 3. 3 차원컨볼루션신경망기반감독학습모델 그림 3 컨볼루션연산과 ( 최대값 ) 통합연산 [38] 컨볼루션신경망의또다른요소는통합 (Pooling) 연산이다. 컨볼루션연산은앞서설명한바와같이이미지의어떤영역에어떤국부패턴이있는지를찾아내며이를반복하면얼굴이나물체를찾아낼수있다. 하지만연산을반복하더라도패턴이이미지내어느부분에있는지정보를계속유지하게되는데, 많은인식문제에서이는불필요한정보이다. 예컨대물체인식문제에서는주어진이미지가어떤물체인지가중요할뿐정확히어떤위치에물체가있는지정보는인식성능에영향을주지않으며오히려불필요한노이즈로작용할수있다. 통합연산은이러한위치정보를줄여, 보다노이즈에강인하게만들어준다. 보다자세히는, 통합연산은컨볼루션연산의결과가입력으로주어지면이들의위치해상도를두세배정도로줄여주는역할을한다. 이때출력되는정보는인접한네개혹은아홉개 ( 각각두배, 세배축소의경우 ) 의차원중가장큰값으로결정된다 1). 이와같이통합연산을하는경우이미지내에서물체가평행으로조금옮겨지더라도출력되는값이같으므로노이즈에강인하게된다. 컨볼루션연산과통합연산을여러차례번갈아가며수행하고나면위치정보가제거된상세한패턴정보를가진특징들이추출된다. 보다높은인식성능을위해마지막으로이들특징들간의연관성을일반적인신경망으로모델링하여최종인식결과를출력한다 ( 그림 2). 컨볼루션신경망모델은이미지데이터의국부적인성질을잘활용하여, 이미지인식에서는최근까지최고수준의성능을보이고있다 [13,25,31,8,30,32,37,33, 34,6]. 비디오데이터는이미지의시퀀스이므로자연스러운확장으로서시간축을추가한 3차원컨볼루션신경망모델을생각해볼수있다. 이러한아이디어를가장처음적용한것은 Kim 등의연구로사람행동인식에 3차원컨볼루션신경망을사용하였다 [11]. 다만, 해당연구에서는각이미지시퀀스에서기존비젼기술을이용해장면분할을수행하고, Action Volume 방법을통해사람의실루엣을미리처리한후컨볼루션신경망을사용한것이어서유용한특징을직접학습하는딥러닝의장점을온전히활용한것은아니다. 보다딥러닝의장점을잘살린모델은이후 Ji 등이제시한모델로기존에휴리스틱을이용하여전처리했던부분을 3차원컨볼루션으로대체하였다 [9]. 3차원컨볼루션연산은그림 4과같이커널이 3차원큐브형태로시간축으로도국부적인특징만을모델링한다. 예를들어전체 30 프레임으로구성된비디오가 1) 평균을취하는등의다른통합방법도존재하지만, 여기서는가장널리쓰이고있는최대값통합 (Max-Pooling) 을기준으로설명한다. 그림 4 Ji 등이제안한 3 차원컨볼루션연산 [9] 정보과학회지 23

5 있을경우, 이들 30프레임을동시에모델링하지않고 5 프레임정도크기의커널을두어시간축으로컨볼루션연산을하는것이다. 이러한방식이타당한이유는시간도공간과마찬가지로긴시간차이에비해인접한시간들사이에유용한패턴들이존재하며, 각패턴은 30프레임의시작이나중간, 끝어느곳에서도등장할수있기때문이다. 시간축방향으로의통합연산도합리적이다. 예를들어 5초가량의비디오클립이있을때사람이손을흔드는동작이비디오의시작부분에나오든, 끝부분에나오든, 혹은조금다른속도로나오든모두손을흔드는동작임에는다름이없다. 즉, 정확한시점에대한해상도는인식문제에있어서크게영향을주지못하고노이즈로작용할수있다는것이다. 따라서이미지의경우와마찬가지로통합연산을적용하여시간적인노이즈에강인한모델을얻을수있게된다. Ji 등의모델에부족한점이있다면입력으로미가공데이터와함께구배정보 (Pixel Gradient), 광학적흐름 (Optical Flow) 등의전처리된정보를여전히사용했다는것이다. 이는부족한데이터로인한학습의비효율성을개선하기위한장치로, 3차원컨볼루션신경망이자체적으로구배나광학적흐름과같은정보를학습할수있는능력을가지고는있지만직접디자인한것만큼의성능을내기위해서는많은양의데이터가요구되기때문이다. Baccouche 등은이러한비효율성에따른문제점에도불구하고미가공데이터만으로학습을진행하여보다좋은성능을도출하였다 [1]. 다만, 이모델에서제시하는성능은인식결과들사이의시간적연관성을다시순환신경망의일종인장단기기억모델 (Long Short-Term Memory; LSTM) 을이용해학습및추론한결과로일대일로비교하기엔무리가있다. Karpathy 등은보다기초적인부분에대한분석연구를진행하였는데, 3차원컨볼루션신경망의각층별커널사이즈에따라성능이어떻게달라지는지를비교하여보다좋은커널사이즈의조합을도출하였다 [10]. 커널사이즈파라미터의조합은그성질에따라단일프레임, 그림 5 3 차원컨볼루션신경망에서의융합성질에따른커널사이즈조합분류 [10] 후반융합, 전반융합, 느린융합의크게네가지로나누어볼수있다 ( 그림 5). 단일프레임의경우일반적인 2차원컨볼루션신경망과같으며시계열정보가반영되지않은세팅이다. 후반융합의경우먼저공간적연관성에주목하여상세한패턴들을찾은후마지막에시간적연관성을모델링하는세팅이며, 전반융합은반대로초기에시간적연관성을모델링하고이후에공간적패턴을찾는세팅이다. 마지막으로느린융합은후반융합과전반융합의중간적인세팅으로적절한비율로시공간적패턴을동시에모델링한다. 해당논문에서는실험을통해위의네가지세팅중느린융합이가장성능이좋다는결론을도출하였다. 4. 무감독학습모델무감독학습모델은레이블로부터직접적인감독을받는대신낮은차원, 희소성, 직교성, 느린변화속도등제한된조건하에서원래의데이터를나타낼수있는표현 (Representation) 을학습한다. 학습된표현은데이터를함축적으로나타내게되므로유용한특징으로사용된다. 학습된특징의유용성을평가하기위해서는간단한선형분류모델을추가하여레이블링된데이터에대해학습하고테스트성능을비교하는방법이일반적으로사용된다. 4.1 얕은특징알고리즘기반모델독립성분분석 (ICA), 독립부분공간분석 (ISA), 느린특징분석 (SFA) 등의모델은무감독학습기반의특징추출알고리즘으로널리사용되어왔다. 이들은딥러닝과대비되는얕은 (Shallow) 모델로비디오데이터에적용할경우차원이높고데이터의구조가복잡하기때문에성능이떨어지는문제가있다. 하지만이러한얕은특징모델을컨볼루션유닛과번갈아가며사용하여깊은구조를구성하고, 이를통해높은성능을내는모델들이연구되고있다. Le 등은독립부분공간분석모델과컨볼루션신경망모델을결합하여 Stacked Convolutional ISA라는알고리즘을제안하였다 [17]. 고차원의비디오데이터공간에서부분공간을찾는문제는학습을통해유용한특징을찾는것과유사하다. 특히제안된모델에서이러한부분공간의수가원래의비디오데이터차원보다작고서로독립적이어야한다는조건이있기때문에, 학습된부분공간은중복없이소수의유용한특징을찾게된다. 또한 3차원컨볼루션신경망과유사하게각특징을데이터시공간에컨볼루션연산을취하므로보다효율적으로학습이가능하다. 24 특집원고딥러닝기반비디오분석기술

6 4.2 순환신경망기반모델 (a) 독립부분공간분석 (ISA) 모델 앞서살펴보았던대부분의모델이시계열적연관성을컨볼루션의형태로모델링했었던반면, 이장에서는보다시계열적연관성에주목한순환신경망 (Recurrent Neural Network) 기반모델에대해설명한다. 이들모델들역시무감독으로특징을학습하며, 레이블을예측하는대신다음시간스텝의입력을잘예측하도록학습을진행한다. Ranzato 등에의해제안된순환적컨볼루션신경망모델 (Recurrent Convolutional Neural Network; rcnn) [22] 은공간적차원들, 즉이미지에대해서는컨볼루션신경망을이용하고, 시간축에대해서는순환적신경망을사용한모델이다. 이는이미지에대해컨볼루션신경망의장점을잘살리면서도, 시간축으로는순환신경망을사용하여보다오랜시간전의데이터와의연관성도효과적으로모델링할수있다는장점이있다. 다만이모델에서는모델의복잡성을줄이기위하여실수에가까운픽셀값을이용하는대신 k-means 클러스터링방법으로이산화시킨낮은차원의입력을사용한다. (b) Stacked Convolutional ISA 모델그림 6 독립부분공간분석모델과, 이를이용하여구성된 Stacked Convolutional ISA 모델 [17] 그림 7 DL-SFA 모델 [29] Sun 등은 Le 의모델과유사하지만, 독립부분공간분석대신느린특징분석 (SFA) 을사용하여컨볼루션을수행하는모델인 DL-SFA(Deeply Learned SFA) 를제안하였다 [29]. 느린특징분석은시계열데이터를모델링하는방법중하나로, 어떠한데이터에서보다상위의추상적인특징은하위의상세특징에비해느리게변한다는가정을토대로한다. 예를들어사람이걷고있는비디오클립이있을때각픽셀값은굉장히빠른속도로변하지만, 팔을흔드는것이나걷는행위자체와같은추상적인특징은느린속도로변화한다. DL-SFA 모델은이러한느린특징분석과컨볼루션연산을데이터시공간에대해수행하여유용한특징들을학습한다. 그림 8 순환적컨볼루션신경망모델 (rcnn)[22] 그림 9 장단기기억 (LSTM) 기반무감독학습모델 [28] 정보과학회지 25

7 Srivastava 등이제안한방법은장단기기억 (Long Short-Term Memory; LSTM) 순환신경망을이용하는것이다 [28]. 기존의순환신경망은오랜시간전의데이터와의연관관계를학습할수있도록고안되었으나, 실제로는신경망층을여러번통과함에따라기울기사라짐 (Gradient Vanishing), 또는기울기폭발 (Gradient Explosion) 현상이발생하여학습에어려움이있다. 장단기기억은, 강제적으로기울기값을유지하도록하는 CEC (Constant Error Carousel) 유닛을두어이러한문제를해결한모델이며, 비교적긴시간의연관성도학습할수있는장점이있다 [7]. Srivastava는그림 9과같이장단기기억을이용하여무감독학습을하는모델을제안하였으며, 바로다음스텝의입력뿐만아니라, 이후여러스텝의입력, 입력된데이터시퀀스자체 2) 까지예측하도록함으로써더욱유용한특징을학습할수있도록하였다. (a) 조명합성방법 5. 자세 - 위치 - 행동통합인식딥러닝시스템 이장에서는컨볼루션신경망을이용하여 2D 영상 ( 깊이정보가없는 RGB 영상 ) 으로부터사람의자세, 위치및행동을분류하는본연구진의연구를소개한다 [39]. 이연구는앞서소개한연구들과비교하여두가지큰특징이있다. 첫번째특징은 ImageNet, KTH와같은정제된데이터를사용하지않고직접수집한데이터를사용하였으며, 레이블링에드는시간과노력을완화시키기위하여데이터셋을자동으로확장하는방법을사용했다는것이다. 두번째특징은자세, 위치그리고행동인식문제가서로연관이있음에주목하여시너지를낼수있도록하나의통합모델을개발했다는것이다. (b) 배경합성방법그림 10 합성을통한데이터셋확장방법 5.2 자세-위치인식기자세를인식하는문제와위치를인식하는문제는서로밀접한연관이있다. 영상내사람의위치를인식한다면해당위치를집중적으로분석하여자세를보다정확히인식할수있고, 반대로자세인식결과가헷갈리게나온다면위치인식이잘못되었을가능성이있으므로다시위치인식을수행하는등의작업을통해상호인식성능을높일수있다. 5.1 데이터셋확장컨볼루션신경망모델은복잡한만큼학습을위해많은데이터를필요로하며, 감독학습모델이기때문에모든데이터에대해레이블정보를필요로한다. 본연구에서는대규모데이터레이블링에드는노력을완화시키기위해거실환경에서직접수집하고레이블링한적은양의데이터에조금씩변형을가해새로운데이터를합성하는방법을사용하였다. 이방법은같은수의데이터를직접모으는것에비해다양성이나정확성이떨어지지만, 손쉽게많은데이터를얻을수있다는장점이있다. 새로운데이터는기존의이미지에다양한조명및배경을합성하여생성되었으며, 이방법을통해학습데이터의규모를 60배로확장하였다 ( 그림 10). 2) 이는 Auto-Encoder 모델의학습방식과유사하다. 그림 11 자세 - 위치통합인식모델 26 특집원고딥러닝기반비디오분석기술

8 본연구에서는이러한연관성을반영하여다음과같은통합인식모델을제안하였다 ( 그림 11). 먼저이미지가입력되면자세및위치인식기는약한예측 (Weak Prediction) 을수행하여각각의레이블을예측한다. 위치인식기로예측된위치정보는이미지내에사람이어디에위치하고있는지를알려주는정보이므로, 모델에해당부분을강조하도록하향식 (Top-Down) 피드백을주게된다. 피드백을반영한모델이다시자세를예측하게되는데, 이러한계산방식은이미지내의주변배경을무시하고특정영역에집중함으로써자세인식성능을높이는데도움을준다. 5.3 자세- 동작인식기자세와동작사이에도밀접한연관성이존재하기때문에, 두가지정보를유기적으로결합하여사용하게되면인식정확도를높일수있다. 예를들어뛰기, 걷기등의동작클래스의경우손을흔드는등의동작과는달리앉거나누운상태에서수행하는것이불가능하다. 따라서자세인식을통해알아낸서기, 앉기, 눕기등의정보를동작인식기와결합하면보다정확한인식결과를도출할수있다. 제안하는모델에서는앙상블방법을사용하여 argmax Action P Pose P Action 과같은방식으로동작인식결과를개선한다. 5.4 실험및결과데이터합성을통한데이터셋확장과자세 -위치통합인식기의도입을통한성능향상을각각확인하기위해세가지실험세팅에서학습과테스트를진행하였다. 첫번째세팅에서는데이터셋확장과통합인식기를모두사용하지않고실험을진행하였고, 두번째세팅에서는확장된데이터셋을사용하여실험을진행하였다. 세번째세팅에서는데이터셋확장은사용하지않고, 인식모델을통합인식기로하여실험을진행하였다. 각세팅에서학습후테스트정확도를뽑은결과는표 1과같다. 표 1 데이터셋확장및통합인식모델의도입에따른성능 ( 테스트정확도 ) 향상기본세팅데이터셋확장통합인식모델정확도 (%) 85.87± ± ±1.13 첫번째세팅으로진행한실험에서테스트정확도는 85.87% 를기록하였다. 두번째세팅에서테스트정확도는 94.55% 로, 데이터셋확장방법을통해약 9% 정도의성능향상을달성할수있었다. 세번째세팅에서테스트정확도는 95.50% 로, 데이터셋확장을사용하지않았음에도자세- 위치인식결과의유기적인공유를통해약 10% 정도의높은성능향상을달성할수있음을볼수있었다. 6. 딥러닝모델의성능비교 6.1 비디오데이터셋이미지에서의인식을비롯한다양한컴퓨터비젼문제가활발히연구되고지속적으로개선되었던배경에는방대한벤치마크데이터셋이있다. 특히딥러닝과같은학습기반의알고리즘들은데이터의품질과규모에따라성능이직접적으로좌우되는만큼데이터셋의중요도가높다. MNIST, CIFAR-10 등간단한실험과테스트에용이한데이터셋과수백만장규모의자연의이미지로구성되어실제응용문제를대변하는 ImageNet 데이터셋이좋은예이다. 반면비디오의경우, 아직규모와다양성면에서부족한편이다. 데이터의복잡도에비례하게데이터수가많이필요한데반해 ImageNet 데이터셋정도의대규모데이터셋은아직구축된바가없고, 데이터의종류도사람의동작인식을제외하면전무한수준이다. 다만간단한테스트를위한벤치마크데이터셋들은꾸준히발전되어왔는데, 여기서는비교적많은논문에서실험되고비교되는데이터셋들을소개한다. 표 2 사람행동비디오데이터셋비교데이터셋공개년도동작종류수동작당클립수 KTH Weizmann Hollywood UCF-Sports HMDB UCF KTH[24] 와 Weizmann[3] 은가장일찍구축된비디오데이터셋으로, 배경이간단하고데이터의수가많지는않으나같은클래스에비교적다양한영상이포함돼있다는것이특징이다. 이후등장한 Hollywood 데이터셋 [16] 은할리우드의다양한영화에서수집된많은수의비디오클립으로구성돼있으며, 특히해당클립이어떤장면인지도같이레이블링되어있어장면인식문제등에다양하게활용할수있다. UCF-Sports[23] 는스포츠채널에서추출한다양한영상으로구성된데이터셋으로, 역동적인동작들이많이포함돼있으며배경이비교적단순하다는특징을가지고있다. 이후에등장한데이터셋은동작의종류수가많고각동작당클립수도많아서보다실제문제에가까운것들로, 최근등장한딥러닝알고리즘들의성능비교로많이사용되고있다. HMDB51[14] 는 YouTube, 영화등공개 정보과학회지 27

9 데이터베이스로부터 수집된 것으로 배경과 인물이 다양 하다. UCF-101[27]의 경우 동작의 종류가 101 가지로 가장 많으며, 5 가지의 큰 범주로 나뉘어 있어 가장 다양한 종류의 비디오 데이터를 포함한다. 또한, 각 동작 종류별 데이터 수도 많아 딥러닝 모델 학습에 특히 적합하다. 앞서 설명한 데이터셋들은 표 2에 연도별, 규모별 로 정리되어있다. 다음 장에서 이들 데이터셋에 대해, 위의 3, 4장에서 소개된 모델의 성능을 비교한다. 6.2 성능 비교 위의 3, 4 장에서 설명된 모델들 중 인식 성능이 제공되 는 모델들을 뽑아 표 3에 정리하였다. 표는 크게 네 그룹 (a) KTH 데이터셋 [24] (b) UCF-101 데이터셋 [27] 그림 12 비디오 데이터셋의 예시 28 특집원고 딥러닝 기반 비디오 분석 기술

10 표 3 딥러닝모델별성능비교 ( 수치는분류정확도 (%), Hollywood 의경우 Mean AP) KTH Hollywood UCF-Sports UCF-101 Harris3D+HOG/HOF [35] Cuboids+HOG3D [35] Handwired Feature + 3D ConvNet [9] D ConvNet + LSTM [1] 94.4 Slow-Fusion 3D ConvNet [10] 41.3 Stacked Convolutional ISA [17] DL-SFA [29] Unsupervised LSTM [28] 75.8 의모델의성능으로구성되어있다. 처음두행은사람이직접설계한기존의특징추출방법들의성능결과이고, 다음세행은 3 장에서설명된 3차원컨볼루션신경망모델들의성능결과이다. 그다음의두행은얕은특징기반무감독학습모델, 마지막행은순환신경망기반무감독학습모델의성능결과를각각나타낸다. 먼저 KTH 데이터셋의성능결과를비교해보면기존의특징추출방법대비딥러닝기반특징추출방법이약간의우위를나타내는것을볼수있다. 한편 Hollywood 및 UCF-Sports 데이터에서는딥러닝모델의성능우위가보다두드러지는데, 이는이들데이터셋이 KTH 데이터셋에비해보다다양한데이터를포함하고있는것때문으로분석해볼수있다. KTH 데이터셋은일정한배경에서촬영된반면, Hollywood 및 UCF-Sports 데이터셋은배경과동작의종류가비교적다양하다. 이경우사람이설계한특징들만으로는모델링할수없는데이터가포함되어있을가능성이크므로학습기반의특징추출방법이우위를나타내는것이설명된다. UCF-101 데이터셋에서의성능을비교해보면 3차원컨볼루션신경망모델에서학습된특징에비해장단기기억모델에서학습된특징이훨씬효과적인것을볼수있다. 이는장단기기억모델이보다긴시간차이의시계열연관성을학습할수있기때문인것으로해석이가능하다. 이는한편으로는놀라운결과인데, 일반적으로감독학습이무감독학습에비해높은성능을나타낸다고알려진것에반하는결과이기때문이다. 비교하는두모델의성격이많이다르기때문에일반화하기에는무리가있지만, 이결과는무감독학습의가능성을시사한다. 무감독학습모델이감독학습모델에비해크게성능이떨어지지않는다면, 레이블링되어있지않은수많은데이터에대해학습을진행함으로써오히려보다높은성능을추구할수있기때문이다. 7. 논의및결론본논문에서는다양한딥러닝기반비디오특징학습모델에대하여정리하였다. 모델은크게 3차원컨볼루션신경망기반감독학습모델과무감독학습기반모델로나뉘며, 무감독모델은다시얕은특징추출알고리즘기반컨볼루션신경망모델과, 순환적신경망모델로나뉜다. 벤치마크데이터를통한성능비교에서딥러닝모델을통해학습한특징이기존의사람이디자인한특징에비해우위를보이는것을볼수있었다. 이러한경향은 UCF-101과같이최근구축된대규모데이터에서더욱부각될것으로예상된다. 또한, 무감독학습모델이감독학습모델에비해서크게뒤떨어지지않는성능을보이는것을통해, 무감독학습모델들의가능성을예측해볼수있다. 특히동영상데이터의경우대규모의레이블링작업이어려운만큼무감독학습모델을사용하는것이상대적으로큰장점을가지고있으며, 사람이일상생활에서시각자극을학습하는형태가무감독비디오학습이므로앞으로의활발한연구가예상된다. 참고문헌 [ 1 ] Moez Baccouche, Franck Mamalet, Christian Wolf, Christophe Garcia, and Atilla Baskurt. Sequential deep learning for human action recognition. In Human Behavior Understanding, pages Springer, [ 2 ] John L Barron, David J Fleet, and Steven S Beauchemin. Performance of optical flow techniques. International journal of computer vision, 12(1):43-77, [ 3 ] Moshe Blank, Lena Gorelick, Eli Shechtman, Michal Irani, and Ronen Basri. Actions as space-time shapes. In The Tenth IEEE International Conference on Computer Vision (ICCV 05), pages , [ 4 ] Xianjie Chen and Alan L Yuille. Articulated pose 정보과학회지 29

11 estimation by a graphical model with image dependent pairwise relations. In Advances in Neural Information Processing Systems, pages , [ 5 ] Navneet Dalal and Bill Triggs. Histograms of oriented gradients for human detection. In Computer Vision and Pattern Recognition, CVPR Computer Society Conference on, volume 1, pages IEEE, [ 6 ] David Eigen, Christian Puhrsch, and Rob Fergus. Depth map prediction from a single image using a multi-scale deep network. In Advances in Neural Information Processing Systems, pages , [ 7 ] Sepp Hochreiter and Jürgen Schmidhuber. Long short-term memory. Neu- ral computation, 9(8): , [ 8 ] Junlin Hu, Jiwen Lu, and Yap-Peng Tan. Discriminative deep metric learn- ing for face verification in the wild. In Computer Vision and Pattern Recog- nition (CVPR), 2014 IEEE Conference on, pages IEEE, [ 9 ] Shuiwang Ji, Wei Xu, Ming Yang, and Kai Yu. 3d convolutional neural networks for human action recognition. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 35(1): , [10] Andrej Karpathy, George Toderici, Sachin Shetty, Tommy Leung, Rahul Sukthankar, and Li Fei-Fei. Large-scale video classification with convo- lutional neural networks. In Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on, pages IEEE, [11] Ho-Joon Kim, Joseph S Lee, and Hyun-Seung Yang. Human action recogni-tion using a modified convolutional neural network. In Advances in Neural Networks ISNN 2007, pages Springer, [12] Alexander Klaser, Marcin Marszałek, and Cordelia Schmid. A spatio- temporal descriptor based on 3d-gradients. In BMVC th British Machine Vision Conference, pages British Machine Vision Associa- tion, [13] Alex Krizhevsky, Ilya Sutskever, and Geoffrey E Hinton. Imagenet clas- sification with deep convolutional neural networks. In Advances in neural information processing systems, pages , [14] H. Kuehne, H. Jhuang, E. Garrote, T. Poggio, and T. Serre. HMDB: a large video database for human motion recognition. In Proceedings of the International Conference on Computer Vision (ICCV), [15] Ivan Laptev and Tony Lindeberg. On space-time interest points. Interna- tional Journal of Computer Vision, 64(2-3): , [16] Ivan Laptev, Marcin Marszałek, Cordelia Schmid, and Benjamin Rozenfeld. Learning realistic human actions from movies. In Computer Vision and Pattern Recognition, CVPR IEEE Conference on, pages 1-8. IEEE, [17] Quoc V Le, Will Y Zou, Serena Y Yeung, and Andrew Y Ng. Learning hierarchical invariant spatio-temporal features for action recognition with independent subspace analysis. In Computer Vision and Pattern Recogni- tion (CVPR), 2011 IEEE Conference on, pages IEEE, [18] Yann LeCun, Léon Bottou, Yoshua Bengio, and Patrick Haffner. Gradient- based learning applied to document recognition. Proceedings of the IEEE, 86(11): , [19] David G Lowe. Distinctive image features from scaleinvariant keypoints. International journal of computer vision, 60(2):91-110, [20] Tomas Pfister, Karen Simonyan, James Charles, and Andrew Zisserman. Deep convolutional neural networks for efficient pose estimation in gesture videos. In Computer Vision-ACCV 2014, pages Springer, [21] Marc Aurelio Ranzato, Arthur Szlam, Joan Bruna, Michaël Mathieu, Ro- nan Collobert, and Sumit Chopra. Video (language) modeling: a baseline for generative models of natural videos. CoRR, abs/ , [22] MarcAurelio Ranzato, Arthur Szlam, Joan Bruna, Michael Mathieu, Ronan Collobert, and Sumit Chopra. Video (language) modeling: a baseline for generative models of natural videos. arxiv preprint arxiv: , [23] Mikel D Rodriguez, Javed Ahmed, and Mubarak Shah. Action mach a spatio-temporal maximum average correlation height filter for action recog- nition. In Computer Vision and Pattern Recognition, CVPR IEEE Conference on, pages 1-8. IEEE, [24] Christian Schüldt, Ivan Laptev, and Barbara Caputo. Recognizing human actions: a local svm approach. In Pattern Recognition, ICPR of the 17th International Conference on, volume 3, pages IEEE, [25] Pierre Sermanet, David Eigen, Xiang Zhang, Michaël Mathieu, Rob Fer-gus, and Yann LeCun. Overfeat: Integrated recognition, localization and detection using 30 특집원고딥러닝기반비디오분석기술

12 convolutional networks. arxiv preprint arxiv: , [26] Karen Simonyan and Andrew Zisserman. Two-stream convolutional net- works for action recognition in videos. In Advances in Neural Information Processing Systems, pages , [27] Khurram Soomro, Amir Roshan Zamir, and Mubarak Shah. Ucf101: A dataset of 101 human actions classes from videos in the wild. arxiv preprint arxiv: , [28] Nitish Srivastava, Elman Mansimov, and Ruslan Salakhutdinov. Unsu-pervised learning of video representations using lstms. arxiv preprint arxiv: , [29] Lin Sun, Kui Jia, Tsung-Han Chan, Yuqiang Fang, Gang Wang, and Shuicheng Yan. Dl-sfa: Deeply-learned slow feature analysis for action recognition. In Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on, pages IEEE, [30] Yi Sun, Yuheng Chen, Xiaogang Wang, and Xiaoou Tang. Deep learn-ing face representation by joint identificationverification. In Advances in Neural Information Processing Systems, pages , [31] Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, and Andrew Ra- binovich. Going deeper with convolutions. arxiv preprint arxiv: , [32] Yaniv Taigman, Ming Yang, Marc Aurelio Ranzato, and Lars Wolf. Deep-face: Closing the gap to human-level performance in face verification. In Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on, pages IEEE, [33] Jonathan J Tompson, Arjun Jain, Yann LeCun, and Christoph Bregler. Joint training of a convolutional network and a graphical model for human pose estimation. In Advances in Neural Information Processing Systems, pages , [34] Alexander Toshev and Christian Szegedy. Deeppose: Human pose estima- tion via deep neural networks. In Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on, pages IEEE, [35] Heng Wang, Muhammad Muneeb Ullah, Alexander Klaser, Ivan Laptev, and Cordelia Schmid. Evaluation of local spatio-temporal features for ac- tion recognition. In BMVC 2009-British Machine Vision Conference, pages BMVA Press, [36] Geert Willems, Tinne Tuytelaars, and Luc Van Gool. An efficient dense and scale-invariant spatio-temporal interest point detector. In Computer Vision-ECCV 2008, pages Springer, [37] Bolei Zhou, Agata Lapedriza, Jianxiong Xiao, Antonio Torralba, and Aude Oliva. Learning deep features for scene recognition using places database. In Advances in Neural Information Processing Systems, pages , [38] WW Zhu, A Berndsen, EC Madsen, M Tan, IH Stairs, A Brazier, P Lazarus, R Lynch, P Scholz, K Stovall, et al. Searching for pulsars using image pattern recognition. The Astrophysical Journal, 781(2):117, [39] 김지섭, 김은솔, 윤상웅, 정문식, 최현수, 장병탁. Deep convolutional neural network을이용한 2d 영상에서의사람자세, 행동및위치통합인식시스템. In 2015 한국컴퓨터종합학술대회 (KCC2015) 논문집, pages 한국정보과학회, 김지섭 2011 서울대학교기계항공공학부졸업 ( 학사 ) 2011~ 현재서울대학교컴퓨터공학부석박사통합과정관심분야 : 딥러닝, 비디오데이터학습, 다양체학습 jkim@bi.snu.ac.kr 남장군 2014 Harbin Engineering University 전자정보공학부졸업 ( 학사 ) 2014~ 현재서울대학교컴퓨터공학부석박사통합과정관심분야 : 기계학습, 컴퓨터비전, 인지과학 cjnan@bi.snu.ac.kr 장병탁 1986 서울대컴퓨터공학과학사 1988 서울대컴퓨터공학과석사 1992 독일 Bonn 대학교컴퓨터과학박사 1992~1995 독일국립정보기술연구소 (GMD, 현 Fraunhofer Institutes) 연구원 1997~ 현재서울대컴퓨터공학부교수및인지과학, 뇌과학, 생물정보학협동과정겸임교수 2003~2004 MIT 인공지능연구소 (CSAIL) 및뇌인지과학과 (BCS) 객원교수 2007~2008 삼성종합기술연구원 (SAIT) 객원교수현재서울대인지과학연구소소장 Applied Intelligence, BioSystems, Journal of Cognitive Science 등국제저널편집위원관심분야 : 바이오지능, 인지기계학습, 분자진화컴퓨팅기반뇌인지정보처리모델링 btzhang@bi.snu.ac.kr 정보과학회지 31

<4D6963726F736F667420576F7264202D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

<4D6963726F736F667420576F7264202D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5> 주간기술동향 2016. 5.18. 컴퓨터 비전과 인공지능 장혁 한국전자통신연구원 선임연구원 최근 많은 관심을 받고 있는 인공지능(Artificial Intelligence: AI)의 성과는 뇌의 작동 방식과 유사한 딥 러닝의 등장에 기인한 바가 크다. 이미 미국과 유럽 등 AI 선도국에서는 인공지능 연구에서 인간 뇌 이해의 중요성을 인식하고 관련 대형 프로젝트들을

More information

(JBE Vol. 22, No. 2, March 2017) (Regular Paper) 22 2, (JBE Vol. 22, No. 2, March 2017) ISSN

(JBE Vol. 22, No. 2, March 2017) (Regular Paper) 22 2, (JBE Vol. 22, No. 2, March 2017)   ISSN (JBE Vol. 22, No. 2, March 2017) (Regular Paper) 22 2, 2017 3 (JBE Vol. 22, No. 2, March 2017) https://doi.org/10.5909/jbe.2017.22.2.234 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a), a) Real-time

More information

Delving Deeper into Convolutional Networks for Learning Video Representations - Nicolas Ballas, Li Yao, Chris Pal, Aaron Courville arXiv:

Delving Deeper into Convolutional Networks for Learning Video Representations  -   Nicolas Ballas, Li Yao, Chris Pal, Aaron Courville  arXiv: Delving Deeper into Convolutional Networks for Learning Video Representations Nicolas Ballas, Li Yao, Chris Pal, Aaron Courville arxiv: 1511.06432 Il Gu Yi DeepLAB in Modu Labs. June 13, 2016 Il Gu Yi

More information

(JBE Vol. 24, No. 2, March 2019) (Special Paper) 24 2, (JBE Vol. 24, No. 2, March 2019) ISSN

(JBE Vol. 24, No. 2, March 2019) (Special Paper) 24 2, (JBE Vol. 24, No. 2, March 2019)   ISSN (Special Paper) 24 2, 2019 3 (JBE Vol. 24, No. 2, March 2019) https://doi.org/10.5909/jbe.2019.24.2.234 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) SIFT a), a), a), a) SIFT Image Feature Extraction

More information

다중 곡면 검출 및 추적을 이용한 증강현실 책

다중 곡면 검출 및 추적을 이용한 증강현실 책 1 딥러닝기반성별및연령대 추정을통한맞춤형광고솔루션 20101588 조준희 20131461 신혜인 2 개요 연구배경 맞춤형광고의필요성 성별및연령별주요관심사에적합한광고의필요성증가 제한된환경에서개인정보획득의한계 맞춤형광고의어려움 영상정보기반개인정보추정 연구목표 딥러닝기반사용자맞춤형광고솔루션구현 얼굴영상을이용한성별및연령대추정 성별및연령대를통합네트워크로학습하여추정정확도향상

More information

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제 Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, 2018 1 1.1 Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제 6.5에서 찾아볼 수 있다. http://incompleteideas.net/book/bookdraft2017nov5.pdf

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA TV 드라마비디오스토리분석딥러닝기술 Deep Learning Technologies for Analysis of TV Drama Video Stories 저자 (Authors) 남장군, 김진화, 김병희, 장병탁 출처 (Source) 방송과미디어 22(1), 2017.1, 12-23 (12 pages) Broadcasting and Media Magazine

More information

Reinforcement Learning & AlphaGo

Reinforcement Learning & AlphaGo Gait recognition using a Discriminative Feature Learning Approach for Human identification 딥러닝기술및응용딥러닝을활용한개인연구주제발표 이장우 wkddn1108@kist.re.kr 2018.12.07 Overview 연구배경 관련연구 제안하는방법 Reference 2 I. 연구배경 Reinforcement

More information

02(848-853) SAV12-19.hwp

02(848-853) SAV12-19.hwp 848 정보과학회논문지 : 소프트웨어 및 응용 제 39 권 제 11 호(2012.11) 3차원 객체인식을 위한 보완적 특징점 기반 기술자 (Complementary Feature-point-based Descriptors for 3D Object Recognition) 장영균 김 주 환 문 승 건 (Youngkyoon Jang) (Ju-Whan Kim) (Seung

More information

09( ) CPLV16-04.hwp

09( ) CPLV16-04.hwp ISSN 2383-6318(Print) / ISSN 2383-6326(Online) KIISE Transactions on Computing Practices, Vol. 22, No. 11, pp. 619-624, 2016. 11 http://dx.doi.org/10.5626/ktcp.2016.22.11.619 장소정보를학습한딥하이퍼넷기반 TV 드라마소셜네트워크분석

More information

REP - CP - 016, N OVEMBER 사진 요약 25 가지 색상 Surf 를 이용한 사진 요약과 사진 배치 알고리즘 Photo Summarization - Representative Photo Selection based on 25 Color Hi

REP - CP - 016, N OVEMBER 사진 요약 25 가지 색상 Surf 를 이용한 사진 요약과 사진 배치 알고리즘 Photo Summarization - Representative Photo Selection based on 25 Color Hi 1 사진 요약 25 가지 색상 Surf 를 이용한 사진 요약과 사진 배치 알고리즘 Photo Summarization - Representative Photo Selection based on 25 Color Histogram and ROI Extraction using SURF 류동성 Ryu Dong-Sung 부산대학교 그래픽스 연구실 dsryu99@pusan.ac.kr

More information

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx

Microsoft PowerPoint - 실습소개와 AI_ML_DL_배포용.pptx 실습강의개요와인공지능, 기계학습, 신경망 < 인공지능입문 > 강의 허민오 Biointelligence Laboratory School of Computer Science and Engineering Seoul National University 실습강의개요 노트북을꼭지참해야하는강좌 신경망소개 (2 주, 허민오 ) Python ( 프로그래밍언어 ) (2주, 김준호

More information

R을 이용한 텍스트 감정분석

R을 이용한 텍스트 감정분석 R Data Analyst / ( ) / kim@mindscale.kr (kim@mindscale.kr) / ( ) ( ) Analytic Director R ( ) / / 3/45 4/45 R? 1. : / 2. : ggplot2 / Web 3. : slidify 4. : 5. Matlab / Python -> R Interactive Plots. 5/45

More information

6 : (Gicheol Kim et al.: Object Tracking Method using Deep Learing and Kalman Filter) (Regular Paper) 24 3, (JBE Vol. 24, No. 3, May 2019) http

6 : (Gicheol Kim et al.: Object Tracking Method using Deep Learing and Kalman Filter) (Regular Paper) 24 3, (JBE Vol. 24, No. 3, May 2019) http (Regular Paper) 24 3, 2019 5 (JBE Vol. 24, No. 3, May 2019) https://doi.org/10.5909/jbe.2019.24.3.495 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a), a), b), b), b), a) Object Tracking Method using

More information

(JBE Vol. 24, No. 4, July 2019) (Special Paper) 24 4, (JBE Vol. 24, No. 4, July 2019) ISSN

(JBE Vol. 24, No. 4, July 2019) (Special Paper) 24 4, (JBE Vol. 24, No. 4, July 2019)   ISSN (JBE Vol. 24, No. 4, July 2019) (Special Paper) 24 4, 2019 7 (JBE Vol. 24, No. 4, July 2019) https://doi.org/10.5909/jbe.2019.24.4.564 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a) Integral Regression

More information

2 : (EunJu Lee et al.: Speed-limit Sign Recognition Using Convolutional Neural Network Based on Random Forest). (Advanced Driver Assistant System, ADA

2 : (EunJu Lee et al.: Speed-limit Sign Recognition Using Convolutional Neural Network Based on Random Forest). (Advanced Driver Assistant System, ADA (JBE Vol. 20, No. 6, November 2015) (Regular Paper) 20 6, 2015 11 (JBE Vol. 20, No. 6, November 2015) http://dx.doi.org/10.5909/jbe.2015.20.6.938 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a),

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Visual Search At SK-Planet sk-planet Machine Intelligence Lab. 나상일 1. 개발배경 2. 첫접근방법 3. 개선된방법 A. Visual recognition technology B. Guided search C. Retrieval system 개발배경 개발배경 상품검색을좀더쉽게 Key-word 트렌치코트버튺벨트

More information

10황인성_ok.hwp

10황인성_ok.hwp (JBE Vol. 19, No. 3, May 2014) (Regular Paper) 19 3, 2014 5 (JBE Vol. 19, No. 3, May 2014) http//dx.doi.org/10.5909/jbe.2014.19.3.396 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a), a), a) Invariant

More information

Ch 1 머신러닝 개요.pptx

Ch 1 머신러닝 개요.pptx Chapter 1. < > :,, 2017. Slides Prepared by,, Biointelligence Laboratory School of Computer Science and Engineering Seoul National University 1.1 3 1.2... 7 1.3 10 1.4 16 1.5 35 2 1 1.1 n,, n n Artificial

More information

논문제출양식

논문제출양식 DenseNet 을이용한 P2P 소셜대출에서상환예측 김지윤, 조성배 Department of Computer Science, Yonsei University 50, Yonsei-ro, Seodaemun-gu, Seoul, 03722, South Korea Tel: +82-2-2123-3877, Fax: +82-2-365-2579, E-mail: jiyoon_kim@yonsei.ac.kr,

More information

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a low-resolution Time-Of- Flight (TOF) depth camera and

More information

09권오설_ok.hwp

09권오설_ok.hwp (JBE Vol. 19, No. 5, September 2014) (Regular Paper) 19 5, 2014 9 (JBE Vol. 19, No. 5, September 2014) http://dx.doi.org/10.5909/jbe.2014.19.5.656 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a) Reduction

More information

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB0FBB3EBC1D8>

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB0FBB3EBC1D8> 딥러닝기술동향 - CNN 과 RNN 을중심으로 - 곽노준박성헌 * 김대식 * 서울대학교교수서울대학교박사과정 * 본고에서는딥러닝의여러가지분야중최근영상인식분야에서기존방법들보다월등한성능을보이고있는컨볼루션신경망 (Convolutional Neural Networks: CNN) 과음성인식이나자연어처리등에적용되어뛰어난성능을보이는순환신경망 (Recurrent Neural

More information

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018)   ISSN (Special Paper) 23 2, 2018 3 (JBE Vol. 23, No. 2, March 2018) https://doi.org/10.5909/jbe.2018.23.2.186 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a) Robust Online Object Tracking via Convolutional

More information

2

2 독립부분공간분석 (Independent Subspace Analysis) 알고리즘기반의시 공간적특징학습을통한동작인식 by 이기석 Submitted to the Department of Computer Science and Engineering in partial fulfillment of the requirements for the degree of Bachelor

More information

제1강 인공지능 개념과 역사

제1강 인공지능 개념과 역사 인공지능개념과역사 < 인공지능입문 > 강의노트 장병탁서울대학교컴퓨터공학부 & 인지과학 / 뇌과학협동과정 http://bi.snu.ac.kr/~btzhang/ Version: 20180302 목차 인공지능의개념........ 3 연구분야............ 4 역사...... 6 패러다임........ 7 응용사례.......... 8 Reading Assignments.........

More information

PowerPoint Presentation

PowerPoint Presentation 기계학습을통한 시계열데이터분석및 금융시장예측응용 울산과학기술원 전기전자컴퓨터공학부최재식 얼굴인식 Facebook 의얼굴인식기 (DeepFace) 가사람과비슷한인식성능을보임 문제 : 사진에서연애인의이름을맞추기 사람의인식율 : 97.5% vs DeepFace 의인식률 : 97.35% (2014 년 3 월 ) 물체인식 ImageNet (http://image-net.org):

More information

표상학습을이용한딥러닝이미지특성의범용분류성에대한실험적분석 지도교수장병탁 이논문을공학학사학위논문으로제출함 년 12 월 21 일 서울대학교공과대학컴퓨터공학부한동식 2016 년 2 월

표상학습을이용한딥러닝이미지특성의범용분류성에대한실험적분석 지도교수장병탁 이논문을공학학사학위논문으로제출함 년 12 월 21 일 서울대학교공과대학컴퓨터공학부한동식 2016 년 2 월 표상학습을이용한딥러닝이미지특성의범용분류성에대한실험적분석 Experimental Analyses on Generalized Discriminability of Deep Convolutional Image Features using Representational Learning 서울대학교공과대학컴퓨터공학부한동식 표상학습을이용한딥러닝이미지특성의범용분류성에대한실험적분석

More information

<4D6963726F736F667420576F7264202D20C3D6BDC52049435420C0CCBDB4202D20BAB9BBE7BABB>

<4D6963726F736F667420576F7264202D20C3D6BDC52049435420C0CCBDB4202D20BAB9BBE7BABB> 주간기술동향 2016. 2. 24. 최신 ICT 이슈 인공지능 바둑 프로그램 경쟁, 구글이 페이스북에 리드 * 바둑은 경우의 수가 많아 컴퓨터가 인간을 넘어서기 어려움을 보여주는 사례로 꼽혀 왔 으며, 바로 그런 이유로 인공지능 개발에 매진하는 구글과 페이스북은 바둑 프로그램 개 발 경쟁을 벌여 왔으며, 프로 9 단에 도전장을 낸 구글이 일단 한발 앞서 가는

More information

보고싶었던 Deep Learning과 OpenCV를이용한이미지처리과정에대해공부를해볼수있으며더나아가 Deep Learning기술을이용하여논문을작성하는데많은도움을받을수있으며아직배우는단계에있는저에게는기존의연구를따라해보는것만으로도큰발전이있다고생각했습니다. 그래서이번 DSP스마

보고싶었던 Deep Learning과 OpenCV를이용한이미지처리과정에대해공부를해볼수있으며더나아가 Deep Learning기술을이용하여논문을작성하는데많은도움을받을수있으며아직배우는단계에있는저에게는기존의연구를따라해보는것만으로도큰발전이있다고생각했습니다. 그래서이번 DSP스마 특성화사업참가결과보고서 작성일 2017 12.22 학과전자공학과 참가활동명 EATED 30 프로그램지도교수최욱 연구주제명 Machine Learning 을이용한얼굴학습 학번 201301165 성명조원 I. OBJECTIVES 사람들은새로운사람들을보고인식을하는데걸리는시간은 1초채되지않다고합니다. 뿐만아니라사람들의얼굴을인식하는인식률은무려 97.5% 정도의매우높은정확도를가지고있습니다.

More information

(JBE Vol. 23, No. 4, July 2018) (Special Paper) 23 4, (JBE Vol. 23, No. 4, July 2018) ISSN

(JBE Vol. 23, No. 4, July 2018) (Special Paper) 23 4, (JBE Vol. 23, No. 4, July 2018)   ISSN (JBE Vol. 23, No. 4, July 2018) (Special Paper) 23 4, 2018 7 (JBE Vol. 23, No. 4, July 2018) https://doi.org/10.5909/jbe.2018.23.4.484 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a) Uniform Motion

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 딥러닝소개 < 인공지능입문 > 강의 허민오 Biointelligence Laboratory School of Computer Science and Engineering Seoul National University (C) 2007-2018, SNU Biointelligence Lab, http://bi.snu.ac.kr/ 1 Playground (playground.tensorflow.org)

More information

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770> 한국지능시스템학회 논문지 2010, Vol. 20, No. 3, pp. 375-379 유전자 알고리즘을 이용한 강인한 Support vector machine 설계 Design of Robust Support Vector Machine Using Genetic Algorithm 이희성 홍성준 이병윤 김은태 * Heesung Lee, Sungjun Hong,

More information

(JBE Vol. 24, No. 1, January 2019) (Special Paper) 24 1, (JBE Vol. 24, No. 1, January 2019) ISSN 2287-

(JBE Vol. 24, No. 1, January 2019) (Special Paper) 24 1, (JBE Vol. 24, No. 1, January 2019)   ISSN 2287- (Special Paper) 24 1 2019 1 (JBE Vol. 24 No. 1 January 2019) https//doi.org/10.5909/jbe.2019.24.1.58 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a) a) a) b) c) d) A Study on Named Entity Recognition

More information

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018) ISSN

(JBE Vol. 23, No. 2, March 2018) (Special Paper) 23 2, (JBE Vol. 23, No. 2, March 2018)   ISSN (Special Paper) 23 2, 2018 3 (JBE Vol. 23, No. 2, March 2018) https://doi.org/10.5909/jbe.2018.23.2.246 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) CNN a), a), a) CNN-Based Hand Gesture Recognition

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

°í¼®ÁÖ Ãâ·Â

°í¼®ÁÖ Ãâ·Â Performance Optimization of SCTP in Wireless Internet Environments The existing works on Stream Control Transmission Protocol (SCTP) was focused on the fixed network environment. However, the number of

More information

19_9_767.hwp

19_9_767.hwp (Regular Paper) 19 6, 2014 11 (JBE Vol. 19, No. 6, November 2014) http://dx.doi.org/10.5909/jbe.2014.19.6.866 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) RGB-Depth - a), a), b), a) Real-Virtual Fusion

More information

2 : CNN (Jaeyoung Kim et al.: Experimental Comparison of CNN-based Steganalysis Methods with Structural Differences) (Regular Paper) 24 2, (JBE

2 : CNN (Jaeyoung Kim et al.: Experimental Comparison of CNN-based Steganalysis Methods with Structural Differences) (Regular Paper) 24 2, (JBE 2: CNN (Jaeyoung Kim et al.: Experimental Comparison of CNN-based Steganalysis Methods with Structural Differences) (Regular Paper) 24 2, 2019 3 (JBE Vol. 24, No. 2, March 2019) https://doi.org/10.5909/jbe.2019.24.2.315

More information

Problem New Case RETRIEVE Learned Case Retrieved Cases New Case RETAIN Tested/ Repaired Case Case-Base REVISE Solved Case REUSE Aamodt, A. and Plaza, E. (1994). Case-based reasoning; Foundational

More information

26 이경승(394~400).hwp

26 이경승(394~400).hwp 16 2 2012 4 위치와색상정보를사용한 SURF 정합성능향상기법 이경승 *, 김대훈 *, 노승민 **, 황인준 * KyungSeung Lee *, Daehoon Kim *, Seungmin Rho ** and Eenjun Hwang * 요약 SURF(Speeded Up Robust Features). SIFT(Scale Invariant Feature Transform).,.,,.

More information

3 : OpenCL Embedded GPU (Seung Heon Kang et al. : Parallelization of Feature Detection and Panorama Image Generation using OpenCL and Embedded GPU). e

3 : OpenCL Embedded GPU (Seung Heon Kang et al. : Parallelization of Feature Detection and Panorama Image Generation using OpenCL and Embedded GPU). e (JBE Vol. 19, No. 3, May 2014) (Special Paper) 19 3, 2014 5 (JBE Vol. 19, No. 3, May 2014) http://dx.doi.org/10.5909/jbe.2014.19.3.316 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) OpenCL Embedded GPU

More information

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion 요약 본연구에서는, 웹문서로부터특정상품에대한의견문장을분석하는오피니언마이닝 (Opinion

More information

untitled

untitled 전방향카메라와자율이동로봇 2006. 12. 7. 특허청전기전자심사본부유비쿼터스심사팀 장기정 전방향카메라와자율이동로봇 1 Omnidirectional Cameras 전방향카메라와자율이동로봇 2 With Fisheye Lens 전방향카메라와자율이동로봇 3 With Multiple Cameras 전방향카메라와자율이동로봇 4 With Mirrors 전방향카메라와자율이동로봇

More information

Electronics and Telecommunications Trends 인공지능을이용한 3D 콘텐츠기술동향및향후전망 Recent Trends and Prospects of 3D Content Using Artificial Intelligence Technology

Electronics and Telecommunications Trends 인공지능을이용한 3D 콘텐츠기술동향및향후전망 Recent Trends and Prospects of 3D Content Using Artificial Intelligence Technology Electronics and Telecommunications Trends 인공지능을이용한 3D 콘텐츠기술동향및향후전망 Recent Trends and Prospects of 3D Content Using Artificial Intelligence Technology 이승욱 (S.W. Lee, tajinet@etri.re.kr) 황본우 (B.W. Hwang,

More information

1. 서 론

1. 서 론 두 장의 영상을 이용한 저조도 환경에서의 실용적 계산 사진 기법과 Mosaic 에의 응용 Practical Computational Photography with A Pair of Images under Low Illumination and Its Application to Mosaic 안택현 O, 홍기상 포항공과대학교 정보통신학과 O, 포항공과대학교 전자전기공학과

More information

(JBE Vol. 22, No. 2, March 2017) (Special Paper) 22 2, (JBE Vol. 22, No. 2, March 2017) ISSN

(JBE Vol. 22, No. 2, March 2017) (Special Paper) 22 2, (JBE Vol. 22, No. 2, March 2017)   ISSN (Special Paper) 22 2, 2017 3 (JBE Vol. 22, No. 2, March 2017) https://doi.org/10.5909/jbe.2017.22.2.162 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) Convolutional Neural Network a), b), a), a), Facial

More information

07.045~051(D04_신상욱).fm

07.045~051(D04_신상욱).fm J. of Advanced Engineering and Technology Vol. 1, No. 1 (2008) pp. 45-51 f m s p» w Á xá zá Ÿ Á w m œw Image Retrieval Based on Gray Scale Histogram Refinement and Horizontal Edge Features Sang-Uk Shin,

More information

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월 지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., 2004 5 2009 12 KOSPI200.,. * 2009. 지능정보연구제 16 권제 1 호 2010 년 3 월 김선웅 안현철 社 1), 28 1, 2009, 4. 1. 지능정보연구제 16 권제 1 호 2010 년 3 월 Support

More information

[ReadyToCameral]RUF¹öÆÛ(CSTA02-29).hwp

[ReadyToCameral]RUF¹öÆÛ(CSTA02-29).hwp RUF * (A Simple and Efficient Antialiasing Method with the RUF buffer) (, Byung-Uck Kim) (Yonsei Univ. Depth of Computer Science) (, Woo-Chan Park) (Yonsei Univ. Depth of Computer Science) (, Sung-Bong

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA 스마트시티의재해회복력향상을위한고찰 - 동일본대지진데이터분석을중심으로 A Study on improvement for disaster resilience of the smart city - Mainly on the data analysis in Great East Japan Earthquake - 저자 (Authors) 장혜정, 김도년 Hye-Jung Chang,

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA 초고주파대역도파관부품측정기술 Measurement Techniques for Microwave Waveguide Components 저자 (Authors) 유상길, 최순우, 김동현, 김대오, 안병철 Sang-Gil Yu, Swoon-Woo Choi, Dong-Hyun Kim, Dae-Oh, Kim, Bierng-Chearl Ahn 출처 (Source) 한국정보기술학회논문지

More information

때문이다. 물론가장큰이유는, 다음절에서살펴보겠지만최근들어딥러닝구조를학습하는데필요한여러가지테크닉들이개발되었기때문이다 [6,7]. 딥러닝이산업현장에서선호되는데는몇가지이유가있다. 일단은어려운문제를잘해결한다는것이다. 예를들어서, 물체인식과음성인식등전통적인패턴인식의문제에서딥러닝

때문이다. 물론가장큰이유는, 다음절에서살펴보겠지만최근들어딥러닝구조를학습하는데필요한여러가지테크닉들이개발되었기때문이다 [6,7]. 딥러닝이산업현장에서선호되는데는몇가지이유가있다. 일단은어려운문제를잘해결한다는것이다. 예를들어서, 물체인식과음성인식등전통적인패턴인식의문제에서딥러닝 기계학습개론 / 딥러닝강의노트, 서울대학교컴퓨터공학부장병탁, Copyright 2013-2016 3 장 : 딥러닝모델과모델복잡도이론 3.1 딥러닝개념 3.2 딥러닝의혁신점 3.3 딥러닝아키텍쳐 3.4 모델복잡도이론과정규화 3.5 딥러닝모델의비교 3.1 딥러닝개념 30 년전에는인공지능의기초연구분야에속하던머신러닝이최근구글, 애플, 삼성등글로벌기업들이앞다투어확보하려는핵심산업기술로발전하고있다.

More information

1 : (Eunyul Kim et al.: Video Highlight Prediction Using Multiple Time-Interval Information of Chat and Audio) (Special Paper) 24 4, (JBE Vol.

1 : (Eunyul Kim et al.: Video Highlight Prediction Using Multiple Time-Interval Information of Chat and Audio) (Special Paper) 24 4, (JBE Vol. 1: (Special Paper) 24 4, 2019 7 (JBE Vol. 24, No. 4, July 2019) https://doi.org/10.5909/jbe.2019.24.4.553 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a) Video Highlight Prediction Using Multiple

More information

2 차원단위블록정렬을이용한 내용기반이미지매칭 장철진 O 조환규부산대학교컴퓨터공학과 {jin, Content-based image matching based on 2D alignment of unit block tessellation C

2 차원단위블록정렬을이용한 내용기반이미지매칭 장철진 O 조환규부산대학교컴퓨터공학과 {jin, Content-based image matching based on 2D alignment of unit block tessellation C 2 차원단위블록정렬을이용한 내용기반이미지매칭 장철진 O 조환규부산대학교컴퓨터공학과 {jin, hgcho}@pusan.ac.kr Content-based image matching based on 2D alignment of unit block tessellation Chuljin Jang O Hwan-Gue Cho Dept. of Computer Engineering,

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA 한국소음진동공학회 2015추계학술대회논문집년 Study of Noise Pattern and Psycho-acoustics Characteristic of Household Refrigerator * * ** ** Kyung-Soo Kong, Dae-Sik Shin, Weui-Bong Jeong, Tae-Hoon Kim and Se-Jin Ahn Key Words

More information

02본문

02본문 46 특집 : 딥러닝기반방송미디어기술 특집 딥러닝기반방송미디어기술 딥러닝기반의음성 / 오디오기술 Speech/Audio Processing based on Deep Learning 이영한 / KETI Ⅰ. 서론 인간의두뇌를모델링하는뉴럴네트워크연구는 1940 년대신경세포의모델링부터시작하여현재까지다양한기술이축적되어왔다. 특히 backpropagation 이제안된이후에

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA ISSN 2383-630X(Print) / ISSN 2383-6296(Online) Journal of KIISE, Vol. 42, No. 2, pp. 235-241, 2015. 2 http://dx.doi.org/10.5626/jok.2015.42.2.235 얼굴인식을위한연립대각화와국부선형임베딩 (Locally Linear Embedding for Face

More information

정보기술응용학회 발표

정보기술응용학회 발표 , hsh@bhknuackr, trademark21@koreacom 1370, +82-53-950-5440 - 476 - :,, VOC,, CBML - Abstract -,, VOC VOC VOC - 477 - - 478 - Cost- Center [2] VOC VOC, ( ) VOC - 479 - IT [7] Knowledge / Information Management

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 ㆍ Natural Language Understanding 관련기술 ㆍ Semantic Parsing Conversational AI Natural Language Understanding / Machine Learning ㆍEntity Extraction and Resolution - Machine Learning 관련기술연구개발경험보유자ㆍStatistical

More information

02본문

02본문 87 특집 딥러닝기반방송미디어기술 CNN 과 RNN 의기초및응용연구 이은주 / 계명대학교 Ⅰ. 서론 2016 년 3월, 전세계적으로굉장히이슈가되는사건이있었다. 다름아닌, 구글딥마인드 (Deep Mind) 가개발한인공지능바둑프로그램인알파고 (AlphaGo) 와이세돌 9단의바둑대결에서컴퓨터가 4대 1이라는압승을거둔것이다. 이때, 일반대중들에게바둑에대한관심못지않게오래된패러다임으로생각되었던인공지능에대한관심이폭발적으로증가하게되었다

More information

김기남_ATDC2016_160620_[키노트].key

김기남_ATDC2016_160620_[키노트].key metatron Enterprise Big Data SKT Metatron/Big Data Big Data Big Data... metatron Ready to Enterprise Big Data Big Data Big Data Big Data?? Data Raw. CRM SCM MES TCO Data & Store & Processing Computational

More information

빅데이터_DAY key

빅데이터_DAY key Big Data Near You 2016. 06. 16 Prof. Sehyug Kwon Dept. of Statistics 4V s of Big Data Volume Variety Velocity Veracity Value 대용량 다양한 유형 실시간 정보 (불)확실성 가치 tera(1,0004) - peta -exazetta(10007) bytes in 2020

More information

À±½Â¿í Ãâ·Â

À±½Â¿í Ãâ·Â Representation, Encoding and Intermediate View Interpolation Methods for Multi-view Video Using Layered Depth Images The multi-view video is a collection of multiple videos, capturing the same scene at

More information

ch3.hwp

ch3.hwp 미디어정보처리 (c) -4 한남대 정보통신멀티미디어학부 MCCLab. - -...... (linear filtering). Z k = n i = Σn m Σ j = m M ij I ji 컨볼루션 영역창 I I I I 3 I 4 I 5 I 6 I 7 I 8 x 컨볼루션 마스크 M M M M 3 M 4 M 5 M 6 M 7 M 8 I 입력 영상 Z 4 = 8 k

More information

1 : 360 VR (Da-yoon Nam et al.: Color and Illumination Compensation Algorithm for 360 VR Panorama Image) (Special Paper) 24 1, (JBE Vol. 24, No

1 : 360 VR (Da-yoon Nam et al.: Color and Illumination Compensation Algorithm for 360 VR Panorama Image) (Special Paper) 24 1, (JBE Vol. 24, No 1: 360 VR (Da-yoon Nam et al.: Color and Illumination Compensation Algorithm for 360 VR Panorama Image) (Special Paper) 24 1, 2019 1 (JBE Vol. 24, No. 1, January 2019) https://doi.org/10.5909/jbe.2019.24.1.3

More information

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

Software Requirrment Analysis를 위한 정보 검색 기술의 응용 EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템 김석환 * 이청재 정상근 이근배 포항공과대학교 컴퓨터공학과 지능소프트웨어연구실 {megaup, lcj80, hugman, gblee}@postech.ac.kr An Example-Based Natural Language System for EPG Information Access Seokhwan Kim

More information

2 : (Seungsoo Lee et al.: Generating a Reflectance Image from a Low-Light Image Using Convolutional Neural Network) (Regular Paper) 24 4, (JBE

2 : (Seungsoo Lee et al.: Generating a Reflectance Image from a Low-Light Image Using Convolutional Neural Network) (Regular Paper) 24 4, (JBE 2: (Seungsoo Lee et al.: Generating a Reflectance Image from a Low-Light Image Using Convolutional Neural Network) (Regular Paper) 24 4, 2019 7 (JBE Vol. 24, No. 4, July 2019) https://doi.org/10.5909/jbe.2019.24.4.623

More information

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016)   ISSN 228 (JBE Vol. 1, No. 1, January 016) (Regular Paper) 1 1, 016 1 (JBE Vol. 1, No. 1, January 016) http://dx.doi.org/10.5909/jbe.016.1.1.60 ISSN 87-9137 (Online) ISSN 16-7953 (Print) a), a) An Efficient Method

More information

290 정보과학회컴퓨팅의실제논문지제 24 권제 6 호 ( ) 1. 서론음성인식시스템은모바일디바이스의보편화로음성데이터에대한접근과확보가용이해짐에따라지난몇년간크게발전하였다. 화자식별 (Speaker Identification) 은개인성도의음성학적특징을모델링하고분류

290 정보과학회컴퓨팅의실제논문지제 24 권제 6 호 ( ) 1. 서론음성인식시스템은모바일디바이스의보편화로음성데이터에대한접근과확보가용이해짐에따라지난몇년간크게발전하였다. 화자식별 (Speaker Identification) 은개인성도의음성학적특징을모델링하고분류 ISSN 2383-6318(Print) / ISSN 2383-6326(Online) KIISE Transactions on Computing Practices, Vol. 24, No. 6, pp. 289-294, 2018. 6 https://doi.org/10.5626/ktcp.2018.24.6.289 STFT 소리맵을이용한컨볼루션신경망기반화자식별방법 (Speaker

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA 스테레오 비전을 이용한 실시간 인간형 로봇 궤적 추출 및 네비게이션 641 스테레오 비전을 이용한 실시간 인간형 로봇 궤적 추출 및 네비게이션 (Real-time Humanoid Robot Trajectory Estimation and Navigation with Stereo Vision) 박지환 조성호 (Jihwan Park) (Sungho Jo) 요 약

More information

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., -

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., - THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. 2018 Jun.; 29(6), 457463. http://dx.doi.org/10.5515/kjkiees.2018.29.6.457 ISSN 1226-3133 (Print)ISSN 2288-226X (Online) Sigma-Delta

More information

2 : 3 (Myeongah Cho et al.: Three-Dimensional Rotation Angle Preprocessing and Weighted Blending for Fast Panoramic Image Method) (Special Paper) 23 2

2 : 3 (Myeongah Cho et al.: Three-Dimensional Rotation Angle Preprocessing and Weighted Blending for Fast Panoramic Image Method) (Special Paper) 23 2 (Special Paper) 232, 2018 3 (JBE Vol. 23, No. 2, March 2018) https://doi.org/10.5909/jbe.2018.23.2.235 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) 3 a), a), a) Three-Dimensional Rotation Angle Preprocessing

More information

(JBE Vol. 23, No. 5, September 2018) (Special Paper) 23 5, (JBE Vol. 23, No. 5, September 2018) ISSN

(JBE Vol. 23, No. 5, September 2018) (Special Paper) 23 5, (JBE Vol. 23, No. 5, September 2018)   ISSN (JBE Vol. 23, No. 5, September 2018) (Special Paper) 23 5, 2018 9 (JBE Vol. 23, No. 5, September 2018) https://doi.org/10.5909/jbe.2018.23.5.614 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) Generative

More information

2 : (Minsong Ki et al.: Lower Tail Light Learning-based Forward Vehicle Detection System Irrelevant to the Vehicle Types) (Regular) 21 4, (JBE

2 : (Minsong Ki et al.: Lower Tail Light Learning-based Forward Vehicle Detection System Irrelevant to the Vehicle Types) (Regular) 21 4, (JBE 2 : (Minsong Ki et al.: Lower Tail Light Learning-based Forward Vehicle Detection System Irrelevant to the Vehicle Types) (Regular) 21 4, 2016 7 (JBE Vol. 21, No. 4, July 2016) http://dx.doi.org/10.5909/jbe.2016.21.4.609

More information

MVVM 패턴의 이해

MVVM 패턴의 이해 Seo Hero 요약 joshua227.tistory. 2014 년 5 월 13 일 이문서는 WPF 어플리케이션개발에필요한 MVVM 패턴에대한내용을담고있다. 1. Model-View-ViewModel 1.1 기본개념 MVVM 모델은 MVC(Model-View-Contorl) 패턴에서출발했다. MVC 패턴은전체 project 를 model, view 로나누어

More information

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11),

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Nov.; 26(11), THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. 2015 Nov.; 26(11), 985991. http://dx.doi.org/10.5515/kjkiees.2015.26.11.985 ISSN 1226-3133 (Print)ISSN 2288-226X (Online) Analysis

More information

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4)

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 10, Oct ,,. 0.5 %.., cm mm FR4 (ε r =4.4) THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. 2018 Oct.; 29(10), 799 804. http://dx.doi.org/10.5515/kjkiees.2018.29.10.799 ISSN 1226-3133 (Print) ISSN 2288-226X (Online) Method

More information

07변성우_ok.hwp

07변성우_ok.hwp 2 : (Regular Paper) 19 5, 2014 9 (JBE Vol. 19, No. 5, September 2014) http://dx.doi.org/10.5909/jbe.2014.19.5.631 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) a), a), b) Metadata Management System Implementation

More information

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 (

( 분류및특징 ) 학습방법에따라 1 지도학습 (Supervised 2 비지도 학습 (Unsupervised 3 강화학습 (Reinforcement 으로구분 3) < 머신러닝의학습방법 > 구분 지도학습 (Supervised 비지도학습 (Unsupervised 강화학습 ( 보안연구부 -2016-016 머신러닝 (Machine 개요및활용동향 - 금융권인공지능 (AI) 을위한머신러닝과딥러닝 - ( 보안연구부보안기술팀 / 2016.3.24.) 개요 이세돌 9단과인공지능 (AI, Artificial Intelligence) 알파고 (AlphaGo) 의대국 ( 16 년 3월 9~15일총 5국 ) 의영향으로 4차산업혁명단계 1) 진입을인식함과더불어금융권에서도인공지능기술이주목받게됨에따라,

More information

融合先验信息到三维重建 组会报 告[2]

融合先验信息到三维重建  组会报 告[2] [1] Crandall D, Owens A, Snavely N, et al. "Discrete-continuous optimization for large-scale structure from motion." (CVPR), 2011 [2] Crandall D, Owens A, Snavely N, et al. SfM with MRFs: Discrete-Continuous

More information

,. 3D 2D 3D. 3D. 3D.. 3D 90. Ross. Ross [1]. T. Okino MTD(modified time difference) [2], Y. Matsumoto (motion parallax) [3]. [4], [5,6,7,8] D/3

,. 3D 2D 3D. 3D. 3D.. 3D 90. Ross. Ross [1]. T. Okino MTD(modified time difference) [2], Y. Matsumoto (motion parallax) [3]. [4], [5,6,7,8] D/3 Depth layer partition 2D 3D a), a) 3D conversion of 2D video using depth layer partition Sudong Kim a) and Jisang Yoo a) depth layer partition 2D 3D. 2D (depth map). (edge directional histogram). depth

More information

02본문

02본문 14 특집 : 차세대방송미디어기술및서비스 특집 차세대방송미디어기술및서비스 클립형미디어서비스를위한동영상자동축약기술동향및신규서비스예측 홍순기, 주재환, 김상진 / 에스비에스 Ⅰ. 개요 최근시청자는미디어소비에대한주도권을자신이갖기를원한다. 원하는미디어를원하는시간에소비하고자하는시청자의욕구를충족시키기위해, 미디어서비스업체들은호흡이긴동영상을짧은길이의동영상으로축약하여제공하는클립형미디어서비스를제공하고있다.

More information

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석

학습영역의 Taxonomy에 기초한 CD-ROM Title의 효과분석 ,, Even the short history of the Web system, the techniques related to the Web system have b een developed rapidly. Yet, the quality of the Webbased application software has not improved. For this reason,

More information

3 : 3D (Seunggi Kim et. al.: 3D Depth Estimation by a Single Camera) (Regular Paper) 24 2, (JBE Vol. 24, No. 2, March 2019)

3 : 3D (Seunggi Kim et. al.: 3D Depth Estimation by a Single Camera) (Regular Paper) 24 2, (JBE Vol. 24, No. 2, March 2019) 3 : 3D (Regular Paper) 24 2, 2019 3 (JBE Vol. 24, No. 2, March 2019) https://doi.org/10.5909/jbe.2019.24.2.281 ISSN 2287-9137 (Online) ISSN 1226-7953 (Print) 3D a), a), a), a) 3D Depth Estimation by a

More information

Microsoft PowerPoint - 27.pptx

Microsoft PowerPoint - 27.pptx 이산수학 () n-항관계 (n-ary Relations) 2011년봄학기 강원대학교컴퓨터과학전공문양세 n-ary Relations (n-항관계 ) An n-ary relation R on sets A 1,,A n, written R:A 1,,A n, is a subset R A 1 A n. (A 1,,A n 에대한 n- 항관계 R 은 A 1 A n 의부분집합이다.)

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

논문제출양식

논문제출양식 C-LSTM 신경망을이용한웹트래픽이상탐지 김태영조성배 b 연세대학교공과대학컴퓨터과학과 120-749, 서울시서대문구연세로 50 Tel: +82-2-2123-2710, Fax: +82-2-365-2579, E-mail: taeyoungkim@yonsei.ac.kr, sbcho@yonsei.ac.kr 요약 웹트래픽이상탐지는웹서버를보호하기위한보안프레임워크의가장중요한구성요소로서정상동작을따르지않는웹트래픽구간을빠르고정확하게탐지하는것이무엇보다중요하다.

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA 무선 센서 네트워크 환경에서 링크 품질에 기반한 라우팅에 대한 효과적인 싱크홀 공격 탐지 기법 901 무선 센서 네트워크 환경에서 링크 품질에 기반한 라우팅에 대한 효과적인 싱크홀 공격 탐지 기법 (A Effective Sinkhole Attack Detection Mechanism for LQI based Routing in WSN) 최병구 조응준 (Byung

More information

<BFACB1B831382D31355FBAF2B5A5C0CCC5CD20B1E2B9DDC0C720BBE7C0CCB9F6C0A7C7E820C3F8C1A4B9E6B9FD20B9D720BBE7C0CCB9F6BBE7B0ED20BFB9C3F8B8F0C7FC20BFACB1B82D33C2F7BCF6C1A E687770>

<BFACB1B831382D31355FBAF2B5A5C0CCC5CD20B1E2B9DDC0C720BBE7C0CCB9F6C0A7C7E820C3F8C1A4B9E6B9FD20B9D720BBE7C0CCB9F6BBE7B0ED20BFB9C3F8B8F0C7FC20BFACB1B82D33C2F7BCF6C1A E687770> Ⅳ. 사이버사고예측모델개발 사이버보험시장활성화를위해서는표준데이터개발이필요하다. 이를위하여이전장에서는빅데이터기반의사이버위험측정체계를제안하였다. 본장에서는제안된사이버위험지수를이용하여사이버사고 (Cyber Incident) 를예측하는모델을개발하고자한다. 이는향후정확한보험금산출에기여할것으로기대한다. 최근빅데이터, 인공지능 (Artificial Intelligence),

More information

BSC Discussion 1

BSC Discussion 1 Copyright 2006 by Human Consulting Group INC. All Rights Reserved. No Part of This Publication May Be Reproduced, Stored in a Retrieval System, or Transmitted in Any Form or by Any Means Electronic, Mechanical,

More information

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB1E8B1A4BFEB>

<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DB1E8B1A4BFEB> 기획시리즈 기획시리즈 인공지능 딥러닝기반영상처리응용기술개발및서비스동향 김광용한국전자통신연구원미디어클라우드연구실 / 책임연구원 kwangyk@etri.re.kr 조기성한국전자통신연구원 1. 서론 2. 딥러닝기반영상처리응용기술개발동향 3. 딥러닝기반영상처리응용서비스동향 4. 결론및시사점 1. 서론최근글로벌시장컨설팅업체프로스트앤셜리번 (Frost & Sullivan)

More information

SW¹é¼Ł-³¯°³Æ÷ÇÔÇ¥Áö2013

SW¹é¼Ł-³¯°³Æ÷ÇÔÇ¥Áö2013 SOFTWARE ENGINEERING WHITE BOOK : KOREA 2013 SOFTWARE ENGINEERING WHITE BOOK : KOREA 2013 SOFTWARE ENGINEERING WHITE BOOK : KOREA 2013 SOFTWARE ENGINEERING WHITE BOOK : KOREA 2013 SOFTWARE ENGINEERING

More information

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물 저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 귀하는, 이저작물의재이용이나배포의경우, 이저작물에적용된이용허락조건을명확하게나타내어야합니다.

More information

Ch 8 딥강화학습

Ch 8 딥강화학습 Chapter 8. 딥강화학습 < 기계학습개론 > 강의서울대학교컴퓨터공학부장병탁 교재 : 장교수의딥러닝, 홍릉과학출판사, 2017. Slides Prepared by 장병탁, 최진영 Biointelligence Laboratory School of Computer Science and Engineering Seoul National University Version

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA 434 정보과학회논문지 : 컴퓨팅의 실제 및 레터 제 19 권 제 8 호(2013.8) ISA 기반 시 공간적 학습을 통한 요리 동작 인식 (Cooking Action Recognition via Spatio-temporal Feature Learning based on ISA) 이 기 석 김 은 솔 (Kisuk Lee) (Eun-Sol Kim) Karinne

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Computer Vision & Pattern Recognition Lab. 제 9 장영상인식 Computer Vision & Pattern Recognition Lab. 영상인식 Computer Vision & Pattern Recognition Lab. 2 /26 영상인식 일반적인영상인식은매우어려운문제임 제한된환경, 여러가지가정하에서수행 영상의종류를알경우

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Chapter 1. 머신러닝개요 < 기계학습개론 > 강의서울대학교컴퓨터공학부장병탁 교재 : 장교수의딥러닝, 홍릉과학출판사, 2017. Slides Prepared by 장병탁, 김준호, 이상우 Biointelligence Laboratory School of Computer Science and Engineering Seoul National University

More information

클라우드컴퓨팅 주요법령해설서 2017. 11. 목차 3... 5 I... 15 II... 39 1. 공공분야... 41 2. 금융분야... 71 3. 의료분야... 81 4. 교육분야... 95 5. 신산업등기타분야... 101 III... 109 요약문 5, 15 3, 1 16~ 18 15 11 16 4, 16 7,,, 5 16 5, 16 7~10,,,

More information