DBPIA-NURIMEDIA

Size: px
Start display at page:

Download "DBPIA-NURIMEDIA"

Transcription

1 Journal of Institute of Control, Robotics and Systems (2015) 21(6): ISSN: eissn: Semi-supervised Learning for the Positioning of a Smartphone-based Robot, * (Jaehyun Yoo 1 and H. Jin Kim 1,* ) 1 School of Mechanical and Aerospace Engineering, Seoul National University Abstract: Supervised machine learning has become popular in discovering context descriptions from sensor data. However, collecting a large amount of labeled training data in order to guarantee good performance requires a great deal of expense and time. For this reason, semi-supervised learning has recently been developed due to its superior performance despite using only a small number of labeled data. In the existing semi-supervised learning algorithms, unlabeled data are used to build a graph Laplacian in order to represent an intrinsic data geometry. In this paper, we represent the unlabeled data as the spatial-temporal dataset by considering smoothly moving objects over time and space. The developed algorithm is evaluated for position estimation of a smartphone-based robot. In comparison with other state-of-art semi-supervised learning, our algorithm performs more accurate location estimates. Keywords: semi-supervised learning, wifi indoor localization, smartphone-based robot I. 서론 IoT (Internet of Things) 기술이급속하게발달됨에따라이를기반으로한다양한서비스및시스템들의융합이빠르게진행되고있다. 예를들어, 많은가전단말기들( 로봇청소기, 냉장고, 오디오등) 이인터넷으로연결되어고객의필요에맞는지능적인서비스를제공하며, 이러한기술은의료, 교통, 방범등실생활에광범위하게확장될수있다. IoT 기반융합의흐름중주목되는부분이실내공간위치인식시스템이다. 위치인지는실내내비게이션, 실내로봇임무분담및자동화, 실내에너지관리, 긴급상황안내및서비스들의기초단계라할수있다. 실내에서는 GPS (Global Positioning Systme) 를이용할수없기때문에, 사용자혹은원하는물체의위치인식을하기위한다양한방법이소개되어왔다. 관성측정장치(inertial measurement unit) 를이용하여칼만필터(Kalman filter) 혹은파티클필터(Particle filter) 를적용하여이동정보를얻음으로써관심물체의위치를추정하는방법이있다[1,2]. 이방법은이동거리에따라오차가누적되는단점이있다. RFID (Raido Frequency Indentification) 를이용한위치추정방법은 IC 칩과무선모듈을포함하는장비를통해 IC 칩의식별자를인식함으로써가능하다[3-5]. 하지만광범위한지역에센서측정범위가비교적짧은수많은 RFID를설치하는것은비용면에서부담이된다. * Corresponding Author Manuscript received November 17, 2014 / revised February 23, 2015 / accepted March 31, 2015 유재현, 김현진: 서울대학교기계항공공학부항공우주신기술연구소 이논문은 2014 년도정부( 미래창조과학부) 의재원으로한국연구재단의지원을받아수행된연구임 (No ). 압력센서를바닥에설치하여대상값을센싱하여물체의위치를측위하는방법 [6] 의경우, RFID와마찬가지로설치에따르는경제적부담과, 물체를식별하기어려운단점이있다. 한편, 카메라및 CCTV의영상정보를이용하여이동체의위치를추정하는방법이연구되어있으나[7,8,9], 여러물체가중복되거나화질에따라성능차이가크고, 가격이비싼단점이있다. 본논문에서는와이파이공유기의신호세기를이용하여위치를추정하는방법을이용한다[10,11]. 와이파이공유기는상업건물이나전철역및많은곳에통신사에의하여이미설치가되어추가경제비용이발생하지않으며, 상대적으로센서측정범위가넓은장점이있다. 와이파이신호세기를이용한기존의위치추정방법은 finger print 방법 [12,13] 을이용한다. 즉, 관심물체와신호세기의상관관계를학습하여, 신호를감지하였을때위치를추정하는방식이다. 이방법은대량의학습데이터가필요하다는단점이있지만, 본논문에서는준지도식학습기법(semi-supervised learning) [14] 을이용함으로써학습데이터를최소한으로사용하면서위치인식성능을높이는데목표를둔다. 또한기존의준지도식학습기법이공간상의학습데이터만을사용하는반면, 본논문에서는학습데이터에시간상의의미를추가함으로써학습성능을개선시켰다. 본논문의구성은다음과같다. II 장에서는준지도식학습기법의개요를정의한다. III 장과 IV 장은개발된알고리즘을순차적으로기술한다. V장에서는개발된알고리즘을와이파이신호를이용한위치추정문제에적용하는방법을기술한다.VI 장에서는튜닝파라미터설명,VII장은알고리즘의성능평가로써스마트폰로봇의위치추정실험결과를보여준다. 마지막으로 VIII 장에서는결론을맺는다. Copyright ICROS 2015

2 566 Jaehyun Yoo and H. Jin Kim II. 준지도식학습기법개요이장에서는최적화문제형태로정의된준지도식학습기법의개요를살펴본다. 먼저, labeled data와 unlabeled data 를각각, 라고정의하며, 는 labeled data, unlabeled data 의개수이다. 준지도식기계학습은 labeled data의개수가적을때효과적으로 unlabeled data 를사용하여 ( 즉 일때), 효율성과정확성을높이는데목적이있다. 준지도식학습기법은다음과같은최적문제를풀어매핑 를찾는다. argmin (1) 이때, 는손실함수, 는 Reproducing Kernel Hilbert Space (RKSH) 에서의함수크기, 는저차원매니폴드에서의함수크기이고, 는튜닝파라미터이다. 식 (1) 의최적문제에서해의형태는 representer theorem [15] 에의해다음과같이정의된다. (2) 이때 는최적문제의해이고, 커널함수는 로정의되며 는 RKHS 로의비선형매핑이다. 본논문에서, 커널함수는다음과같이가우시안함수로정의된다. exp. 반면에, 식 (1) 에서 는다음과같이정의된다. (3) 식 (3) 에서 는 커널행렬이며그원소는 이다. 또한,, 으로정의된다. 매니폴드 regularization 에의하면, 데이터샘플들은저차원매니폴드에서얻어진다는가정에의해식 (1) 의 는다음과같이정의된다 [12]. 식 (4) 에서 은정규화된그래프라플라시안이며,, 는 adjacency 행렬, 는대각행렬이다. 이때, 행렬 는일 반적으로가우시안함수를이용하여다음과같이정의한다. exp 기존의지도식학습기법(supervised learning) 과비교하였 (4) 을때준지도식학습기법의특징은식 (1) 에서 항의추가이다. 즉, 항을감소시키는것은데이터포인트들사이의 regression 함수값의급속한차이를줄이는것과같 다. 즉, 항은데이터구조의 smoothness 를제어하며, 이는 unlabeled data를추가적으로이용함으로써얻는효과이다. III. Laplacian Embedded Regularized Least Square (LapERLS) 이장에서설명할알고리즘 LapERLS은두가지의특징이있다. 첫번째로 unlabeled data로부터인위적으로 pseudolabel을생성하여부족한양의 labeled data를보조할수있다. 두번째로최소자승형태의최적문제를정의함으로써, 빠른학습시간\ 이라는이점이있다[16]. 기본적인준지도식학습최적문제형태의식 (1) 에서변경된최적문제는다음과같다. argmin 식 (1) 의최적화문제와달리, 식 (5) 의최적화문제는바로 를구하는것이아니라, 중간변수 를labeled data에근접시키는동시에 graph manifold에 smooth하게만드는방법이다. Least square해의형태를만들기위해손실함수는다음과같이정의된다. (5) (6) 식 (6), (3), (4) 을식(5) 에통합시켜서다음과같은프라이멀최적문제를얻을수있다. min 식 (7) 에서대각행렬 는다음과같이정의된다. 가 labeled data라면, 가 unlabeled data라면 이다. 또한데이터들의 label은 로정의되며, 는튜닝파라미터이다. 식 (7) 의최적해를구하기위하여라그랑지안 multiplier 를정의하면라그랑지안 은다음과같이정의된다. 식 (8) 에서 (7) (8)

3 Semi-supervised Learning for the Positioning of a Smartphone-based Robot 567,, 를뜻한다. 또한, 식 (8) 로부터최적해를얻기위해각변수에미분을취하면다음과같다. 위의 H-P 필터를 LapERLS 식 (7) 에융합시키면다음과같은최적화문제에다다른다. 위식들을식있다. (7) 에대입하여, 듀얼최적문제를얻을수 argmin (11) 식 min (9) (9) 에서사용된변수들은다음과같다. 식 (11) 의최적화문제는식 (7) 의최적화문제를푸는것의절차, 즉식 (8)~(9) 와동일하다. 미분을걸쳐 timeseries LapERLS 의최종최적문제는다음과같이정의된다. 정리하자면, 식 (9) 로부터얻은해 를관 min (12) 계식 에의하여 를얻을수있다. 이 렇게얻어진 는식 (2) 에대입하 여매핑 를구할수있다. IV. Time series LapERLS 본장에설명할 time-series LapERLS 는이전장에기술된 LapERLS 알고리즘에더하여 labeled data와 unlabeled data에 time-series 의미를부여하여정확성과데이터의효율성을높이는것에목표를둔다. 즉, 기본 LapERLS 에서는학습데이터의공간적인의미만을사용하였지만, 개발된알고리즘은시공간상의(spatio-temporal) 학습데이터를이용한다. 공간상의데이터가그래프매니폴드 ( 즉, 식 (4)) 에의해표현되었다면, 시간상의데이터는 Hodric-Prescott(H-P) 필터 [17] 에의해표현된다. 다음의최적화문제를살펴보자. 식 (9) 와비교하였을때, 의항만이새로추가되었다. 행렬 는기존에정의됬기때문에, 기존의 LapERLS 와비교하여계산시간은거의동일하다. 하지만학습성능은 time-series 데이터의추가로인해우월하게나아진다. 이는기존에공간상의의미만지니던 unlabeled data가시간상의의미를가짐에따라, 시공간상에서매끄럽게변화하는형태의데이터를잘학습시킨다. 예를들어, 자동차및비행체처럼한곳에서다른곳으로점프하지않는물체들의데이터특성을반영할수있다. V. 와이파이신호를이용한위치추정이장에서는준지도식학습기법과와이파이신호값을이용하여그림 1과같이스마트폰로봇의위치추정을설명한다. min (10) 식 (10) 에서사용되는학습데이터 는 timeseries labeled training data 이다. 여기서, 두번째텀을감소시키는것은시간상의연속적인 를공간상으로일직선으로만드는역할을한다. 식 (10) 의해는다음과같이얻어진다. 이때, 그림 1. 와이파이를이용한스마트폰모바일로봇의위치추정실험환경. Fig. 1. Smartphone robot position tracking using Wifi signal.

4 568 유재현, 김현진 앞서정의한학습데이터의정의를상기하면, 는 labeled data, 는 unlabeled data 이다. 이때, wifi 신호세기를학습데이터로사용하면 이고 는모바일로봇이 xi, yi 에위치하였을때 번째와이파이공유로부터얻은신호세기이다. 공유기의개수가 9개이므로 이다. 그러므로, 각 X-Y좌표에관한총 개의 labeled training data 는 X, Y 로얻어진다. 반면 wifi 신호값만으로정의된 unlabeled data는위치에무관하게 다. 그러므로, 일때, 학습단계에서는각각X-Y좌표에대하여함수 X, Y 를 얻는다. 즉, X Y 는각각와이파이신호값과스마트폰로봇의위치에대한관계식을모사한다. VI. 파라미터튜닝본장에서는고안한알고리즘에속해있는파라미터튜닝법을소개하고, 각파라미터값의증감에따른 training 에러를보여준다. 먼저, 식 (7) 아래에정의된 는 unlabeled data에상대적으로 labeled data의 optimal 문제에서의중요도라고해석할수있다. 예를들어, 값이작으면 labeled data의 pseudolabels과참 labeles 의차이가생긴다. 그러므로, 값은 pseudolabels과참 labeles의차이가생기지않는범위내에서결정한다. 두번째로, 식 (12) 안의, 은시공간 (spatio-temporal) 의상대적관계를가진다. 만약공간보다시간상의의미를더부여하고싶다면, 를상대적으로작은값으로튜닝한다. 그림 2는 일때,, 증감값에따른 training 에러를보여준다. 따라서본실험에서는 training 에러가가장작은,, 로정의하였다. VII. 실험결과이장에서는개발한알고리즘의성능을평가하기위하여, 알고리즘을스마트폰모바일로봇의위치추정에적용한실험결과를보여준다. 실험환경은그림 1처럼 5m 5m 에 9 개의와이파이공유기와스마트폰로봇, 그리고 VICON 을이용하였다. 스마트폰은 9개의공유기로부터와 이파이신호세기와해당하는위치좌표에관하여학습데이 터를생성한다. 또한알고리즘의정확도를평가하기위하여실내위치 인식장치(VICON) 로부터실제스마트폰의위치를측정한다. 모바일로봇은 GCtronic에서상용화한 Wheelphone이라는제 품을사용하였고, 이에연결되는스마트폰은 Galaxy S3을 이용하였다. 학습데이터를얻기위해여러위치에로봇을두고신호 값을받는 fingerprint 방법 [12] 을이용하였고총 221개의 labeled training data 를 얻었다. 또한, 개발한 time-series LapERLS 알고리즘의비교군으로써 LapERLS 을사용한다. 그림 3, 4는두알고리즘의 pseudolabel의정확도를비교 함으로써위치인식성능을보인다. 스마트폰로봇의실제 움직임은그림 2와같이왼쪽하단에서시작하여오른쪽상위로계단식으로주행한다. 위그래프는총 221개의 labeled 데이터중에 25% 만사용하여얻은 pseudolabel 의결과를나타내며, time-series LapERLS 알고리즘이월등히좋은성능을보여준다. 그림 3은labeled data 의개수에따른오차를보여주는데, 개발한알고리즘의경우 20% 까지사용하여도오차가적음을볼수있는반면, 기존알고리즘은데이터의개수가줄어듦에따라오차또한증가하는것을볼수있다. 그림 3. 개발한 Time series LapERLS 의위치인식성능. Fig. 3. Position estimation of the developed time series LapERLS. 그림 2., 의증감값에따른 training 에러. Fig. 2. Training error according to the variation of and 그림 4. 기존의 LapERLS 의위치인식성능. Fig. 4. Position estimation of the existing LapERLS.

5 스마트폰 로봇의 위치 인식을 위한 준 지도식 학습 기법 그림 5. Time series LapERLS와 기본 LapERLS의 labeled data의 개수에 따른 위치 인식 성능 비교. Fig. 5. Comparison with Time series LapERLS and LapERLS for position estimation according to the number of labeled training data. 569 그림 % (221개) labeled data를 이용한 9개 공유기의 와이 파이 신호세기 분포도. Fig. 6. Wifi signal strength distribution using 100% (221) labeled data. 또한, 가시적으로 psedulabel의 효과를 보여주기 위하여 추가 실험을 한 결과가 그림 6, 7, 8이며 9개의 wifi 공유기 로부터 얻은 신호세기를 2차원 평면에 신호세기 분포도를 표현한다. 그림 6은 100%의 labeled data (221개)를 모두 사용하였을 때의 분포도이며, 거리에 따라 와이파이 신호세기가 지수적 으로 줄어드는 가우시안 분포와 흡사한 것을 볼 수 있다. 그림 7과 그림 8는 각각 두 비교 알고리즘의 25%의 labeled data를 사용하여 psedolabel을 생성하고 분포도를 표현한 모 습이다. 제안한 알고리즘의 결과인 그림 7은 그림 6와 거의 흡사한 것을 볼 수 있으며, 비교한 알고리즘의 결과 그림8 은 가우시안 분포도 모습이 왜곡되었다. 즉, 적은 양의 labeled data를 사용하고도 제안한 알고리즘의 위치 인식 성 능이 좋은 것은 정확한 psedolabel을 얻기 때문이라고 분석 할 수 있다. 그림 7. 25% (55개) labeled data를 이용한 time series LapERLS의 와이파이 신호세기 분포도. Fig. 7. Wifi signal strength distribution of time series LapERLS using 25% (55) labeled data. VIII. 결론 본 논문은 준 지도식 학습기법 개념에 시계열 데이터 의 미를 융합하여 정확한 위치 인식 기법을 제안하였다. 기존 의 준 지도식 학습기법에 사용된 unlabeled data는 오직 공 간적인 의미만을 가졌지만, 매끄럽게 이동하는 모바일 로봇 과 같은 경우 시계열 데이터 의미를 부여함으로써 unlabeled 데이터의 응용성을 높였다. 개발된 알고리즘은 스마트폰 모바일 로봇의 위치 인식 실험에 적용하였다. 비교한 LapERLS알고리즘보다 정확성 측면에서 2배이상의 성능을 보였고, 특히 labeled data가 극 히 부족한 상황에서도 개발한 알고리즘의 위치 인식 성능 이 좋음을 보였다. 본 논문에서 소개된 위치 추정뿐만 아니라, 시계열 데이 터의 의미를 가질 수 있는 다양한 어플리케이션에 적용이 가능하며, 기존의 지도식 학습기법과 비교하였을 때, 소량 의 데이터로 좋은 성능을 얻을 수 있어서 효율적일 것으로 전망한다. 그림 8. 25% (55개) labeled data를 이용한 기존 LapERLS의 와이 파이 신호세기 분포도. Fig. 8. Wifi signal strength distribution of the existing LapERLS using 25% (55) labeled data.

6 570 Jaehyun Yoo and H. Jin Kim REFERENCES [1] A. R. Jimenez, F. Seco, J. C. Prieto, and J. Guevara, Indoor pedestrian navigation using an INS/EKF framework for yaw drift reduction and a foot-mounted IMU, Positioning Navigation and Communication, th Workshop on. IEEE, pp , [2] J. Collin, O. Mezentsev, and G. Lachapelle, Indoor positioning system using accelerometry and high accuracy heading sensors, Proc. of ION GPS/GNSS 2003 Conference, [3] S.-B. Kim, D.-H. Lee, and J.-M. Lee, Indoor localization scheme of a mobile robot applying RFID technology, Journal of Institute of Control, Robotics and Systems (in Korean), vol. 11, no. 12, pp , [4] D.-G. Seo, S.-H. Cho, and J.-M. Lee, Localization algorithm for a mobile robot using igs, Journal of Institute of Control, Robotics and Systems (in Korean), vol. 14, no. 3, pp , [5] L. M. Ni, D. Zhang, and M. R. Souryal, RFID-based localization and tracking technologies, Wireless Communications, IEEE, vol. 18, no. 2, pp , [6] G. Retscher, Günther, Location determination in indoor environments for pedestrian navigation, Position, Location, And Navigation Symposium, IEEE/ION, [7] N. Ravi, P. Shankar, A. Frankel, A. Elgammal, and L. lftode, Indoor localization using camera phones, Mobile Computing Systems and Applications, [8] H. Hile and G. Borriello, Positioning and orientation in indoor environments using camera phones, IEEE Computer Graphics and Applications, vol. 28, no. 4, pp , [9] Y. J. Kim and D. H. Kim, Smart phone based image processing methods for motion detection of a moving object via a network camera, Journal of Institute of Control, Robotics and Systems (in Korean), vol. 19, no.1 pp , [10] A. S. Paul and E. A. Wan, RSSI-based indoor localization and tracking using sigma-point kalman smoothers, Selected Topics in Signal Processing, IEEE Journal of, vol. 3, no. 5, pp , [11] H. S. Ahn and W. Yu, Hyo-Sung, Environmental-adaptive RSSI-based indoor localization, Automation Science and Engineering, IEEE Transactions on, vol. 6 no. 4, pp , [12] D. A. Tran and T. Zhang, Fingerprint-based location tracking with hodrick-prescott filtering, Wireless and Mobile Networking Conference, IEEE, pp. 1-8, [13] S. Y. Cho and J. G. Park, Radio propagation model and spatial correlation method-based efficient database construction for positioning fingerprints, Journal of Institute of Control, Robotics and Systems (in Korean), vol. 20, no. 7, pp , [14] M. Belkin and P. Niyogi, Semi-supervised learning on riemannian manifolds, Machine Learning, vol. 56, no. 1-3, pp , [15] Schölkopf, Bernhard, R. Herbrich, and A. J. Smola, A generalized representer theorem, Computational Learning Theory, Springer Berlin Heidelberg, [16] M. M. Adankon, M. Cheriet, and A. Biem, Semisupervised least squares support vector machine, Neural Networks, IEEE Transactions on, vol. 20, no. 12, pp , [17] M. O. Ravn and H. Uhlig, On adjusting the hodrick-prescott filter for the frequency of observations, Review of Economics and Statistics, vol. 84, no. 2, pp , 유재현 2010 년광운대학교정보제어공학부학 사 년현재 ~ 서울대학교대학원기계항공공학부석박사 통합과정재학중. 관심분야는기계학습및신호처리알고리즘. 김현진 1995년 KAIST 기계공학학사. 1999년과 2001년 UC Berkeley 기계공학석사, 박사 년~2004년 UC Berkeley EECS 박사후연구원및강사 년현재 ~ 서울대학교기계항공공학부교수. 관심분야는이동로봇플래닝및지능제어알고리즘.