4 차산업혁명과수학 서울대수리과학부교수김영훈
알파고 ( 구글딥마인드 ) 와이세돌 - 2016 년 3 월
알파고의충격 2016 년 3 월세계랭킹 1 위를지낸이세돌 9 단이구글딥마인드사의인공지능프로그램알파고와의대결에서 1 승 4 패로완패함. 2017 년 5 월현세계랭킹 1 위인중국커제 9 단이알파고에 3 패. 1997 년 5 월 IBM 의딥블루가세계체스챔피언카스파로프를꺾었으나바둑은비교할수없을정도로복잡하므로바둑에서인간을꺾는일은없을것이라여겨짐. 361 300? 딥러닝이라는수학적기법을사용하여프로그램이스스로학습하여바둑을두게하여 ( 인공지능 ) 인간을넘어선것으로엄청난충격을줌. 관련하여 4 차산업혁명에대한관심이커짐.
4 차산업혁명이란?
산업혁명이란? 혁명? 갑작스럽고급진적인변화 0 차산업혁명 : 만년전. 수렵채집에서농경사회로전환 1 차산업혁명 : 18 세기후반, 증기기관등의발명을통해가내수공업시대에서대량생산의시대로전환. 인간의근육노동을기계가부분적으로대체함. 백년 이지나역사학자아놀드토인비가 «Lectures on the Industrial Revolution of the 18 th Century in England» 에서산업혁명이라고명명함. 2 차산업혁명 : 20 세기초반, 포드주의 ( 대량생산 ), 전기도입으로제조업이획기적으로발달함. 역시인간의육체노동을기계가전면적으로대체함.
산업혁명이란? 3 차산업혁명 : 20 세기후반, 컴퓨터기술의발달로사무자동화를통해인간의통상적사무노동까지기계가대체함. 인터넷과스마트폰의도입 으로효율성의증대. 4 차산업혁명 : 21 세기초반, 컴퓨터계산능력의향상과인터넷연결을거치며인공지능기술의발달을통해인간의인지와판단까지기계가 대체함. 이미 4 차산업혁명의시대로접어들고있고인공지능은이미우리주위에다가와있다.
4 차산업혁명 이끄는힘 : 광범위한정보의디지털화와이를통한데이터이론과정보이론의발달, 아울러컴퓨터성능의비약적향상과데이터분석 ( 빅데 이터기법 ). 이바탕위에인간의인식과정을모방해구현한인공지능 기술이놀랄만한성과들을거두며인간의인지와판단을대체하기시 작함. 로봇, 자동차, 통신, 가전등의기술들과접목되어산업을넘어일상생활부터정치구조에까지광범위한변화가예상됨.
접목기술 1. Physical: 자율주행차, 드론, 3d 프린터 ( 정밀기계, 의류, 신발 ), 로봇공학 ( 사고처리, 가사대행, 약사업무, 은행원, 편의점 ), 신소재 ( 그라핀등 ) 2. Digital: IOT (internet of things) = 모든기기와사람이연결 ( 센서, 블루투스, 와이파이, 인공지능스피커 ), 자산과활동을미세하게관리 ( 물류창고관리, 스 마트냉장고, 도서관이나백화점업무 ; 스마트워치, 센서와통신기능을갖 춘스마트의류를통해세밀한건강관리 ), On-demand economy ( 우버, 카카오 택시, 에어비엔비등 ), 블록체인기술 ( 안전한거래보증, 비트코인 ), 동형암 호기술 ( 불필요한정보유출없이필요한자료만추출 ). 3. Biological: 유전자분석 ( 정보로서유전자이해 ), 주문형 DNA 편집 ( 크리스퍼기술 ), 난치병치유 ( 질병예측, 암과치매극복 ), 3d 프린터로피부, 장기인쇄
인공지능이란? 인간을뛰어넘는학습능력을통해인지능력과판단능력을보유한프로그램또는기계. 최근까지개와고양이를구분못함. 최근기계학습이론의한형태인딥러닝기술을통해놀랄만한성과. 이미지분류, 자동번역, 음성인식, 기계음성출력, 게임, 바둑, 의료분석, 재판, 천문학연구, 성향분석및추천등엄청나게다양한응용.
기계학습 (MACHINE LEARNING) 이란? 바둑, 자율주행차, 스팸필터 : 기계가어떻게행동할지인간이일일이규칙을입력하기에너무복잡하거나규칙이시간에따라계속바뀌는경우기존의프로그 래밍으로해결할수없음. 기계학습 : 데이터를통해컴퓨터가스스로규칙을발견하게하자. [Samuel 1989] 수량예측과분류예측 예 : input=( 고 2 성적, 모의고사점수, 봉사점수 ), (i) output= 수능점수 [ 수량예측 ], (ii) output= 서울대합격 / 불합격 [ 분류 ] 충분한양의데이터를학습시키면예측모델생성.
AlphaGo 많은기보를 통한학습 이세돌
딥러닝이란? 신경망을모방한학습모델. Dentrite ( 수상돌기 ) 들을통해여러뉴런에서정보받아들임. Axon ( 축색돌기 ) 들을통해정보를다른뉴런들에게전달.
딥러닝 (DEEP LEARNING) 이란? 신경생물학에서영감을얻어 1954 년 Frank Rosenblatt 가제안. 입력값 (input) 와출력값 (output) 사이에숨겨진층 (hidden layers) 을두고이들사이의상호작용으로학습진행. 충분히많은층을두면함수공간이충분히커져서여기서원하는함수에가까운함수를찾을수있음. 본질은신경망모델과함수근사이론!
바둑두는인공지능 입력값 x = x 1, x 2,, x 361, 각각의성분은 {black, white, null} 중의하나. 출력값 y = (y 1, y 2,, y 361 ), 각각의성분은 0과 1 사이의실수, 즉 y i 는 i번째위치에다음수를두었을경우이길확률. 추정함수 (estimate) y = h(x) 를데이터를통해구하고매순간이길확률이가장높은수를두면된다.
다양한응용의사례 1. 운전사 ( 자율주행, 비디오판독, 인지와분류, 판단 ) 2. 천문학자 ( 중력렌즈효과와은하사진분석에인간보다탁월 ) 3. 판사 ( 제시되는증거에따라유죄확률을학습된데이터에따라판단 ) 4. 의사 (MRI, CT 의료영상과검진수치를바탕으로진단 ; IBM 왓슨 ) 5. 교사 ( 강의, 채점 TOEFL,TSE 채점결과인간과비슷. 이외에도비서 ( 시리, 어시스턴트, 빅스비 ), 통역사 ( 구글번역기 ), 약사 ( 인공지능약사 ), 은행원, 편의점직원등등무궁무진함. 인공지능시대에유망한직업은? 수학자는비교적안전.
신경망모델 각각의입력값 (x 1,, x N ) 에비중 (w 1,, w N ) 을곱하고더한후활성화함수 σ 를작용하여다음노드에전달한다. 즉 y = σ b + w 1 x 1 + w 2 x 2 + + w N x N 로두고학습을통해비중을결정한다. 많은중간층과노드를두면더섬세한 결과를얻는다.
신경망모델 노드와층 (layer) 를추가하면점점많은비중값들이필요 점점더큰함수공간이얻어져올바른함수를더욱잘근사함. 상황에따라적절한수의노드와층을생각해야함.
학습방법 추정치와실제데이터값의차이를줄여나감 추정함수가 y = h w (x) 이고실제데이터가 x 1, y 1, x 2, y 2,, x N, y N 이면비용또는손실함수는 J w = y 1 h w x 2 2 1 + + y N h w x N 처럼오차를측정하는것인데 w에대한함수가된다. J w 가작아지는방향으로 w를움직인다 (gradient flow).
함수추정하기 주어진데이터로부터함수를추정하는문제는오랜역사의수학문제. 예 : 라그랑주보간법 (Lagrange Interpolation) n 차다항함수 f x = c n x n + c n 1 x n 1 + + c 1 x + c 0 의 (n + 1) 개의함수값이 b 0 = f a 0, b 1 = f a 1,, b n = f a n 으로주어진다면 x a 1 (x a n ) x a 0 (x a n 1 ) f x = b 0 + + b a 0 a 1 a 0 a n n a n a 0 a n a n 1 데이터에오차가있다면?
가우스 (FRIEDRICH GAUSS, 1777-1855) 수학의왕자 ( 에릭템플벨 ) 수학일지 " Pauca sed matura( 드물지만성숙하게 )" (1796) 17 각형의작도법 소수정리 : π n n ~ 1 log n 모든자연수는 3 개의삼각수들로나타날수있음 (Heureka! num=δ+δ+δ.) (1799) 대수학의기본정리 (1801) < 수론연구 > 출간 (1807) 괴팅겐천문관측소장겸괴팅겐대학교천문학과교수로임명 최소제곱법을이용해 1801 년소행성 Ceres 의위치를알아냄 복소수개념, 비유클리드기하학, 미분기하학
최소제곱법 어떤방정식의근사해를구하는데실제해와오차의제곱의합이최소가되는해를구하는방법 가우스가 1801 년소행성 Ceres 의위치를밝힐때사용 예 : 3 개의데이터 x 1, y 1, x 2, y 2, (x 3, y 3 ) 이주어졌을때이와가장가까운직선의방정식 f x = ax + b 을찾고싶다면? y 값과함수값의차의제곱의합을최소화하는방정식을찾으면된다. E(a, b)= y 1 ax 1 + b 2 + y 2 ax 2 + b 2 + y 3 ax 3 + b 2
최소제곱법 예 : n개의데이터 x 1, y 1, x 2, y 2,, (x n, y n ) 이주어졌을때이와가장가까운직선의방정식 f x = ax + b을찾고싶다면, y 값과함수값의차의제곱의합이가장작게되는방정식을찾으면된다. E(a, b)= y 1 ax 1 + b 2 + y 2 ax 2 + b 2 + + y n ax n + b 2 예 : n개의데이터 x 1, y 1, x 2, y 2,, (x n, y n ) 이주어졌을때이와가장가까운 2차함수 f x = ax 2 + bx + c를찾고싶다면, y 값과함수값의차의제곱의합이가장작게되는방정식을찾으면된다. E(a, b, c)= y 1 ax 1 2 + bx 1 + c 2 + y 2 ax 2 2 + bx 2 + c 2 + + y n ax n 2 + bx n + c 2
최소제곱법의예 3개의데이터 1,0, 3, 1, (5,4) 이주어졌을때이와가장가까운직선의방정식 f x = ax + b을찾고싶다면 E(a, b)= 1 a + b 2 + 2 3a + b 2 + + 4 5a + b 2 를최소 화
벡터와내적 평면의두벡터 v= x 1, y 1, w= x 2, y 2 의내적 v w= x 1, y 1 x 2, y 2 = x 1 x 2 + y 1 y 2 벡터 v= x 1, y 1 의길이 : v = x 1 2 + y 1 2 = v v 공간의두벡터 v= x 1, y 1, z 1, w= x 2, y 2, z 2 의내적 v w= x 1, y 1, z 1 x 2, y 2, z 2 = x 1 x 2 + y 1 y 2 + z 1 z 2 벡터 v= x 1, y 1, z 1 의길이 : v = x 1 2 + y 1 2 + z 1 2 = v v 두벡터 v 와 w 사이의거리 : d(v, w) = v w
삼각함수와내적 평면의두벡터 v= x 1, y 1, w= x 2, y 2 의사잇각을 θ 라고하면, v w= v w cos θ θ 두벡터 v, w 가서로수직일필요충분조건은 v w=0 두벡터 v, w 가나란하면 v = tw 또는 w=tv
고차원공간과내적 2 차원평면의점 ( 혹은벡터 ) 는두실수의순서쌍 v= x 1, y 1, 3 차원공간의점 ( 혹은벡터 ) 는세실수의순서쌍 v= x 1, y 1, z 1 으로나타낼수있듯이일반적 n 차원공간은 n 개실수들의순서쌍들의집 합으로나타낼수있다. R n = { v 1, v 2,, v n v i R, i = 1,2,, n n 차원공간의두벡터 v= v 1, v 2,, v n, w= w 1, w 2,, w n 의내적도이전과비슷하게정의할수있다 : v w = v 1 w 1 + v 2 w 2 + + v n w n
내적의성질 v w = v 1 w 1 + v 2 w 2 + + v n w n = w v (u+v) w=u w + v w (cv) w=c(v w) v v = v 2 0
정사영과내적 x p v x x- p v x v 벡터 x 의 v와나란한직선으로의정사영 : v와나란한벡터중 x 와가장가까운벡터, 즉 x 에서 v와나란한직선에내린수선의발 v x p v x = v v v 이차식 f t = x tv 2 = x tv x tv = v v t 2 22 x t + x x 를최소화하는 t 를찾으면 t = v x v v 이다. x tv 는 v 와수직하다. x tv v = 0 t = v x v v
정사영과내적 x 벡터 x 의두벡터 v, w 로생성되는평면 P 으로의정사영 : 평면 P 위의벡터중 x 와가장가까운벡터, 즉 x 에서평면 P 에내린수선의발 f t, s = x (tv + sw) 2 를최소화하는 t, s 를찾으면된다. x (tv + sw) 는평면 P 와수직이므로두벡터 v, w 와도수직하다. x (tv + sw) v = 0, x tv + sb w = 0 x v t v v s v w = 0, 위의일차연립방정식을풀어 t, s 를찾으면된다. x w t v w s v w = 0
최소제곱법과정사영 n 개의데이터 x 1, y 1, x 2, y 2,, (x n, y n ) 이주어졌을때이와가장가까운직선의방정식 f(x) = aa + b 을찾기 E(a, b)= y 1 ax 1 + b 2 + y 2 ax 2 + b 2 + + y n ax n + b 2 X = x 1, x 2,, x n, Y = y 1, y 2,, y n, Z = 1,1,, 1 이라놓으면 E a, b = Y (aa + bb) 2 이므로우리는 E(a, b) 를최소화하는 a, b 를찾으면된다. 다음연립방정식을풀면된다. Y aa + bb X = 0 행렬표현 Y X Y Z X X Z X = X Z Z Z a b Y aa + bb Z = 0
최소제곱법의예 3개의데이터 1,1, 3,2, 5,4 가주어졌을때이와가장가까운직선의방정식 f x = ax + b을찾고싶다면 E(a, b)= 1 a + b 2 + 2 3a + b 2 + + 4 5a + b 2 최소화 X = 1,3,5, Y = 1,2,4, Z = 1,1,1 이라놓으면 E(a, b) = Y aa + bb 2 를최소화하기위해 Y aa + bb X = 0, (Y aa + bb ) Z = 0 을풀면 27 35a + 3b = 0, 7 9a + 3b = 0 a = 3 4, b = 1 12
2 차원평면의모든벡터만들기 e 1 = 1,0, e 2 = (0,1) 라고하자. 두벡터 e 1, e 2 는서로수직이고크기가 1 인벡터들이다. 2 차원평면의임의의벡터 v= x, y 는 xe 1 + ye 2 라고나타낼수있는데이때 x = v e 1, y = v e 2 로이해할수있다. v=(v e 1 ) e 1 + (v e 2 )e 2 3,7 = 3 e 1 + 7 e 2
3 차원공간의모든벡터만들기 e 1 = 1,0,0, e 2 = 0,1,0, e 3 = (0,0,1) 라고하자. 세벡터 e 1, e 2, e 3 는서로수직이고크기가 1 인벡터들이다. 3 차원공간의임의의벡터 v= x, y, z 는 xe 1 + ye 2 + ze 3 라고나타낼수있는데이때 x = v e 1, y = v e 2, z = v e 3 으로이해할수있다. v=(v e 1 ) e 1 + (v e 2 )e 2 +(v e 3 )e 3
N 차원공간의모든벡터만들기 e 1 = 1,0,, 0, e 2 = 0,1,, 0,, e N = (0,0,, 1) 라고하자. N 벡터 e 1, e 2,, e N 는서로수직이고크기가 1 인벡터들이다. N 차원공간의임의의벡터 v= x 1, x 2,, x N = x n e n N n=1 N = (v e n )e n 이처럼내적이잘정의된공간에서서로수직이고크기가 1 인벡터들이모든벡터들을만들어내면그런벡터들의모임을정규직교기저 (orthonormal basis) 라고부른다. n=1
함수의적분 함수 f: a, b R 의적분 b f x dd a 여기서 x = b a, x n i = a + i x x = a, x = b, y = f(x) 의그래프, x축으로둘러싸인영역의넓이 n = lim f(x i ) x n i=1 (x 축위에놓인넓이 ) (x 축아래놓인넓이 )
함수의내적 1 두 ( 연속 ) 함수 f, g: 0, 2π R 의내적을다음과같이정의할수있다. f, g = 1 2π 2π f x g x dd 함수의크기도다음과같이정의할수있다. 0 f = f, f = 1 2π 2π f x 2 dd 이는앞서정의한벡터들의내적과크기의성질을모두만족한다. 0
조제프푸리에 (1768-1830) 프랑스과학자이자수학자 고체에서열전도에관한열방정식에관심 ( 금속공업, 지구내부온도 ) 1807 년열전도에관한논문을프랑스과학아카데미에제출하나불충분한이론이라고심사위원들에의해거절 1812 년아카데미에서과학현상공모주제로열전도선정 : 푸리에수상 ( 하지만논리적엄밀성부족을이유로논문집에발간거부당함 ) 1822 년 < 열해석론 > 발간 나폴레옹의이집트원정에동행
푸리에급수 주기함수를대표적인주기함수인삼각함수들의합으로나타내는방법 조제프푸리에가열방정식을풀기위하여도입 무한한구간에서푸리에변환으로확장 조화해석학 (Harmonic Analysis) 라는수학의한분야로발전 소리나빛, 전자기파등파동연구 ( 음향학, 광학, 전자공학 ), 신호처리와화상처리, 데이터압축등에널리쓰임
삼각함수의미분 (sin t) = cos t (sin t) = sin t cos x = sin t cos x = cos t 진동하는추에대한미분방정식 d 2 y dt 2 + k2 y = 0 의해 : y t = a cos kk + b sin kk
삼각함수의적분 1, 1 = 1 2π 2π 0 1dd = 1 sin(nn), 1 = 1 2π 2π 0 sin(nn) dd = 0, cos(nn), 1 = 1 2π 2π 0 coo(nn) dd = 0 sin(nn), sin (nn) = 1 2π 2π 0 sin 2 (nn) dd = 1 2 cos(nn), cos (nn) = 1 sin(nn), sin (mx) = 1 cos(nn), cos (mm) = 1 cos nn, sin(mm) = 1 2π 2π 0 2π 2π 0 2π 2π 0 2π 2π 0 cos 2 (nn) dd = 1 2 sin nn sin mm dd = 0 (n m) cos nn cos mm dd = 0 (n m) cos nn sin mm dd = 0 ( 모든 n, m)
푸리에급수 주기가 2π 인함수 f: 0, 2π R 의푸리에급수는다음과같이정의된다. 푸리에계수 대부분의함수에대하여 f=f F x = a 0 + a n cos nn + b n sin nn n=1 a 0 = f, 1 = 1 2π 2π f x dd, 0 n=1 a n = 2 f, cos (nn) = 1 2π π f x cos (nn)dd, b n = 2 f, sin (nn) = 1 2π π f x sin (nn)dd 0 0
푸리에급수의예 계단함수 f x = 1 0 < x π 1 π < x 2π 의푸리에급수 F x = 1 (2n 1) sin 2n 1 x = sin x + 1 3 sin 3x + 1 sin 5x + 5 n=1
함수의내적 2 두함수 f, g: R C 의내적을다음과같이정의할수있다. f, g = f x g x dd 함수의크기도다음과같이정의할수있다. f = f, f = f x f x dd
푸리에변환 FOURIER TRANSFORM 시간에관한함수 ( 신호 ) 를함수를구성하는주파수성분으로분해하는조작 악보에서코드를음높이 ( 주파수 ) 로표현하는것과유사 함수 f: R C 에대해그푸리에변환 F f = f 는다음과같이정의 : F f ξ = f ξ = f x e 2ππξx dd = f, e 2ππξx 원래함수 f 를그푸리에변환 f 로부터다시복원해낼수있다. F 1 f x = f ξ e 2ππξx dξ = f (ξ), e 2ππξx = f(x)
세상에서가장아름다운식 오일러의공식 e x+ii = e x (cos y + i sin y) 오일러의등식 e ππ + 1 = 0
오일러 (LEONHARD EULER, 1707-1783) 오일러의방법 : 근사경로계산알고리즘 ( 달까지거리계산, 항해경로 ) 쾨니히스베르크의다리문제 : 모든다리를한번씩만지날수있을까? 한붓그리기 오일러지표 (Euler characteristic) χ = v e + f ( 점 - 선 + 면 ) 페르마의마지막정리 ( 방정식 x n + y n = z n 은 3 이상인 n 에대하여자연수해를가지지않는다.) 을 n=3 일때증명 여러가지수학기호 : 함수 f(x), 허수 i, 합
푸리에근사의응용 데이터압축, 전송, 풀기모든함수값을보내는대신푸리에계수들 ( 중일부 ) 만보내면이를이용 하여원래함수 ( 의근사함수 ) 를복원해낼수있다. 데이터저장 : 음악, 사진파일저장 소리의잡음제거 / 영상의노이즈제거 신시사이저나디지털피아노
웨이블릿 WAVELET 0 을중심으로하는한정된구간에서증가와감소를반복하는진폭을수반한파동형태 오디오신호, 이미지뿐아니라다른다양한종류의데이터로부터정보를추출하는데사용될수있는수학적도구 1982 년프랑스의석유탐사기사 Morlet 이실제로응용하면서부터그실용성이인정 푸리에변환 : 사인 / 코사인함수를기저로사용, 시간적정보갖지않음웨이브렛변환 : 하나의웨이블렛을이동, 확대, 축소시켜사용, 시간적공 간적추이를동시에다룰수있다는장점
웨이블릿의응용 합금의구조규명 의학이미지, 디지털영상, 허블망원경해상도향상 중력파검출관측 그림진위여부판별 2017 년아벨상수장자이브메이에