GT2017-SI02 2017. 3. 1 글로벌기술협력기반육성사업 (GT) 심층분석보고서 인공지능양대산맥인 IBM 과구글
목 차 주요내용요약 1 1. IBM 왓슨 (Watson) 2 2. IBM 왓슨의특징 3 3. IBM 왓슨의사업화 8 4. IBM 기술개발 10 5. 구글알파고 (AlphaGo) 11 6. 구글 AI 활용 11 7. 구글의 AI 기술확보방법 11 8. 구글의 AI 생태계 11 9. IBM 왓슨과구글알파고의차이점 11 10. 맺음말 11
주요내용요약 IBM 왓슨 (Watson) 과구글알파고 (AlphaGo) 는전세계인공지능 (AI) 분야에서가장뛰어나면서널리알려진제품들로최근치열한경쟁관계에있음 IBM은 AI 개발에있어서오랫동안투자해온기업중하나인데, IBM의왓슨은말, 글씨, 그림등의비정형빅데이터를효과적으로분석해의미있는정보를찾아내어사람이활용하도록제공할수있으며, 특히음성인식및자연어처리에강점이있음 IBM 왓슨은이미상용화가많이진행되었는데, 의료계에서는암진단및최적의치료법을제안하고, 금융계에서는개인자산관리및투자종목추천들에활용중이며, 산업계에서는사물인터넷과연계해생산기기나장비의관리에활용되고있음 IBM이주로자체연구개발을통해 AI 기술을개발하고있는데반해, 구글은 AI계의스타트업들을적극적으로인수함으로써기술을확보해나가고있음 구글의알파고의 AI 엔진은바둑이외에다양한분야에활용이가능하며, 구글의 AI 기술은이미구글번역기, 포토, 지도, 클라우드등의구글서비스와구글카등에적용되고있음. 최근에는헬스케어를포함해다양한산업분야에서 AI를사업화하려는시도가시작되고있음 IBM 왓슨이사람이더나은결정내리도록돕는 의사결정지원 에중점을두고있는데반해, 알파고는 자체적으로의사결정 을내린다는데두 AI의큰차이가있음 아울러, AI를운영하는컴퓨터하드웨어에도차이점이있는데, IBM은주로하나의슈퍼컴퓨터를활용하는데비해구글은 PC와같이소형컴퓨터를여러대연결한분산컴퓨팅을기반으로하고있음 두기업은딥러닝을통해 AI를훈련시키는방식에있어서도다른데, IBM은사람이정리한자료나논문을사용해왓슨을교육하는데반해, 구글은자사의서비스를통해확보한방대한양의사용자데이터들을가지고 AI를교육시키고있음 1
< 인공지능양대산맥인 IBM 과구글 > 1 IBM 왓슨 (Watson) IBM은인공지능 (AI; Artificial Intelligent) 개발에있어서가장오랫동안투자를해오고있는기업중하나다. 세계적인민간싱크탱크인 IBM 왓슨연구소는인공지능관련하여 딥블루 (Deep Blue)' 라는슈퍼컴퓨터를만들었는데, 1997년체스세계챔피언인카스파로프와의대결에서승리하면서세상의주목을받았다. IBM은딥블루를더욱발전시켜 IBM 설립 100주년이되던 2011년도에 왓슨 (Watson) 이라는인공지능슈퍼컴퓨터를공개했다. 참고로왓슨은 IBM 창업주의이름이다. IBM 왓슨은 2012년도에미국의 제퍼디 (Jeopardy) 라는유명퀴즈쇼에참가했는데, 인간우승자들과의경쟁에서압도적인성적으로이기면서대중들에게인공지능에대한강렬한인상을남기게된다. 퀴즈쇼에서왓슨은진행자의말을이해하고스스로자료를검색하여음성으로답변했었다. 왓슨은머신러닝중딥러닝이라는기술을이용하고클라우드기반으로동작하며, 1초에 80조번에이르는연산능력과책 100만권분량의빅데이터를이해하고분석할수있는성능을가지고있다. 2 IBM 왓슨의특징 IBM은왓슨을인공지능보다는 인지컴퓨팅 (Cognitive Computing) 이라는용어를사용하여다른기업들과의차별화를꾀하고있는데, 이는왓슨이사람과어떻게더효율적으로소통하는지에대해중점을두고있다는사실을강조한것이다. 즉, 사람들이일반적으로사용하는말, 글씨, 그림등의비정형데이터를컴퓨터가이해하고분석하여의미있는정보를찾아내고, 이것을사람이판단하는데활용할수있도록제공하는것을중요하게생각한다는것이다. 2
왓슨은사람에가까운방식으로데이터를분석하고정보를찾아처리하는슈퍼컴퓨터로제퍼디퀴즈쇼에서보여준바와같이비정형데이터중하나인음성인식및자연어처리에특히강점을가지고있다. 이런비정형데이터들은기존컴퓨터들이다루는데한계가있었다. 왓슨은사람들이일상생활에서쓰는자연어를이해하고학습을통해지식을축척한다음가설까지제안할수있는데, 단순히구문을처리하거나키워드를검색하는정도가아니라언어를깊이이해하고이에대한답을구할수있다. 3
< 인공지능양대산맥인 IBM 과구글 > IBM 왓슨은엄청난양의비정형데이터를효과적으로분석해사람이알아차리지못하는의미있는정보를파악하여제공함으로써사람들의업무효율향상에기여하는것을목표로하고있다. 이를위해서는왓슨이똑똑해져야하는데, 사람들은교육을통해왓슨의지능을향상시키게된다. 사람들이교육에필요한데이터를가공하여왓슨에게제공하면서원하는방향으로학습을시키는데, 오랫동안한주제에대한데이터를충분히제공하면고도의 AI를구현할수가있다. 이는왓슨이인간의학습능력과같은스스로배울수있는머신러닝기능을보유하고있기때문에가능한것이다. 3 IBM 왓슨의사업화 IBM 왓슨은이미상용화가많이진행되었다. IBM 은왓슨을계속업그레이드 시키면서다양한산업에서사업화를꾀하기위해 2014 년뉴욕에 2000 명규모로 IBM 왓슨그룹 을신설하였다. 또한 2013년부터는왓슨의 API(Application Programming Interface; 응용프로그램인터페이스 ) 를개발자들에게개방해왓슨을이용한서비스를개발할수있도록하였다. API를제공한다는의미는왓슨의기능을외부프로그래머들이활용할수있도록해주는것으로, API를통해왓슨에게데이터와명령을제공하고그분석결과를받아볼수있게된다. 이는왓슨이인터넷기반의클라우드방식으로동작하기때문에가능하다. 4
현재 IBM은 3,500여개의기업및기관과파트너십을맺고왓슨에코시스템을구축하였으며, 2015년부터약 8만명의연구자들이개발에참여해약 200개의왓슨을활용한응용서비스를개발하였다. 24개국의학교, 제약회사, 자동차회사, 금융회사, 병원등 17개산업에서활용중이며, 여러나라에서서비스를제공하기위해한국어, 영어, 일본어, 포르투갈어, 스페인어등의언어를학습하고있다. IBM 왓슨은소프트뱅크등과협업을통해로봇개발도추진중이다. 로봇에필요한 AI는클라우드컴퓨팅으로 IBM 왓슨을활용하고로봇하드웨어는소프트뱅크가제작하는방식으로 페퍼 와 나오미 로봇을개발했는데, 이로봇들은서비스로봇및교육용로봇으로활용되고있다. 금융권에서는싱가포르 DBS 은행, 호주뉴질랜드은행, 미국시티은행, 캐나다로열은행이고객의금융자산관리를위한자문및상담서비스에활용중이다. 의료계에서는더욱활발히활용되고있는데, 미국뉴욕메모리얼슬론케터링암센터와 MD앤더슨암센터에서는암진단및최적의치료법검색등에이용하고있다. 아울러, 조지아텍대학에서는학생들의과제점검및질의에대해답변하는 5
< 인공지능양대산맥인 IBM 과구글 > 조교역할을담당하고있으며미국군인전문보험회사 (USAA) 에서는전역군인들이사회복귀에필요한상담을하고있다. 현재의상담은보통인터넷채팅을위한챗봇 (chat-bot) 형태로제공하고있지만, 조만간실제음성상담서비스도가능하게될것으로예상된다. 우리나라에서도가천길길병원, 롯데그룹, SK C&C 등에서암진단, 고객쇼핑정보제공등에활용하고있다. 4 IBM 기술개발 IBM은인지컴퓨팅관련해서세계에서가장많은특허를보유하고있는기업으로주로자체연구개발을통해 AI 기술을개발하고있다. 하지만, 코그노스, 파이텔, 트루벤, 바이텔과같은스타트업들도인수합병함으로서우수기술을아웃소싱하기도한다. 또한, 전세계 100개대학에서왓슨과관련된교과과정을운영할수있도록지원해차세대 AI 연구자양성에기여하고, 세계유수대학에서관련인재를적극채용하고있으며, ' 왓슨아카데미 ' 를운영함으로써인지컴퓨팅소프트웨어개발생태계를구축하는데에도노력을기울이고있다. 6
5 구글알파고 (AlphaGo) 구글은 2016년 3월이세돌 9단과의바둑시합에서 4승 1패로이긴 알파고 라는인공지능으로 AI 기업으로서의위상을높였다. 알파고는영국출신 딥마인드 (Deep Mind) 라는스타트업을구글이인수해개발한바둑에특화된인공지능인데, 우주에존재하는원자의수보다많은경우의수를가진바둑에서인간챔피언에게승리를거둠으로써세상을놀라게했다. 참고로알파고는최고라는뜻의 알파 (Alpha)' 와바둑의 고 (Go)' 의합성어로 바둑을위한최고의인공지능 이라는의미를가진다. 알파고는머신러닝기술을바탕으로기존의바둑기보를통해스스로학습하고, 정책망과가치망이라는두가지신경망을이용해수많은경우의수중에가장유리한수를선택하도록설계되어있다. 알파고는우선바둑에최적화되어만들어져있으나 AI 엔진자체는다른분야로확대해사용이가능하기때문에다양한분야에활용이가능하다고한다. < 이세돌 9 단과의알파고와의바둑대결 > 6 구글 AI 활용 이미구글의 AI 기술은우리들이인지하지못하는사이에구글번역기, 구글포토, 구글나우 ( 음성검색 ), 구글지도, 지메일, 구글클라우드등의구글서비스및 구글카를개발하는데활용되고있다. 7
< 인공지능양대산맥인 IBM 과구글 > 예를들면구글에서이미지를키워드를가지고검색하면관련된이미지들이많이찾아지는데, 이들이미지들은예전과같이사람이태그를달아둔것이아니라 AI가사진을분석해태그를달고그태그를이용해검색을하는것이다. 구글번역기는 2016년 11월부터 AI 기술을도입해성능을향상시켰는데, 원어민실력을 100점으로했을때구글 AI 번역은 60~70점수준으로기존구글번역 (30~40점) 에비해월등히성능이향상되었고 ( 통번역사는 90점수준 ), 어느정도의비속어나줄임말도번역이가능하다고한다. AI가적용되는대표적예중의하나가자율주행차인데, 구글카에도이 AI 기술이접목되어있다. 우리생각과는달리자율주행차에적용되는 AI는상대적으로낮은수준의인공지능이라고한다. 이외에도영상프로세싱, 웹사이트랭킹및트렌드예측기능등에도 AI를접목해서지속적으로서비스를발전시켜나가고있다. 최근구글은 AI를자체서비스외에도다양한산업분야에적용하려는시도를하고있는데, IBM과마찬가지로의료나헬스케어분야로의진출을가장먼저꾀하고있다. 구글딥마인드는 2016년헬스케어부서를신설하고여러병원과협약을맺어의료관련 AI 기술을사업화중이다. 영국의더로얄프리 (The Royal Free) 병원과는 스트림스 (Streams) 라는환자상태를체크하는모바일앱을개발하였는데, 이앱은신장질환환자를모니터링하여급성신부전증과같은치명적인질환의전조가감지되면환자와병원에게경고를보내게된다. 모어필드안과병원 (Moorfields Eye Hospital) 과는안저 ( 안구의안쪽 ) 사진을분석해당뇨성망막병증을진단할수있는프로그램을개발했는데안과전문의보다더정확하게진단할수있다고한다. 구글 AI의사업화는아직시작단계로아직 IBM에비해서는뒤쳐져있다. 7 구글의 AI 기술확보방법 구글은적극적으로 AI 스타트업들을인수합병함으로써기술을확보해나가고있다. 사진분류기술을가진 DNN리서치, 알파고를개발한 딥마인드, 자연어처리기술을가진 다크블루랩, 문서해독기술을가진 비전팩토리, 이미지인식기술을보유한 제트팩, 3차원이미지인식기술을가진 무드스톡스 등지금까지총 9개의인공지능기업을인수하였다. 구글은핵심인력을확보하기위해기업을인수하는경우도종종있는데, 예를들면딥러닝이라는개념을처음제안한 AI계의거장인제프리힌튼교수 ( 토론토대 ) 를영입하기위해그가설립한 DNN리서치를인수하였다. 8
8 구글의 AI 생태계 구글은개발한 AI 프로그램을공개하고다양한산업의파트너들과협업을하고있다. 2015년에는 텐서플로 (Tensor Flow) 라는 AI 엔진을오픈소스로공개하여많은기업들이 AI 솔루션을개발할수있도록하였고, 2016년말에는개발한 AI의성능테스트를위한플랫폼인 딥마인드랩 (DeepMind Lab) 도추가로공개하였다. AI 솔루션은개발하더라도그성능을검증하고테스트하는것이어려운데구글은딥마인드에서 AI 성능테스트에사용하던프로그램 (3차원미로게임등 ) 을제공하여개발한 AI의성능을확인해볼수있도록지원하는것이다. 그럼구글은왜이렇게많은돈과시간을들여개발한 AI 기술들을무료로공개하는것일까? AI 기술의공개는파트너기업들을확보하여 AI 생태계를구축하고, 양질의데이터를많이수집하기위해서다. 이는스마트폰의안드로이드생태계구축과비슷한데, 안드로이드운영체제를오픈소스로공개하여많은제조업체에서사용하도록하고, 구글은안드로이드가탑재된스마트폰으로부터데이터들을수집하여광고와같은다양한사업에활용하는것이다. 9
< 인공지능양대산맥인 IBM 과구글 > 인공지능의기반이되는머신러닝은기존데이터의패턴을기반으로새로운질문에답을찾는알고리즘으로양질의데이터를확보하는것이 AI 성능향상에있어핵심이라고할수있다. 바로이때문에구글이 AI 기술을공개하여많은사업파트너들을끌어들여자사의 AI 엔진을사용하도록하고, 파트너들이 AI 엔진을이용해데이터를분석할때그데이터를축적했다향후활용하려는것이다. 9 IBM 왓슨과구글알파고의차이점 IBM 왓슨과구글알파고중어느 AI가더우수한가라는질문에대해업계전문가들은두개를비교하는것은사과와오렌지를비교하는것처럼답이없다고말한다. 모두목적이다르고적용분야에차이가있기때문에직접비교가어렵다는것이다. 하지만상용화부분에있어서는왓슨이, 학술적인부분에있어서는알파고가앞서있다는것이일반적인평가다. 두 AI의큰차이점은 IBM 왓슨이사람이더나은결정내리도록돕는 의사결정지원 에중점을두고있는데반해, 알파고는 자체적으로의사결정 을내리는데있다고볼수있다. 이세돌 9단과의바둑시합을보면알파고는스스로사고하고판단하여다음수를놓고있다. 즉, 스스로결정을하는것이다. 하지만 IBM 왓슨은병원등에서 MRI, CT 등의영상자료및생체신호를분석하여의심되는질병과이를효과적으로치료할수있는치료법을의사에게제안만한다. 그결정자체는의사가하는것이다. < 구글의분산컴퓨팅시스템 > < IBM 왓슨슈퍼컴퓨터 > 10
또다른차이점은그 AI를운영하는컴퓨터하드웨어구성의차이다. IBM은주로하나의슈퍼컴퓨터를활용하는데비해구글은 PC와같이소형컴퓨터를여러대연결한분산컴퓨팅을기반으로하고있다. 구글은 AI를위해신형양자컴퓨터까지도입을시도하고있는것으로알려져있는데, 양자컴퓨터는일반컴퓨터에비해한번에처리할수있는데이터의양이많을뿐만아니라처리시간도짧아져 AI의학습속도를획기적으로높일수있기때문이다. 두기업이머신러닝기술중딥러닝기술을통해 AI 를훈련시키는것을동일하지만, IBM 왓슨은사람이정리한자료나논문을사용해교육을하고, 구글의 AI 는방대한 인터넷자료를기반으로학습을하고있다. IBM 왓슨은의학, 법률등특정분야에서논문등전문자료를사용해맞춤형교육을받고있다고볼수있는데, 왓슨은사람이가공한데이터를가지고자체데이터베이스를만든후이를활용해답변을찾으므로미리데이터베이스화가되어있지않은부분에대해서는대답을할수없다는단점도가지게된다. IBM은 AI 교육에필요한데이터를확보하기위해노력하고있는데, 600 페타바이트에이르는의료데이터를확보하기위해 2016년건강정보데이터베이스업체인 트루벨헬스어낼리틱스 를 3.2조원에인수하기도했다. 이에비해구글은검색엔진이나안드로이드스마트폰, 유튜브등으로부터방대한양의사용자데이터들을확보할수있기때문에, 이런풍부한데이터를가지고패턴인식을통해 AI를교육시키고있다. 구글 AI의훈련의예로써고양이사진인식훈련이있는데많은고양이사진을데이터로제공하여고양이특징을인공지능이스스로인식하도록함으로써나중에사람보다정확하게고양이사진을판독해낼수있었다. 두기업이 AI에접근법에대한차이는기업들의목표고객이다르기때문일수도있다. 즉, IBM은기업과기업간사업 (B2B; Business to Business) 에포커스를맞추고있어고객사의요구에따라왓슨을특정목적에맞춰집중훈련시키는데반해, 구글은기업대개인 (B2C; Business to Customer) 을주로목표로했기때문에특정분야에맞춤형기술보다는막대한양의데이터를활용해보다범용적인기술을개발하는것일수도있다. 11
< 인공지능양대산맥인 IBM 과구글 > 10 맺음말 구글이더우수하냐, IBM이더우수하냐는것은중요하지않다. 이것은마치태권브이와마징가중누가더세냐와같은질문일수있다. 분명한것은이두미국기업들이 AI 기술의발전을선도해나가고있고, 이들이개발한 AI가우리의일상생활에서점점더많이사용되고있다는것이다. AI가사람을대체해일자리가없어진다는우려도나오고있지만우리의삶을편하게해주고있는것만은부인할수없는사실이다. 앞으로두기업의 AI 기술이어떻게발전되어우리를깜짝놀라게해줄지기대해보자. 12
GT 심층분석보고서 인공지능양대산맥인 IBM 과구글 발행일 : 2017년 3월 1일발행처 : 한국산업기술평가관리원가격 : 비매품 13