디지에코보고서 2018.2.6 Issue&Trend 인공지능으로날개단자동통번역서비스 kt 경제경영연구소김슬기 (sulki.kim@kt.com) I. 자동통번역서비스의진화 II. 국내외사업자의자동통번역서비스현황 III. 시사점 자동통번역서비스는 1990년대부터본격적으로개발되기시작했지만번역결과의품질이매우낮아실생활에서크게쓰이기힘들었다. 그러나 16년하반기들어인공지능 (AI) 이적용된신경망기계번역 (NMT) 기술로진화하며번역품질이급격히향상되었다. 자동통번역서비스는여전히인간통번역사를완벽히대체할수있는수준은아니지만다양한언어의존재로인한의사소통의어려움을예전보다한층줄여나가고있다. 본보고서는자동통번역서비스의기술진화가어떻게이뤄지고있는지알아보고, 구글, 네이버, 시스트란등을비롯한국내외사업자들의자동통번역서비스현황을살펴본후, 이에대한시사 점을발굴해보고자한다.
I. 자동통번역서비스의진화 자동통번역서비스정의및전망 1990년대부터개발이본격화된 자동통번역서비스 는 16년말이후인공지능기반번역기술의발전으로활용도가획기적으로높아지는중 - 최근 TV 프로그램중해외여행촬영시등장, 실생활에서의높은활용성보여줌 KBS 나혼자산다中 SBS 미운우리새끼中 ( 정의 ) 자동통번역서비스는컴퓨터의처리능력을활용해어떤언어를다른언어 로변환하는서비스를일컬음 - 자동통역과자동번역의차이점은말소리를옮기는것과텍스트를옮기는것의차이 - 자동통역은음성인식 (Auto Speech Recognition, ASR), 음성언어번역 (Spoken Language Translation, SLT), 음성합성 (Text-to-Speech, TTS) 기술로구성, 비문이많고문장전체에 대한정보가부족해난이도높음 - 자동번역은전체텍스트정보가입력되고문단구분 / 문장부호등의정보가존재하므로 난이도가낮은편 ( 전망 ) 자동통번역시장은향후지속발전될것으로전망, 구글 / 네이버등국내외 ICT기업은고유의인공지능기반기계번역기술을개발해활발히서비스중 - 시장조사업체윈터그린리서치는자동통번역글로벌시장규모가 2012년 6억달러에서 2019년 69억달러 (8조원대) 로성장할것이라고전망 - 그랜드뷰리서치는기계번역의시장규모가 2022 년에약 10 억달러에이를것으로전망 함 2
자동통번역기술의변천 자동통번역기술은 규칙기반기계번역 에서 통계기반기계번역 발전했고, 최근엔사람의뇌가학습하는과정을본딴 신경망기계번역 으로진화함 - 원어민의언어구사능력을 100점으로본다면전문통번역사는 90점, 신경망기계번역은 60~70점, 통계기반기계번역은 30~40점정도로추정 1. 규칙기반기계번역 (RBMT, Rule-based Machine Translation) - 기계번역초반에많이사용했던기술로, 개발자가직접정의한규칙에따라번역 정의된규칙에맞게작성된올바른문장을입력해야정확한결과를얻을수있음 번역기내새로운언어가추가될때마다해당언어에능통한개발인력필요 2. 통계기반기계번역 (SMT, Statistical Machine Translation) - 빅데이터분석역량확보이후사용된기술로, 단어나구단위로쪼개번역후, 다른언어의어순에맞춰나열하는방식 수많은번역데이터의통계결과를추출해결과를제시하여상대적으로넓은범위의결과제공가능 최소 200만개이상의번역데이터필요하므로, 분석시간과비용많이소요 어순이다른언어의경우문법문제존재 3. 신경망기계번역 (NMT, Neural Machine Translation) - 문장전체의정보를사용해전체문맥을파악한후단어순서, 문맥의미등을반영해번역 인간이구사하는언어와유사하게번역하며더정확하고자연스러운결과가도출됨 - AI 가스스로학습하기때문에번역이용자가늘고데이터가많아지면품질지속향상 3
됨 II. 국내외사업자의자동통번역서비스동향 글로벌사업자 구글 - 07 년통계기반기계번역 (SMT) 을적용한 구글번역기 (Google translator) 런칭 전세계 5 억명이상사용자, 103 개언어지원, 매일 1400 억개의단어번역실행 - 14 년카메라기반번역앱 워드렌즈 (Word Lens) 를개발한퀘스트비주얼인수 스마트폰카메라에비춰진글자를즉시영어로전환해번역하는기술을앱내적용 - 16.10 월 구글신경망기계번역 (GNMT) 으로시스템전환후품질향상 적용이후구글번역오류가 55%~85% 감소, 지난 10 년보다더높은성능개선보임 한국어에 GNMT 도입후 2 개월간영어 - 한국어번역트래픽이 50% 이상증가하여 성능향상이실제사용자의사용빈도증가에영향미침 - 17.10 월, 구글스마트폰시리즈 픽셀 2 내인이어통역기 픽셀버드 (Pixel Buds) 발표 기본적으로스마트폰무선이어폰기능을수행하며, 여기에구글어시스턴트가탑재 되어실시간으로 40 개의언어번역가능 (159 달러 ) 구글번역앱내 워드렌즈 활용장면 구글픽셀버드 4
마이크로소프트 - 13.6 월윈도우용빙 (Bing) 번역기출시, 15.8 월번역앱 Microsoft translator 출시 - 14.11 월스카이프 (Skype) 내실시간음성번역서비스프리뷰제공 최대 50 개언어텍스트번역, 영어 / 프랑스어 / 스페인어등 7 개언어는음성번역가능 - 16.11 월신경망기계번역 (NMT) 적용, 영어, 독일어, 아랍어, 한국어등 11 개언어지원 개발자의경우추가비용없이통번역 API 적용가능 스카이프실시간음성번역서비스 페이스북 - 페이스북앱내번역을위한기술개발, 매일 45 억개의문장번역 속어나은어, 오타, 문맥을고려한단어등도원활하게번역가능 - 17.5 월페이스북인공지능연구소는컨볼루션신경망 (Convolutional neural network, CNN) 을이용한번역기술을오픈소스로공개함 CNN 적용후번역속도를기존보다 9배향상시키고 11% 더정확한결과제시 아마존 - 15.9월인공지능번역업체사파바 (Safaba) 를인수, 아마존닷컴등사이트내다국어번역을제공 - 17.11 월아마존웹서비스 (AWS) 내개발자를위한번역서비스를제공할계획 17.11 월미국라스베이거스에서열리는리 : 인벤트콘퍼런스내발표예상 5
국내사업자 네이버 - 16.8 월자동통번역서비스 파파고 베타버전출시, 17.7 월앱 / 웹버전정식오픈 - 16.10 월한 - 영번역시 N2MT(Naver Neural Machine Translation) 기술적용 라이브스트리밍브이 (V) 앱, 웹툰, 쇼핑등데이터를수집해 NMT 고도화에활용하여일상생활표현, 신조어, 구어체등에서경쟁력확보 현재 6개언어지원, 향후베트남어, 인도네시아어, 태국어추가예정 - 17.8월출시된네이버의인공지능스피커 웨이브 에탑재 - 18 년중동시통역이어폰마스 (Mars) 출시예정 네이버파파고 네이버마스 (MARS) 시스트란인터내셔널 - 14.5 월프랑스의글로벌 1 위자동번역솔루션업체 시스트란 (Systran) 을우리나라번역 SW 기업인 CSLi 가 550 억원에인수하여 시스트란인터내셔널 설립 - 자동통번역솔루션소프트웨어제공, 산업별특화솔루션이장점 - 16.1 월 CES 2016 에서 그린광학 과함께동시통역가능한안경형통역기출품 시스트란안경형통역기 시스트란안경형통역기시연 6
- 16.8 월부터인공신경망기술기반기계번역엔진 PNMT(Pure Neural Machine Translation) 을프랑스등유럽국가에서판매시작, 11 월에한국및아시아로확대 - 17.8 월 SK 텔레콤의인공지능스피커인 누구 (NUGU) 미니 내한영사전서비스로탑재 한영사전을실행해자신이알고싶은영어단어를한국어로말하면 누구미니 가영어로답하는방식 한컴인터프리 - 16.7월한국전자통신연구원 (ETRI) 가 2008년부터개발한 지니톡 을기술이전받아 한컴말랑말랑지니톡 상용화 - 17.2 월 NMT 기술적용발표 - 17.2 월 MWC2017 에서넥밴드형태의통역기 한컴말랑말랑지니톡웨어러블 출품 4 개언어가능, 사용자간거리가가까워지면자동으로연결, 자동언어셋팅 - 2018 평창동계올림픽공식통번역소프트웨어선정, 8 개언어서비스예정 - 퓨처로봇 과협력하여 통역하는안내로봇 을공동개발하여올림픽기간동안선보일 계획 지니톡평창올림픽적용홍보행사 통역하는안내로봇 플리토 - 12.9 월전문가, 일반인들이참여할수있는집단지성번역서비스플랫폼출시 173 개국 120 만명의번역가기반집단지성활용 (18 개언어 260 자까지번역가능 ) - 17.9 월인공신경망기반자동번역적용으로인간과기계번역협업시도 7
카카오 - 17.9 월 NMT 기술적용한 AI 번역베타서비스시작 카카오가개발한인공지능플랫폼카카오아이 (kakao i) 의번역엔진적용 카카오아이소개 III. 시사점 신경망기계번역, 데이터확보및학습지속되면발전속도커질것 구글, 네이버, MS 등주요사업자들이대부분신경망기계번역으로전환, 스스로학습하면서더정확한결과값기대가능 품질향상을위해크라우드소싱 (crowd sourcing) 을통해향상중 - 구글, 번역커뮤니티 운영, 2개국어이상익숙한사용자들이직접참여해번역문장과기존번역수정을수행, 구글번역알고리즘개선에활용 - 네이버파파고짐 (Gym), 주어진문장을보고그아래제시된여러개의번역문장중 적절한것을선택하거나더나은번역을제안, 파파고학습데이터및번역결과로활용 8
구글번역커뮤니티 네이버파파고짐 (Gym) 실시간통번역서비스을위한기기다변화및음성인식기술발전 텍스트입력기반의자동번역에서나아가음성을알아듣고실시간자동통역을수월하게해줄수있는디바이스로확대다변화중 - 이어폰, HMD 등웨어러블기기 : 구글 픽셀버드 및 안드로이드웨어, 일본 Logbar 사의 목걸이형통역기, 시스트란 안경형디스플레이, 네이버 마스 등 - 인공지능스피커 : 네이버파파고의 웨이브 적용, 시스트란의 SK 누구미니 적용 - 로봇 : 한컴인터프리 통역하는안내로봇 등 음성인식 (ASR) 분야도함께발전해야실시간자동통역품질향상가능 - 글로벌은뉘앙스, 구글, 애플등업체가주도중이지만, 국내에도 AI 스피커붐이일면 서국내기업들도음성인식연구활발, 기술력향상중 국내기술발전을위한기업투자및정부지원강화되어야함 한국어및아시아권언어에강점확보해블루오션개척필요 - 구글등해외사업자는영어기반언어의정확성은높으나아시아언어이해부족, 데이터확보부족문제등허들존재 기업들의적극적투자및정부차원의지원전략으로서비스경쟁력을높일필요 - 국내업체대부분독자기술개발 기술개발을넘어사업화를위한체계적전략 / 지원 확보필요 9
참고자료 - 자동통번역에대한국내외기술및시장동향 ( 융합연구정책센터김상식, 17.4.10) - 딥러닝으로탄력받는자동통번역 ( 정보통신기술진흥센터, 16.3) - 인공지능스스로번역 척척, NMT 기술이란? ( 머니투데이, 16.12.17) - 생각보다괜찮은데 카카오도 AI 기계번역 구글 네이버와 3 파전 ( 조선비즈, 17.10.8) - " 파파고트레이너되어달라 "... 사람에게도움청한네이버 AI 번역 ( 조선비즈, 17.11.18) - " 아마존, 번역서비스로구글과경쟁 " ( 연합뉴스 17.6.27) - "' 지니톡 ' 으로평창올림픽언어장벽없애요 ( 연합뉴스 16.10.9) - 인공신경망 VS 통계기반번역, 뭐가다를까? (ZDnet, 16.12.25) 10