최신 ICT 이슈 딥러닝으로탄력받는자동통번역 * 1. 자동통번역개요 최근자동통역 SW/ 서비스사용이증가하는반면, 통역품질은아직미흡 구글번역기및지니톡등자동통번역관련애플리케이션의사용자증가추세 - 국내기업의해외진출ㆍ여행ㆍ쇼핑 ( 해외직구 ) 확대에따른통번역수요가증가 - 머신러닝등인공지능기술의발달로애플리케이션품질이향상되고있으며간단한회화및번역가능 지니톡은 ETRI( 한국전자통신연구원 ) 에서개발한자동통번역애플리케이션으로 2015 년까지무료로 220 만건다운로드 아직통번역품질은미흡하지만점점정확성이높아지면서활용증가 - 영어기반은활용가능한음성및텍스트 DB 가많아정확성이높으며정확도는 70 ~80% 수준 - 반면, 한국어를비롯하여베트남, 태국어등아시아권언어는언어특성상개발이어렵고데이터확보가쉽지않아품질향상에어려움 그러나통번역기술이인공지능기술의발전과함께부상중 자동통ㆍ번역시스템이인공지능의한분야로각광받으면서차세대신기술로부상 - 일본총무성은글로벌화추세에따라자동통번역기술확보가국가경쟁력과직결된다고선언 - 가트너는 음성자동통역 (Speech-to-Speech) 을 5~10 년내가장유망한미래기술로전망 자동통번역기술개요 자동통번역기술은크게음성인식 - 자동번역 - 음성합성의 3 단계를거치며, 음성인식과 * 본내용과관련된사항은산업분석팀 ( 042-612-8220, pink@iitp.kr) 으로문의하시기바랍니다. ** 본내용은필자의주관적인의견이며 IITP 의공식적인입장이아님을밝힙니다. 23
주간기술동향 2016. 3. 23. 자동번역은인공지능기술의접목으로급격히발전 - 특히, 음성인식 (ASR) 과자동번역 (MT) 두기술이핵심으로, 현재음성인식기술은상당한수준에도달하였고, 자동번역은딥러닝기술이적용되면서빠르게발전중 자동번역은 Machine Translation( 기계번역 ) 으로도명명되며, 사람의손을거치지않고컴퓨터를이용한번역을의미 음성인식 (Auto Speech Recognition: ASR) 은통번역기술뿐만아니라스마트폰의인공비서서비스, 자동응답서비스등인공지능에서중요한기능으로발전 - 아이폰의 시리 (Siri), 구글의 나우, MS 의 코타나, 삼성의 S 보이스, LG 의 Q보이스등에적용되고있음 - 음성인식업체로는뉘앙스가세계최고의기술을보유하고있으나아이프라이텍 (iflytek) 등중국의추격도만만치않음 자동번역 (Machine Translation, MT) 현황 자동번역기술은크게규칙기반 (Rule-Based Machine Translation: RBMT) 과통계기반 (Statistical Machine Translation: SMT), 이를합한하이브리드 (RBMT+SMT) 기반으로구별 - 규칙기반 (RBMT) 은어법을규칙화하여번역하는방법으로기존번역 SW 의방법이며, 정확성이높고분야별전문성으로가지고있으나개발에어려움 - 통계기반 (SMT) 은방대한양의대역코퍼스 (bilingual corpus) 를바탕으로, 통계적규칙을모델링하여번역하는방법으로딥러닝기술과빅데이터기술로코퍼스확보에용이 대역코퍼스 (bilingual corpus) 란언어를연구하는데필요한연구재료를뜻하며, 통번역분야에서는대규모언어데이터베이스를의미 2. 해외현황 해외기업현황 규칙기반 (RBMT) 은 SDL 이, 통계기반 (SMT) 은구글, MS 등글로벌기업들이, 하이브리드기반 (RBMT+SMT) 은시스트란이주도 - 기존의통번역 SW 솔루션에서 Web-Base Application 으로통번역흐름이바뀌고 24 www.iitp.kr
있으나품질및보안상의이유로기업과공공부문에서는아직까지 SW 솔루션을많이사용하고있으며, 최근구글및 MS 의번역애플리케이션확산으로자동번역이대중화 - 시스트란, SDL 은세계적인자동통번역 SW 기업으로기업과공공부분의고객들을많이보유하고있으나최근통번역애플리케이션의영향으로다양한사업모델을출시ㆍ계획 인공지능기술가속화에따라통번역기술은급격히향상 - 구글, MS 등해외글로벌업체들의딥러닝, 머신러닝같은인공지능 (AI) 기술과맞물려자동통번역정확성이높아지고있음 - 시스트란은 135 개에이르는언어를지원하며, 특히 DNN(Deep Neural Network) 기반으로한언어인지모듈 ( 감정인식, 문서요약, NER 등 ) 출시 (2016. 4.) 예정 - 구글은증강현실애플리케이션 퀘스트비주얼 을인수, 이미지번역을시작하였으며통계기반의구글번역기를무료로서비스, 자동통번역을포함한인공지능시장을적극공략 100 개언어대상으로높은수준의영어기반통번역서비스를제공하고있고, 이미지인식및실시간채팅등의부가서비스를제공 - MS 는스카이프트랜스레이터를통해실시간채팅시통번역서비스를제공 세계시장규모 자동통번역관련세계시장은형성초기단계로 2019 년까지 69 억달러 ( 약 8 조원 ) 로성장전망 ( 출처 : 윈터그린리서치 ) - 음성인식관련세계시장은연 16.2%, 2017 년 1,130 억달러규모로성장예상 ( 로봇등연관시장포함 )( 출처 : BCC research, 2013.) - 자동번역시장규모는 2022 년 9 억 8,330 만달러로성장전망 ( 출처 : Grand View Research) - 그외에도세계통번역및현지화시장규모는약 40 조원에이르며, 이가운데통번역관련 SW 시장규모는 5 조원, 국내통번역및현지화시장은 500 억규모로전망 ( 출처 : ITDAILY, 2015. 6. 1.) 25
주간기술동향 2016. 3. 23. 3. 현지화시장 국내통번역시장현황 네이버번역기, ETRI 가개발한지니톡, CSLi( 현시스트란 ) 가개발한 S 번역기등국내번역기품질은우수하며, 불어, 스페인어등으로지원언어확대중 - 네이버 는인공지능기술을바탕으로네이버번역기를개발, 최근 15 개언어지원을전략수립하였으며, 참여번역서비스및라인과연계하여사용확대유도 2015 아시아번역품질평가대회 (Workshop on Asian Translation) 에서한국어 -일본어분야 1 등수상, 라인번역봇, 라인딕셔너리등서비스의다양화추진 - 자동번역솔루션기업인 CSLi 는세계 1 위번역기술을보유한시스트란을인수, 사명을 시스트란인터내셔널 로변경하였으며 ETRI 의 지니톡 을기술이전 시스트란은중국 킹소프트 와라인센스계약 (2016. 1.), 한글과컴퓨터 와합작회사 ( 한컴인터프리 ) 설립, 개발자플랫폼출시 (2016. 4.) 등적극적시장확대 - 번역관련통합플랫폼 플리토 (Flitto) 는 집단지성번역플랫폼 이라는전략하에, 사람들이실시간번역에참여하여 1:1 로번역해주는서비스를실시 플리토는 170 여개국 370 만사용자가 18 개언어로이용중이며, 하루요청건수만 7 만건에달함 국내에서주로이용되는번역기로는구글번역기와네이버번역기, S 번역기 - 국내용번역기로는네이버번역기를비롯하여지니톡, S 번역기등이있으며구글번역기가별도의애플리케이션을제공하고있고네이버는사전과함께제공 - 최근네이버는번역기대회에서대상을수상하며품질의우수성을인증받았고 S 번역기는삼성갤럭시폰에탑재 평창동계올림픽대응현황 미래부는문체부등과연계하여 2018 년평창동계올림픽을목표로자동통역서비스의기술개발및지원사업을추진중에있으며한 7 개국어간의통역을목표로준비중 - 기존의한 영, 한 일, 한 중 3 개국어에서한 스페인, 한 프랑스, 한 독, 한 러등총 7 개국어를지원할예정이며통역성공률 80% 를목표 26 www.iitp.kr
- 인터넷과연계된서버접속형및서버접속이필요없는단말탑재형두가지로서 비스예정 4. 최근이슈 (ISSUEⅠ) 다양한디바이스로의진화 최근통번역 SW ㆍ서비스는스마트폰을넘어스마트워치, HMD 등다양한디바이스로확대되며진화 - CES 2016 에서일본 Logbar 사는휴대용통역기 ILI 를, 한국 시스트란 도 그린광학 과함께웨어러블통역 HMD 기기발표 - 구글은스마트워치용운용체계 (OS) 인 안드로이드웨어 (Android Wear) 에 44 개언어로자동번역되는기능을추가 (ISSUE Ⅱ) 공개플랫폼으로시작되는플랫폼경쟁 구글, IBM 등해외기업및네이버, 시스트란같은국내업체들도플랫폼공개를통한시장선점및확대전략추진 - 구글이 텐서플로우 (Tensor Flow) 를공개하면서본격적인인공지능플랫폼개방전략추진 - IBM 은기존하드웨어중심에서인공지능 (AI) 으로역량을집중하면서왓슨을기반으로한플랫폼을공개 - 시스트란은안보, IT, 특허, 관광등전문분야에서 on-premise( 직접설치 ) 시장 1 위의경험을바탕으로크라우드시장에서도우위를점하기위해플랫폼공개 기계번역, 자연어처리, 음성인식, 광학인식 (OCR), 위치인식등을 API 형태로제공 - 국내네이버와시스트란도플랫폼공개추진 다른산업과의연계를통한이종산업간플랫폼경쟁으로확대전망 (ISSUE Ⅲ) 실시간동시통역으로진화되는통번역시장 자동통번역은실시간동시통역으로진화될것으로전망되며빅데이터와머신러닝기술 의발달로실현가능성확대 27
주간기술동향 2016. 3. 23. - MS 의클라우드기반자동번역서비스인 스카이프트랜스레이터 (Skype Translator) 는 14 개언어를대상으로동시통역서비스를시작 (ISSUE Ⅳ) C-P-N-D 를아우르는자동통번역서비스전략 플랫폼공개및디바이스개발을기반으로통합 C-P-N-D 전략확산 C( 콘텐츠 ) 는애플리케이션의다양화및부가서비스확대를통한편의성증대 P( 플랫폼 ) 은공개플랫폼전략을통한동종, 이종산업간의서비스확대 N( 네트워크 ) 는서버접속형및서버접속불가한단말기형태등네트워크에영향을받지않는서비스제공 D( 디바이스 ) 는스마트폰을벗어나시계, 안경, 단말기등다양한디바이스를개발 품질향상과더불어이미지인식, 번역참여서비스등부가서비스를통한가치증대 - 구글은머신러닝을활용하여구글번역기오류율을최근 2 년간 23% 8% 로개선하였고, 네이버는번역참여를통한번역품질향상및자동완성기능등부가서비스확대 (ISSUE Ⅴ) 서비스확산에어려움을겪는국내업체 국내기술력은부분적으로우수하지만국내서비스에한정되는등세계적인서비스로발전하기에는부족 - 대부분의통번역서비스가국내에한정되어있고기존의통번역애플리케이션의보급으로국내기업들의애플리케이션확산에어려움 - 네이버는한국어를기본으로한 중, 한 일등지원언어를확대하고 SNS 서비스 Line( 라인 ) 을통한글로벌화의일환으로사전ㆍ번역서비스추가 (ISSUE Ⅵ) 다양한분야로활용되는음성인식기술 왓슨 (IBM), 페퍼 ( 소프트뱅크 ) 와같이로봇에서음성인식 (SR) 기능이활용되면서자동번역 (MT) 과함께음성인식기술도급부상 - 제 1 세대단순음성 ( 단어 ) 인식에서제 3 세대문장추론을통한대답기능까지인공지능, 로봇등의핵심기능으로진화 - 음성인식관련기술은해외기업에는열세이지만, 국내의경우 ETRI 등에서기술력확보하고있고일부스타트업에서연구중 28 www.iitp.kr
5. 맺음말 국내업체들의적극적인투자및업체간협력필요 한글기반자동통번역관련기술력은보유하고있으나사업화를위한적극적이고체계적인투자및전략필요 - 일부기업이해외기업인수및협력관계를구축하고있으나기술력대비대외인지도및편의성부족으로사업화단계투자확대및체계적마케팅전략필요 업체간협력및스타트업인수등전략적대응필요 - 해외는스타트업인수, M&A 등을통해효율적이고발빠르게대응하는반면, 국내기업들은독자적인개발을선호하고있어속도경쟁에서불리 - 국내업체들간의협력및합병을통해지원언어쌍확대및해외협력활동증대필요 자동통번역시장에맞는전략필요 한국어를기반으로하는아시아언어를중심으로기술선점필요 - 글로벌기업들은영어를기반으로정확성이높지만아시아언어는언어의이해및예문확보에어려움이있으므로아시아권언어를중심으로기반을구축하여해외업체들에대비 동시통번역을위한 C-P-N-D 통합전략확대 - 최근다양한디바이스와플랫폼공개로 C-P-N-D 통합전략이가능해짐에따라국내업체들도콘텐츠강화, 플랫폼개방, 디바이스개발등을아우르며시너지효과를낼수있는통합전략필요 정부의장기적인지원및산ㆍ학ㆍ연협력관계구축 최근 알파고 와이세돌의바둑대결에서보듯이인공지능에대한관심이증폭되고있는가운데일시적인관심보다는장기적인지원이중요 인공지능의확산을위해산ㆍ학ㆍ연협력관계구축필요 - 인공지능은학문적인성격이강하므로대학에서부터기초학문에집중하고기업체의적극적인 R&D 투자와연구소들의고비용ㆍ장기성과제수행이필요 - 폐쇄적인국내문화와반대로인공지능이오픈화되어가는추세에맞춰국내업체들간의기술교류및협력관계필요 29