중소 중견기업기술로드맵 2017-2019 Technology Roadmap for SME - 데이터인텔리전스 -
CONTENTS 전략분야 데이터인텔리전스 1. 개요 1 2. 국내외정책동향 4 3. 산업이슈및동향 10 4. 시장동향및전망 16 5. 기술동향및이슈 20 6. 중소기업시장대응전략 21 7. 중소기업전략제품 22 전략제품 빅데이터기반 SW 1. 개요 29 2. 산업환경분석 39 3. 시장환경분석 47 4. 기술환경분석 52 5. 중소기업환경 70 6. 기술로드맵기획 78 클라우드기반 SW 1. 개요 85 2. 산업환경분석 92 3. 시장환경분석 103 4. 기술환경분석 107 5. 중소기업환경 134 6. 기술로드맵기획 142
음성인식 SW 1. 개요 149 2. 산업환경분석 154 3. 시장환경분석 160 4. 기술환경분석 163 5. 중소기업환경 181 6. 기술로드맵기획 189 데이터보안및비식별화 1. 개요 195 2. 산업환경분석 206 3. 시장환경분석 214 4. 기술환경분석 219 5. 중소기업환경 243 6. 기술로드맵기획 251 영상처리시스템 1. 개요 257 2. 산업환경분석 262 3. 시장환경분석 268 4. 기술환경분석 271 5. 중소기업환경 285 6. 기술로드맵기획 293 인공지능기반 SW 1. 개요 305 2. 산업환경분석 319 3. 시장환경분석 324 4. 기술환경분석 334 5. 중소기업환경 353 6. 기술로드맵기획 361
데이터인텔리전스 전략분야현황분석
전략분야현황분석 데이터인텔리전스 1. 가. 개요 정의 산업 사회 문화등모든응용분야에서데이터를기반으로서비스목적에부합되도록구현된소 프트웨어를말하며, 이러한소프트웨어는네트워크또는모바일환경에서원하는어플리케이션 서비스등을제공하고, 직접사용하기위한데이터저장, 관리, 보안, 분산및처리, 분석등 사용자의요구에맞는서비스를제공하는소프트웨어를의미함 기존의데이터를단순수집, 저장관리, 분석하는기존역량을넘어서대량의데이터를관리, 분 석, 예측하는소프트웨어를포함 대량의정형또는, 비정형데이터의집합으로부터, 가치를추출하고결과를분석하는기술 IoT(connected home, sensor, and etc.) 와여러장비들이생성하는디지털데이터를처리수용 하기위한 Apache, Hadoop과같은 MapReduce 방식의분산데이터처리프레임워크기술 물리적인컴퓨터리소스의특징을다른시스템, 응용프로그램, 최종사용자들이리소스와상 호작용할수있도록제공관리하는클라우드기반소프트웨어를포함 클라우드를제공하는클라우드제공자와유틸리티컴퓨팅을통하여 SaaS 자가연결되며, 웹어플리케이션을통하여 SaaS 사용자와연결하는기술 제공자와클라우드사용 대용량의데이터를대상으로보다유용한정보도출과정보검색속도 정확성향상을위해학습 하고예측/ 제시하는방향으로발전중인인공지능기반소프트웨어 인간이발생시키는음성신호로부터언어적의미를식별해내는기술 여러비전및영상을데이터가인식하고분석하는기술 시맨틱웹검색, 데이터마이닝, 자연어처리등의기술서비스 또한, 수집또는사용, 저장, 공유되는데이터로부터개인을식별하지못하게조치하는일련의 처리소프트웨어를포함 이러한다양한종류의대규모데이터에대한생성, 수집, 분석, 표현을그특징으로하는데이 터인텔리전스소프트웨어는다변화된현대사회를더욱정확하게예측하여효율적으로작동케 하고개인화된현대사회구성원마다맞춤형정보를제공, 관리, 분석가능케하며과거에는 불가능했던기술을실현시킬수있음 1
데이터인텔리전스 [ 데이터시대로의진입] * 출처 : SW 융합기술로드맵, 정보통신산업진흥원 나. 범위및분류 (1) 범위 데이터인텔리전스는빅데이터기반 SW, 클라우드기반 SW, 음성인식 SW, 데이터보안및비 식별화, 영상처리시스템, 인공지능기반 SW 등을포함 데이터인텔리전스의포함되는주요기술은데이터, 수집, 저장관리, 분산처리, 분석및시각 화등의빅데이터서비스 또한, 가상화모듈, 프로비저닝모듈, 클라우드시스템관리모듈등의구현소프트웨어와 SaaS, PaaS, IaaS 등의클라우드응용서비스모듈을포함 이와함께데이터보안을위한비식별화소프트웨어, 언어및음성인식, 영상처리분석기술, 인공지능을통한여러다양한정보제공서비스등을포함 2
전략분야현황분석 [ 주요제품범위 ] 주요품목 개요 빅데이터기반 SW 클라우드기반 SW 음성인식 SW 데이터보안및비식별화 영상처리시스템 인공지능기반 SW - 빅데이터플랫폼에서데이터를수집, 저장, 분산처리, 검색, 공유, 분석, 시각화등을이용하여데이터를처리하는소프트웨어 - 클라우드기반 SW 는클라우드서비스( 가상의자원을제공하고사용한만큼비용을청구하는서비스) 를이용하여컴퓨터나휴대폰등에불러와서사용하는웹에기반한소프트웨어서비스 - 언어및음성인식기술은컴퓨터와같은자동적수단을이용해인간이발생시키는음성신호로부터언어적의미를식별해내는기술로음성신호를전기적신호로처리하고그패턴과파형을분석해미리수집된음성모델데이터베이스를참조하여문자로변환하거나정의된기능을실행하는 SW - 빅데이터내존재하는프라이버시문제해결을위한기술로개인정보를일부또는전부를삭제 대체하거나다른정보와쉽게결합하지못하도록하여특정개인을알아볼수없도록하는 SW - 영상분석기술은영상을분석하여내포된특성을인식하고패턴을추출하는기술로목적 과대상에따라객체인식( 얼굴, 색상, 글자, 숫자, 사물등), 상황감지, 모션인식및추적, 검색할수있는시스템 - 인공지능( 머신러닝) 기반소프트웨어는비정형, 정형데이터, 사진, 동영상등다양한멀티콘텐츠에대한상황정보 (Context) 를인지하고, 대용량데이터를학습하고분석하여사용자가원하는정보를신속하게검색, 추천, 예측하는기술을의미 (2) 분류 데이터인텔리전스분야의기술분류는산업기술분류표1) 상에서정보통신기술에포함되며, 서버기 술, 정보보안이포함 산업기술중분류를기준으로서버기술은 U- 컴퓨팅으로분류할수있으며, 정보보안기술은지식정 보보안으로분류 [ 데이터인텔리전스분야산업기술분류 ] 구분 산업기술_ 대분류 산업기술_ 중분류 산업기술_ 소분류 U- 컴퓨팅 서버기술 U- 컴퓨팅플랫홈및응용기술 소프트웨어 SW 솔루션 Internet SW 데이터인텔리전스 정보통신 RFID/USN ITS/ 텔레매틱스 USN 기술 활용서비스플랫홈및응용 SW 텔레매틱스응용서비스 디지털방송 디지털방송실감방송 디지털콘텐츠 디지털콘텐츠제작및유통 정보통신모듈및부품 멀터미디어모듈및부품 홈네트워크 지능형정보가전 지식정보보안 정보보안 1) 산업기술혁신사업공통운영요령( 시행 2016. 9.1) 제16 조( 산업기술분류체계) 1 장관은사업의기획 평가 관리에관한업무를효율적으로추진하기위해산업기술분류체계를수립하여활용할수있다. 2산업기술분류체계는규정에의하여산업통상자원부등에서기획, 평가, 관리에활용하는체계임 3
데이터인텔리전스 2. 국내외정책동향 가. 영국 영국은빅데이터활용의기반이되는공공부문데이터의공유및활용을활성화하는오픈데이터정책추진은내각부(Cabinet Office) 가담당 내각부는정부데이터공개를장려하고정부업무가더투명성있게진행되도록추진 내각부 : 수상과내각을보좌하는책임을맡는기구로, 내각의여러위원회들을지원하고여타부 처들에서발표되는정부목표를조정 [ 영국내각사무국의오픈데이터관련실천내용 ] 세계적으로가장큰오픈데이터자원중하나인 www.data.gov.uk 마련 모든정부부처의사업계획에오픈데이터책무를구체적으로포함 공표가능한모든정부데이터가접근할수있는포멧으로공표되도록하는공공데이터권리에관한법제도입 데이터에대한접근개선, 공적신뢰개선, 더효율적인데이터사용방법에관한후속조치를포함하는오픈 데이터백서발표 Contracts Finder에서 1만파운드가넘는공공계약에대한지출데이터공개 국가정보인프라(NII) 구축계획을수립하고주요데이터를식별하기위해협력절차마련 데이터공개펀드(Release of Data Fund) 를조성하여데이터공개개선을희망하는조직지원( 예산 700 만파운드) 신제품및서비스창출을위해공공부문의데이터를사용하려는기업을오픈데이터연구소 (ODI) 와협력하여지원 오픈데이터헌장(Open Data Charter), 열린정부파트너십(Open Government Partnership; OGP) 참여를통해국제적으로투명성을지원 데이터에대한수요와공급을전담할수있는체제구축 영국의공공데이터개방추진체계는데이터의공급자와고객의기능을공공데이터그룹 (Public Data Group) 과데이터전략위원회(Data Strategy Board) 가각각수행하는구조공공데이터그룹은공공데이터의수집/ 개선/ 관리/ 보급과관련된 4 개공공분야기구* 들로구성되며데이터전략위원회에오픈데이터를조달 4 개기구: 기업등록소(Companies House), 토지등기소(Land Registry), 기상청(Met Office), 국립지리원 (Ordnance Survey) 4
전략분야현황분석 데이터전략위원회는정부부처의오픈데이터전략에대한의견을제시하고수정 검토하는등의 역할을수행 데이터전문인력양성강조 정보경제전략(Information Economy Strategy) (2013. 6) 에서고도로숙련된디지털인력이 디지털인프라와함께정보경제전략의장기적인성공을뒷받침하는요소로거론 데이터역량강화전략(A strategy for UK data capability) (2013. 10) 에서도인프라, 데이터 와함께데이터전문인력(Human Capital) 확보를강조 특히데이터전문인력배출을위한교육체계개선내용을구체적으로제시 초중등교육에대한정부개혁을통해 2014년 9 월부터컴퓨팅국가교육과정(5-16 세학생들) 을 도입하여, 진학및데이터분석직업의필수기술인컴퓨팅및과학에서우수능력을지닌학생을 배출하는계획추진 이밖에전문인력양성을위한경력및진로제시와함께정부의분석능력에대해서도강조 클라우드이용활성화 클라우드이용활성화를위해공공조달거버넌스를구축(2011. 3), (2012. 2) 하여공공부문의클라우드이용촉진 클라우드스토어를개설 약 2 천여기업( 이중 80% 는중소기업) 의 19,553개서비스가스토어에등록 EU( 유럽) 인공지능 Human Brain Project 인공지능지식처리를위한인간두뇌의형태기반지식처리프로젝트진행중 2013년부터 10 억유로투자, 신경과학측면지식식별시뮬레이션, 의학측면의질병초기진단법 개발, 컴퓨팅뇌시뮬레이션슈퍼컴퓨팅기술개발 나. 미국2) 미래빅데이터특성을반영한기술개발로차세대능력함양 데이터의크기, 전달/ 처리속도, 복잡성에보조를맞춘기술개발 데이터의크기, 전달/ 처리속도, 데이터간고도의형식적, 의미적, 상호이질적특성등을다루기 위해서는컴퓨터시스템의규모를확장하는기술개발이필요 2) 미국 NIRTD(2016) 미국의빅데이터 R&D 전략계획( 정보통신기술진흥센터 2016) 5
데이터인텔리전스 미래에요구되는새로운빅데이터기술의방법론개발 데이터의증가와함께다양한알고리즘의등장, 적절한시간프레임내의운영등새로운도전과제가발생하면서통계적추론과이론을빅데이터기술개발에포함시키는것이반드시필수적인상황 데이터의신뢰성및더나은빅데이터기반의사결정을위한 R&D 지원 데이터의신뢰성과타당성을제고시켜더나은결과를도출 데이터의신뢰성은빅데이터에서정확한추론을이끌어내기위해필수적이며, 이를위해서는보다다양한종류의데이터를활용할수있게하는강력한통계기술을발전시키는연구가필요 데이터기반의사결정을지원하는도구개발 신뢰성높은의사결정과행동을취할수있도록더적합한정보를제공하고분석속도역시높이기 위해의사결정과정에서인간의통찰력을통합시킬수있는기술연구가필요 빅데이터혁신을가능하게하는사이버인프라구축및강화 국가데이터인프라강화 빅데이터의완전한활용을위해서는국가차원의데이터인프라발전이반드시요구되며, 미국정부는과거부터지금까지국가차원의데이터인프라를강화하는것에더욱초점을맞추고있는상황 빅데이터에대한응용과학사이버인프라역량강화 최근고성능계산분야에서는응용시스템의모델링과시뮬레이션에중점을두었던투자가데이터 분석에대한처리능력에초점을맞춘형태로이동중 유연하고다양한인프라자원 사이버인프라구축을위한특정유형의데이터, 데이터세트를다루는특정하드웨어의고안등을위해서는빅데이터커뮤니티의관여가반드시필요 데이터공유및관리를촉진하는정책을통해데이터가치를향상 데이터투명성과효용성을증가시키는메타데이터의모범사례개발 백악관은투명하고열린정부그리고오픈데이터정책등의추진에발맞추어효과적인데이터정보관리를실현하기위해모든부처및기관들이데이터를공유하고함께관리하는것에대한정책을검토중 6
전략분야현황분석 데이터자산에효율적이고지속적이며안전한접근을제공 빅데이터연구를수행하는기관은다양한맥락에서데이터세트의가치평가를도울수있도록연구 를진행하여데이터파일보관/ 공유이슈를다루는것이필요 개인정보보호, 보안및빅데이터수집공유활용의윤리적측면의이해 올바른개인정보보호 다양한데이터세트의맥락과콘텐츠를시스템이모델링하는것과사용되는경로등을고려하여더 욱길게연구한다면빅데이터분석과관련한개인정보보호와신뢰성문제해결에접근가능 안전한빅데이터사이버공간구축 빅데이터의사이버공간에서는데이터들이다양한데이터시스템과하위시스템사이를이동하며, 시스템네트워크전체의보안은개인시스템의보안만큼중요 데이터거버넌스를위한정보윤리이해 빅데이터를위한윤리적, 법적, 사회적함의에대한연구주제의개발을빅데이터관련연구에포 함시켜데이터과학과과학밖의사회를연결하도록노력 국가의빅데이터교육및훈련환경개선, 폭넓은인력의확충 데이터과학자의양성 빅데이터연구에대한지속적인투자확대는데이터과학분야의발전을돕고다음세대의주요 데이터과학자를양성하는교육을지원하는데기여 데이터영역전문가커뮤니티확장 컴퓨터공학과통계학분야외의연구자들에게특정분야에특화된데이터과학훈련으로그들의 전문성을보강할수있도록재정적인지원추진 정부기관, 대학, 기업, 비영리단체와의협력에의한빅데이터혁신생태계지원 기관간빅데이터협력장려 미국정부는과거부터추진해왔던, 기관간빅데이터협력프로젝트가지속적으로이어지고확대될수있도록전략을설계하여국가차원의빅데이터혁신생태계를구축하고유지 빠른대응과영향력측정이가능한정책과정책추진프레임워크구축 긴급한사안들에대하여빠른대응이가능하도록정부와민간간의빠르고역동적인협력을가능하게하는빅데이터정책및정책추진프레임워크개발이필요 7
데이터인텔리전스 국가대형프로젝트인공지능기술개발 Brain Initiative 진행 2013년부터 10년동안총 30억달러규모의투자진행인간의뇌연구를중심으로인공지능 기술개발 다. 중국3) 빅데이터발전촉진을위한행동요강 발표(2015. 9. 6) 빅데이터산업육성을위해 을위한행동요강 을발표 2018 년까지공공데이터공개를골자로하는 빅데이터발전촉진 2017 년까지각부처간데이터자원의장벽을제거하여데이터자원공유기본틀을마련하고 2018 년까지통합플랫폼을통해공공데이터를외부에공개한다는방침 데이터정보의개방과공유를통한자원배분및통합, 국가관리역량제고, 산업혁신촉진, 새 로운모델의기업창업독려등경제구조개편을지원한다는방침 빅데이터산업에서국제경쟁력을가진기업브랜드를육성하는것이주요목표10개의빅데 이터선두기업과 500 곳의빅데이터응용, 서비스, 제조기업을양성할계획 신용, 금융, 교통, 의료 보건, 취업, 사회보험, 지리, 문화등다양한분야의공공데이터및통 계자료를일반인들도확인할수있어다양한형태의데이터기반의창업이활성화될것으로 기대 라. 일본4) 해외 IT 인재유치를위한산학협동체제구축(2015. 9. 4) 경제산업성과문무과학성은아시아권국가의우수학생들의일본기업취업유치를위한시스 템을구축 저출산 고령화에따른노동력감소문제해결과경제성장전략의일환으로고도기술력을보유 한외국인재의활용이주요목표 빅데이터등방대한데이터분석처리를비롯한 IoT분야전문 IT인력수요증가로인재유치활 동을구체화 2020년 IT업계외국인수를현재의두배인 6만명으로확대하는것을목표로상정 3) 소프트웨어정책연구소, SW 해외정책동향(2015.09) 4) 소프트웨어정책연구소, SW 해외정책동향(2015.09) 8
전략분야현황분석 인도 베트남 미얀마등아시아각국정부와연계하여현지대학 IT 전공학생의유학을지원, 1 차적으로도쿄대학과협의회를출범하여취업을전제로하는유학시스템의구체적방안을논의할예정 고도의외국인인재유치는국가경쟁력향상에기여하며생산성향상, 정적효과를줄전망 이노베이션촉진등긍 마. 국내 국내에서는 2009년부터클라우드컴퓨팅활성화종합계획을추진하였고 2015년 3월에클라우 드컴퓨팅발전및이용자보호에관한법률( 이하클라우드발전법) 이통과되어 2015년 9월에 시행 클라우드발전법은클라우드컴퓨팅관련산업의기술개발, 인재양성, 서비스활성화및이용 촉진을위한법적근거로마련, 이에따라약 1만 5,000여곳의공공기관에서클라우드도입 정부는 2013 년부터빅데이터산업발전을위한정책을본격추진하였으며, 빅데이터산업발 전전략(2013.12 월, 경제장관회의), 데이터산업발전전략(2014.12 월, ICT 전략위) 등빅데이터 정책을마련하여시행중 빅데이터분야의글로벌경쟁력확보와창조경제및정부3.0 위한 빅데이터산업발전전략 수립 (2013.12 월) 등국정과제의효과적지원을 ICT 인프라강국 에걸맞는 데이터超강국 으로의도약을위해데이터산업생태계활성화를 위한 데이터산업발전전략 수립( 14.12 월) 이밖에도정부는미래성장동력실행계획( 14.6.12, 경제장관회의), 빅데이터기반미래전략지 원계획( 14.8, ICT 전략위) 을마련하여빅데이터산업발전과적극적인활용을추진 미래창조과학부의 15년인공지능관련예산은 380 억원으로언어인지, 시각인지분야에치우쳐 있음, 한국전자통신연구원(ETRI) 에서 13 년부터엑소브레인(Exobrain) 인공지능을연구중 9
데이터인텔리전스 3. 가. 산업이슈및동향 산업이슈 빅데이터분석및활용에서의핵심요건은 - IoT 많은기업들은빅데이터가최근의비즈니스에서매우중요한역할을하고있다고응답하였으며 그중 IoT와의원활한결합이향후매우중요한역할을할것으로평가 전체응답의 2배이상이 IoT의중요성을특히강조하고있으며빅데이터활용의성과는 IoT에 달려있다는평가가지배적인것으로나타남. 또한고급분석책임자는 IoT를잘아는전문가를 중심으로인사가이루어지고있으며첨단분석응용프로그램및기술을사용하여해석하는데 가장이상적인방법론으로는 IoT 데이터에기반한데이터라고평가 또한빅데이터분석이고급화되고, 보다질높은분석과시기적절한대응전략을위해서는 IoT 에서발생하는데이터를참조하고해석해나가는것이중요하다는반응이나타남 클라우드산업의중요성증대 세계적으로 ICT 활용패러다임이정보시스템을자체구축하는방식에서클라우드로전환중 클라우드는 IT 자원의비용효율극대화를추구하며, 인프라투자에대한부담을감소시켜환경 변화에민감하게대응할수있게함 또한, IT자원운용과관련된비핵심업무를아웃소싱함으로써조직핵심역량을강화할수있다 는장점이있음 [ 클라우드도입효과 ] 구분 주요내용 비용절감 ICT자원을빌려서사용함으로써 H/W, S/W 구매및유지 관리의필요성이없어비용절감가능 생산성향상인터넷만연결되면언제, 어디서나, 스마트폰등다양한단말기를통해업무가능 효율성증가 갑작스러운 ICT 자원의수요변화에신속하고탄력적인대응이필요한만큼 ICT 자원의활용이가능하여비즈니스효율성증가 창업활성화 ICT에대한초기투자비용이절감되어적은투자비용으로도창업이가능하여쉬운창업가능 * 출처: 한국인터넷진흥원 10
전략분야현황분석 보안및개인프라이버시침해위협에주목 IoT 시대에는개인정보유통으로인한프라이버시침해는물론자동차, 의료등많은분야에서 의취약한보안이생명을위협할가능성이제기되는등다양한데이터의이동에따른보안과 관련한문제가이슈화됨 과거부터사용되어온임베디드형스마트기기가확산되는경우, 보안취약점을통한심각한 사이버공격들이시장환경과주요인프라에서엄청난혼란을야기할가능성이제기되고, 해킹 대상은전생활과산업영역으로넓어져, 제조공장, 전력망, 자동차, 의료기기, 가전제품까지 광범위한영역이악의적인해커들의목표물이될가능성증대 HP 에따르면, IoT 연결기기의 70% 가수집된정보를클라우드나로컬네트워크에암호화되지 않은상태로전송하고, 10개기기중 6 개는보안에취약한웹인터페이스를활용하고있으며, 소프트웨어업데이트시에도 등에있어취약점을갖고있는것으로나타남 60% 가암호화를사용하지않는등암호화나사용자접근권한 산업연구원은국내융합보안위협이국내 GDP의 1% 에달한다고추정하며, 국내융합보안피 해액이 2015년 13.4 조원, 2020년 17.7 조원, 2030년 26.7조원에이를것으로예상 최근보안뉴스가실시한설문조사에따르면, IoT 시대에보안리스크가가장큰사물혹은기 기로스마트폰이압도적인응답률( 응답자의 41.3%) 로 1위를차지 * 출처: 사물인터넷환경에서의보안/ 프라이버시이슈, 김호원교수부산대학교정보컴퓨터공학부 [ 사물인터넷환경에서의보안/ 프라이버시이슈 ] 11
데이터인텔리전스 나. 핵심플레이어동향 해외업체현황 IBM - 폭넓은포트폴리오, 분석영역강화 IBM 은지속적인투자및전략적합병을통해빅데이터시장을공략하고있음. 2011년빅데이터 분석솔루션및서비스분야 R&D에 1 억달러의투자할것을밝혔고, 지난 5년동안 160억달러 이상을투자해빅데이터분석관련 30여개의업체를인수하였음 IBM은엔터프라이즈클래스의빅데이터플랫폼을제공하기위한전략을추구하며 대용량데이터처리솔루션 InfoSphere BigInsights, 스트리밍데이터분석플랫폼 Hadoop기반 InfoSphere Streams, 대용량 DW Appliance PureData System for Analytics, 실시간검색을위한 Watson Explorer 등의제품군을보유하고있음 Oracle - 정형데이터아키텍처에비정형통합 Oracle 은기존의전통적인엔터프라이즈데이터아키텍처에빅데이터툴을통합함으로비즈니스 가치를찾을수있도록제품포트폴리오를구성하는전략을추구하고있음 대표적인제품인 Oracle Big Data Appliance는이러한전략을기반으로 Oracle에서개발한 SW 제품군과최적화된 HW를결합한 Appliance 제품으로 Cloudera의 Hadoop Distribution과오픈 소스 R distribution을포함하고있음 EMC - 인력양성, 협업및 Hadoop 내재화 EMC는 Greenplum, Isilon 등빅데이터관련솔루션업체를인수를시작으로빅데이터시장에서의입지를강화하기위해지속적으로관련업체를인수할계획을가지고있음 SAS - 고급분석및시각화솔루션집중 SAS는 Volume, Variety, Velocity에추가하여 Variability( 데이터흐름의가변성), Compl exity ( 데이터간의관계의복잡성) 을빅데이터의특성으로보고, 빅데이터를위한세가지핵심기술로 Information Management, High-performance Analytics, Flexible Deployment Option 으로 정의함 Information Management 에서는데이터통합, 품질, 메타데이터등데이터거버넌스를하나의 Data Management Hadoop Distribution 플랫폼으로구성하여데이터를자산화함 Apache Hadoop 기반의오픈소스 SW를제공하여기업들이운영환경에서안정적으로 Hadoop 을사용할수있도록함 Cloudera는 Hadoop 을보완, 확장하기위한추가적인컴포넌트를조합하고개발함. Cloudera Enterprise는 Hadoop 설치및운영을효과적으로관리할수있도록개발된제품임. Cloudera는 기업사용자들에게기술적지원, 업그레이드, Hadoop 클러스터관리도구, 전문서비스, 교육및 자격증제공서비스등을수행 12
전략분야현황분석 NoSQL DB Couchbase는 couchbase 오픈소스프로젝트기반의회사로 NoSQL DB Couchbase 를제공, 쉬 운확장성, 일관성있는고성능보장및유연한데이터모델등으로널리알려져있음, 상업적용 도로사용가능한라이선스와기술지원서비스가포함된버전의 Amazon 아마존웹서비스 -Elastic Compute cloud couchbase server 컴퓨팅작업서비스와간단한스토리지서비스그리고온디맨드스토리지기능을제공 공급 AT&T 클라우드솔루션-Synaptic Hosting 보안기능과네트워킹기능이통합된가상화서버와스토리지기능을제공하는 의어플리케이션호스팅 Pay-as-you-go방식 Enomaly 클라우드솔루션-Elastic Computing Platform(ECP) 엔터프라이즈데이터센터를상용클라우드컴퓨팅서비스와연결할수있는소프트웨어솔루션 Google 클라우드솔루션-Google Apps 온라인으로제공되는오피스제품으로전자우편, 캘린더와워드프로세싱, 단순한웹사이트생 성도구등을제공 GoGrid 핵심클라우드솔루션-GoGrid 웹기반스토리지서비스와윈도우즈, 적용할수있는기능을제공 리눅스기반가상서버를클라우드환경에서빠르게 Microsoft 핵심클라우드솔루션-Azure 웹호스팅어플리케이션구현을위해사용될수있는운영체제와개발자서비스로구성되어 있는 Windows-as-a-service 플랫폼을제공. Azure는 Microsoft의첫클라우드컴퓨팅솔루션 13
데이터인텔리전스 국내업체현황 KT 넥스알 KT 넥스알은대표적인국내빅데이터플랫폼기업으로클라우드컴퓨팅기술전반을개발하던넥 스알이 2010년 KT에인수되어빅데이터에집중하고있음 NDAP(NexR Data Analytic Platform) 플랫폼은오픈소스 Hadoop과관련생태계제품을하나의 플랫폼에통합하고 Hadoop 에코시스템상위계층으로 SQL과워크플로우환경을제공 그루터 (Gruter) 그루터는빅데이터플랫폼및소셜데이터분석전문기업. 그루터는 Hadoop 에코시스템기반의 빅데이터플랫폼쿠바(Qoobah) 와 Hadoop 에코시스템관리도구인클라우몬(Cloumon) 을공급 소셜미디어모니터링및분석서비스씨날(seenal) 을통해한국어기반의소셜분석서비스를제공 하고중국어및일본어로확대할계획 솔트룩스 (Saltlux) 솔트룩스는비정형빅데이터및시맨틱, 클라우드컴퓨팅기술기반의차세대웹및지식서비스 전문기업, 클라우드기반시맨틱검색플랫폼 [IN2] 와시맨틱기반빅데이터추론플랫폼 STROM 등의제품군을기반으로비정형빅데이터추론및시맨틱검색분야에강점 [ 국내클라우드업체 ] 구분 한글과컴퓨터 더존비즈온 내용 클라우드방식의오피스 SW 인 ' 넷피스 ' 출시향후, 동사모든제품을클라우드기반으로협업기능강화예정 기존솔루션의클라우드전환적극적추진 인프라웨어클라우드오피스인 ' 폴라리스오피스' 무료버전출시 파이오링크 클라우드컴퓨팅인프라장비산업부품제조및판매 파수닷컴클라우드 DRM 서비스출시계획 안랩 클라우드보안솔루션보유 알티캐스트 N 스크린관련클라우드솔루션보유 * 출처: 클라우드시장( 더이상뜬구름이아니다) 2015.04 김갑호, 이성빈연구원 14
전략분야 현황분석 [ 핵심 플레이어 분석 종합 ] 구분 데이터인텔리전스 주요내용 빅데이터 클라우드 음성인식 데이터 보안 비식별화 영상처리 인공지능 주요 제품/기술 데이터 수집 분산컴퓨팅 분산파일 시스템, NoSQL, 병렬 DBMS HDFS Spark 자연어처리,정 보 검색, 기계 학습 레스트풀서비스 서버 가상화 네트워크 가상화 분산 스토리지 메시지 기반 미들웨어 분산 데이터 관리 기술 병렬 기술 음성인식, 음성합성, 화자인식, 언어분석, 대화처리, 자동번역, 음성인식 학습 인공지능 대화형 질의응답 익명처리 기술, 총계처리, 범주화 기술, 데이터 값 삭제 기술, 데이터 마스킹 교환방법, 휴리스틱 데이터 암호화 엔진 기술 얼굴인식 사물 인식 이미지인식 진단 기술 머신비전 기술 모션 인식 제스처 인식 초음파 동작인식 기술 딥러닝 모니터링 기술 자동제어 자연어 처리 음성시스템 상품추천 기술 패턴인식, 콘텐츠 추천 자동추론 해외기업 Splunk Inc. Fisher Rosemount Systems Google Qualcomm Inc. Tata Consultancy Services EMC Oracle IBM Microsoft Google Facebook IBM Google Microsoft Intel Zynga Sony Facebook Google, 42ARK Microsoft, Capri PrimeSense pointgrab Elliptic Lab Leap Motion Canesta Myo The EyeTribe TeraDeep Intel IBM Qualcomm MetaMind IBM Watson Microsoft Asure Amazon Web services Google cloud Facebook Google Microsoft Apple Amazon 국내기업 다음소프트 KT 넥스알 구루터, 사이람, 솔트룩스, 와이즈넛 디지털팩토리, 마이즈랩, 리비, 코난테크 놀로지, Zoy Corporation SK텔레콤 LNI소프트 시리우스 소프트 솔트룩스 보이스웨어 디오텍 LG CNS SK텔레콤 KT 펜타시큐리티 퓨처시스템 소만사 네이버 루닛 부노 삼성 UVify LG SKT SK텔레콤 LG CNS KT 삼성전자 디오텍 쿨디 유빅 솔트룩스 와이즈넛 중소기업 참여정도 중소기업 시장점유 정도 IBM, Amazon, Google, Microsoft, Facebook Twiiter KT 더존비즈온 이노그리드 다우기술 퓨전데이타. 한글과컴퓨터 영림원소프트랩 LG CNS 모비젠 Google, Microsoft, IBM, Nuance, Apple, Systran Amazon * 중소기업 참여정도와 점유율은 주요제품 시장에 참여하는 중소기업의 참여규모와 정도 (업체수, 비율 등)를 고려하여 5단계로 구분 (낮은 단계:,중간 단계(,, ) 높은 단계: ) 15
데이터인텔리전스 4. 시장동향및전망 가. 세계시장 데이터인텔리전스분야제품세계시장은현재도성장중이며, 는다소있으나공통적으로높은성장률을예측 시장조사기관마다규모의차이 데이터인텔리전스분야에해당하는제품은총 6가지로매년시장은증가하고있는것으로나 타났고, 그중음성인식 SW 분야가 2020년기준가장큰시장규모를보일것으로예상됨 15년까지연평균증가율을보면빅데이터기반 SW 가가장높은것을볼수있고, 전체데이터 인텔리전스합계기준으로도 2년동안 13.6% 의증가율을보인것으로나타남 15년이후가장높은증가율을보이는제품은인공지능기반 SW일것으로예상됨 [ 데이터인텔리전스분야의세계시장규모및전망 ] 구분 15 16 17 18 19 20 ( 단위 : 백만달러, %) CAGR ('13~'15) 빅데이터기반 SW 33,310 37,970 43,400 49,280 55,220 60,910 13.1% 클라우드기반 SW 70,100 86,400 105,500 127,500 137,600 148,600 14.0% 음성인식 SW 83,800 97,400 113,200 127,684 147,542 170,489 18.2% 데이터보안및비식별화 75,429 81,439 88,093 95,283 102,923 111,143 8.7% 영상처리시스템 9,000 10,400 11,800 13,700 15,600 17,600 15.7% 인공지능기반 SW 203 332 588 1,095 2,111 4,145 42.3% 합계 271,842 313,941 362,581 414,542 460,996 512,887 13.6% * 자료: 위키본( ʼ15.5), Big Data Market Forecast 2011-2026 ʼʼ, Statista, Forecast of Big Data market size, based on revenue, from 2011 to 2026, Tractica, 2016, IDC 16
전략분야 현황분석 [ 세계 각국의 인공지능 관련 시장 전망 ] 조사기관 대상 15년 향후 CAGR 영상음성처리분야 1,270억 달러 1,650억 달러 ( 17년) 14% Cognitive SW 플랫폼 10억 달러 37억 달러( 17년) 92% BCC리서치 음성인식 840억 달러 1130억 달러( 17년) 16% Market&market 서비스 (광고, 미디어 등) 4.2억 달러 50억 달러( 20년) 64% Tractica AI 시스템 2억 달러 111억 달러( 17년) - EY종합연구소 AI관련 산업 전반 (자국) 3조7450억 엔 23조 638억 엔( 20년) 44% IDC IBM 2025년 2000조원 시장 창출 맥킨지 2025년 6조 7천억 달러( 7000조원) 파급 효과 *출처: KT경제경영연구소 kt경제경영연구소는 각 산업군에 적용될 로봇산업 수치에 기반해 예측한 결과 이같이 나타났다 고 전망하고, 5년 안엔 2조원대 시장이 형성될 것으로 추정 현재 인공지능이 적용되는 산업은 금융과 광고 서비스 분야 등이며 오는 2030년에는 자율 주 행차와 노인 간호 등의 분야까지 확대될 것으로 전망 [세계 인공지능 시장 전망] *출처: Tractica 17
데이터인텔리전스 나. 국내시장 국내데이터인텔리전스산업은아직까지는도입초기수준이나기업전반에서실질적인인프라 를구현하려는단계로접어듦 데이터인텔리전스에해당하는분야는총 6 개분야로매년증가하고있는것으로나타났고, 그 중데이터보안비식별화분야가 2020년기준가장큰시장규모를보이는것으로나타남 15년까지연평균증가율을보면빅데이터기반 SW 가가장높은것을볼수있고, 전체데이 터인텔리전스합계기준으로도 2년동안 11.8% 의증가율을보인것으로나타남 15년이후가장높은증가율을보이는제품은인공지능기반 SW인것을볼수있음 [ 국내데이터인텔리전스분야의시장규모및전망 ] 구분 15 16 17 18 19 20 ( 단위 : 억원, %) CAGR ('13~'15) 빅데이터기반 SW 2,632 3,328 4,227 5,393 6,921 8,938 39.7% 클라우드기반 SW 4,137 5,106 6,183 7,397 7,586 7,781 9.2% 음성인식 SW 6,274 6,967 7,737 8,593 8,813 9,039 5.4% 데이터보안및비식별화 77,476 85,094 92,681 101,244 110,806 121,390 10.5% 영상처리시스템 986 1,142 1,297 1,509 1,720 1,904 14.2% 인공지능기반 SW 47,000 54,000 64,000 75,000 91,000 111,000 14.3% 합계 138,505 155,637 176,125 199,136 226,846 260,052 11.8% * 자료: 위키본( ʼ15.5), Big Data Market Forecast 2011-2026 ʼʼ, Statista, Forecast of Big Data market size, based on revenue, from 2011 to 2026, Tractica, 2016, IDC 18
전략분야 현황분석 *출처 : 한국과학기술정보연구원(KISTI), 자료 재편집, SPRI 2016 [ 국내 빅데이터 시장 ] 2015년 기준 국내 빅데이터 시장규모는 2014년 대비 30% 성장한 2,632억 원 규모이며, 한 국과학기술정보 연구원에 의하면 국내 빅데이터 시장은 2020년 까지 8억 9천만 달러(한화 약 1조 원)규모까지 성장할 것으로 예측 빅데이터 관련 정부투자 또한 2013년 230억원에서 2015년 기준 698억원으로 세배이상 증가 국내 클라우드 SW 시장 성장은 마이크로소프트(MS), SAP, 세일즈포스닷컴 등 외국계 클라우 드 소프트웨어 서비스 회사와 더존비즈온 한글과컴퓨터 등 국내 기업이 주도하고 있는 것으로 나타났고, 한국IDC는 향후 5년간 국내 클라우드 SW 시장이 연평균 16.3%의 성장세를 이어 가며 2020년 5천억원을 넘어설 것으로 전망 *출처: IDC 2016 [ 국내 클라우드 시장 ] 19
데이터인텔리전스 5. 기술동향및이슈 NoSQL로의전환 빅데이터추세백서에서는주로구조화되지않은데이터와연관된 NoSQL 기술의채택이증가 하고있음을언급, 스키마가없는데이터베이스개념의이점이극명해짐에따라앞으로는기 업 IT 환경에서 NoSQL 데이터베이스로의전환이대세를이룰것 운영데이터베이스관리시스템에대한 Gartner의 Magic Quadrant를보면이러한사실을명 확하게확인할수있음 과거에는 Oracle, IBM, Microsoft, SAP 가주로배치되었으나, 이와대조적으로최근 Magic Quadrant에는 MongoDB, DataStax, Redis Labs, MarkLogic, Amazon Web Services(DynamoDB 포함 ) 를비롯한 NoSQL 기업이배치되어있으며, 이러한기업이 Gartner 보고서의 Leaders Quadrant 에나열된기존데이터베이스공급업체보다수적으로우세하다는사실을알수있음 클라우드에서사용률이증가하고있는 MPP 데이터웨어하우스 오랫동안데이터웨어하우스의 ' 소멸' 에대해과도하게언급되기는했지만이부문의시장에서 데이터웨어하우스성장이둔화하고있음을부인할수지만, 현재이기술을클라우드에응용하 고있는추세이며 Amazon이 Redshift의온디맨드클라우드데이터웨어하우스를통해이러 한추세를이끔 Redshift는 AWS에서가장빠르게성장하는서비스이지만현재 Google의 BigQuery와경쟁 구도이며, 2015년 Strata + Hadoop World Startup Showcase 우승기업인 Snowflake와 같은신생기업과오랫동안데이터웨어하우스시장을주도해온 Microsoft(Azure SQL 웨어하우스사용) 및 Teradata의서비스도이부문에서두각을나타내고있음 데이터 분석가들은 Hadoop을채택한기업중 90% 는데이터웨어하우스를계속유지할것이며, Hadoop 데이터저장소에저장된정보량이증가함에따라데이터웨어하우스에서새로운클라 우드서비스를통해스토리지및컴퓨팅리소스를동적으로확대하거나축소할것을전망 20
전략분야현황분석 6. 중소기업시장대응전략 Factor 기회요인위협요인 정책 스마트국가구현을위한빅데이터마스터플랜을 수립/ 추진 주요선진국정부들은빅데이터를차세대성장동 력으로보고관련정책및기업지원정책을수립 / 추진 우리정부도인공지능분야등중점적투자계획 민간차원의빅데이터활성화에만기댈것이아 니라관련부처와기업들의긴밀한공조가필요 IoT, 클라우드, 빅데이터등신기술과원천기술 개발에대한지원이상대적인부족 산업 타산업과의융합을통해수요및분야확대 빅데이터기술의빠른발전 정부와기업들이빅데이터도입과활용을서두르면서관련산업과신산업이생겨나는추세 국내산업이글로벌회사로의기술종속 외산기술과의치열한시장경쟁 미국및유럽기업과의기술격차 시장 주요통신사및대기업을중심으로중소기업이 협력하는생태계가점차확대 데이터기술력을토대로다양한사업및솔루션 을개발하여진출이가능 높은기술의존도및관련기술의급격한변화 시장선점을위한치열한경쟁예상 기술 데이터저장매체의발달과비용하락 통신기술의발달로인한 IoT 기술력증가 데이터처리시스템활성화 다양한솔루션개발이활성화 전문인력의부족 전문인력의단기육성불가 보안이슈및사회적인식부족 개인맞춤형빅데이터융복합 IoT 인공지능기술 다양한분야확대적용 중소기업의시장대응전략 글로벌플랫폼에서제공하기어려운실시간데이터수집및연계기술의개발 가상화기반기술을개발하여글로벌기업과의기술격차해소 응용환경을고려한독자적인핵심기술과고급개발인력확보 로봇, 자율주행, IoT 등에적용할인공지능알고리즘개발로중소기업경쟁력확보 데이터보안을위한지능시스템의개발로중소기업의경쟁력강화 21
데이터인텔리전스 7. 중소기업전략제품 가. 중소기업기술수요 중소기업, 대기업, 공기업등에대하여설문조사및방문조사를통하여기술수요조사를실시 조사결과데이터관리, 저장처리기술, 이미지데이터추출기술, 인공지능플랫폼, 하둡관련데이터 분석, 언어처리, 원격모니터링, NoSQL, 챗봇, 클라우드, 딥러닝기술, 로봇등의수요가있는것으 로조사 중소기업청 R&D 지원사업에신청한과제를데이터인텔리전스주요품목별로분석한결과, U- 컴퓨팅기기및주변기기(5.1%), U- 컴퓨팅플랫폼및응용기술(10.6%), SW 솔루션(84.4%) 순 으로중소기업이기술개발에관심을보이는것으로분석 주요품목별기술개발과제의증가하는추세를살펴보면 U-컴퓨팅기기및주변기기분야의증가율이 가장높게나타났으며, U- 컴퓨팅플랫폼및응용기술, SW솔루션순으로기술개발이증가하는것으로 나타남 주요기술분야별신청과제에대한내용을분석하여각분야별로중소기업이관심을갖는제품 을파악 U- 컴퓨팅기기및주변기기분야에서는로봇, 보안시스템, 사운드인증장치및시스템등의기술 개발에대한수요가높은것으로나타남. U- 컴퓨팅플랫폼및응용기술분야에서는하둡, Big Data 시스템, 인공지능플랫폼, 챗봇플랫폼, 데이터베이스등에대한수요가높은것으로나타남 SW 솔루션분야는동영상데이터추출, 분석솔루션, 의사소통, 언어처리, 이미지, 디자인서비스 기술등에대한수요가높은것으로나타남 [ 중소기업청 R&D 지원사업신청과제현황 ] 데이터인텔리전스 주요품목 U- 컴퓨팅기기및주변기기 U- 컴퓨팅플랫폼및응용기술 과제건수 13 14 15 합계 점유율 (%) 평균증가율 (%) 25 82 81 188 5.1 80.0% 82 135 175 392 10.6 46.1% SW솔루션 695 1,073 1,366 3,134 84.4 40.2% 합계 802 1,290 1,622 3,714 100.0 42.2% 22
전략분야현황분석 나. 중소기업전략제품 [ 데이터인텔리전스분야전략제품 ] 전략제품 개요 빅데이터기반 SW 빅데이터플랫폼에서데이터를수집, 저장, 분산처리, 검색, 공유, 분석, 시각화등을이용하여데이터를처리하는소프트웨어 클라우드기반 SW 클라우드기반 SW 는클라우드서비스( 가상의자원을제공하고사용한만큼비용을청구하는서비스) 를이용하여컴퓨터나휴대폰등에불러와서사용하는웹에기반한소프트웨어서비스 음성인식 SW 언어및음성인식기술은컴퓨터와같은자동적수단을이용해인간이발생시키는음성신호로부터언어적의미를식별해내는기술로음성신호를전기적신호로처리하고그패턴과파형을분석해미리수집된음성모델데이터베이스를참조하여문자로변환하거나정의된기능을실행하는 SW 데이터인텔리전스 데이터보안및비식별화 빅데이터내존재하는프라이버시문제해결을위한기술로개인정보를일부또는전부를삭제 대체하거나다른정보와쉽게결합하지못하도록하여특정개인을알아볼수없도록하는 SW 영상처리시스템 영상분석기술은영상을분석하여내포된특성을인식하고패턴을추출하는기술로목적과대상에따라객체인식( 얼굴, 색상, 글자, 숫자, 사물등), 상황감지, 모션인식및추적, 검색할수있는시스템 인공지능기반 SW 인공지능기반머신러닝소프트웨어는비정형, 정형데이터, 사진, 동영상등다양한멀티콘텐츠에대한상황정보 (Context) 를인지하고, 대용량데이터를학습하고분석하여사용자가원하는정보를신속하게검색, 추천, 예측하는기술을의미다양한머신러닝소프트웨어가있으나크게금융분야와, 학습을통한추천/ 예측분야로분류 23
전략제품현황분석 빅데이터기반 SW
빅데이터기반 SW 정의및범위 빅데이터기반 SW 는빅데이터플랫폼에서데이터를수집, 저장, 처리, 검색, 공유, 분석, 시각화 를통해대규모데이터를처리하는소프트웨어를의미 빅데이터기반 SW 는크게수집, 저장, 분석/ 처리, 시각화분야로분류 정부지원정책 국내기업들이빅데이터분석활용에참고할수있는성공사례와적용모델이전파되기위해정부 차원에서빅데이터분석의활용을적극추진중이며, 미래창조과학부와 NIA에서또한다양한산 업에걸쳐시범사업을추진중 13 년 빅데이터산업발전전략 수립및추진, 정부 3.0 으로공공데이터개방추진 정부는빅데이터를 14년 12월 19 대미래성장동력산업으로선정하고 15 년부터 20년까지총 4,869 억원투입예정 중소기업시장대응전략 강점 (Strength) 빅데이터기술의빠른발전 빅데이터기술의엄청난파급효과기회 (Opportunity) 약점 (Weakness) 개발된기술활용시글로벌대기업과의경쟁 개별기술을넘어전체적인기술의연계를통한빅데이터활용은쉽지않음위협 (Threat) 정부차원의지원확대 다양한산업분야로시장확대 개인정보보호로인한규제 글로벌기업의국내진출 중소기업의시장대응전략 글로벌플랫폼에서제공하기어려운실시간데이터수집및연계기술의개발 각산업분야에적합한다양한데이터분석기술의개발로중소기업의경쟁력강화 플랫폼이아닌빅데이터를활용한서비스개발과유료수익창출
핵심기술로드맵
전략제품 현황분석 1. 개요 가. 정의 및 필요성 빅데이터(BigData)라는 개념이 나온 것은 불과 7~8년 정도 밖에 되지 않았지만 사회 각 분야 에서 큰 주목을 받고 있으며, 가트너, IDC, EMC와 같은 세계적인 시장 조사기관 10개중 9개 에서는 빅데이터의 전망을 밝게 보고 있음. 이와 같이 빅데이터가 주목을 받은 이유는 시장규 모의 급격한 증가와 관련 있으며, 이러한 추세와 맞물려 빅데이터는 우리 삶에 지대한 영향을 미칠 것으로 예상됨 *출처: Statista, Forecast of Big Data market size, based on revenue, from 2011 to 2026, 2016 Wikibon, Big Data market Forecast, 2011-2026, 2016. SPRI 재편집 [ 세계 빅데이터 시장 동향과 전망 ] 일반적으로, 빅데이터의 기초 단위인 데이터는 의미 있는 수치나 문자, 기호를 뜻함. 기존의 빅 데이터에 관한 사전적 정의는 단순히 데이터의 양이 많은 것을 의미하였으나, 최근 빅데이터의 정의의 범주가 확장 되어, 기존의 대용량의 정형화된 데이터를 뜻하는 정의뿐만 아니라 비정형 화된 일상의 정보들까지 포함하는 거대한 데이터의 집합을 의미함 디지털 경제의 확산으로 규모를 가늠할 수 없을 정도의 많은 정보가 생산되고 있고, 과거에 비해 그 규모는 더욱 방대해졌으며, 생성 주기는 더욱 짧아지고 있음. 또한 기존 컴퓨팅 시스템을 이용한 데이터 수집, 처리, 분석 할 수 있는 역량을 넘어서는 대량의 데이터 집합과 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미함 이러한 빅데이터에 대해 가트너의 더그레이니(Doug Laney)는 데이터양(Volume), 증가속도 (Velocity), 다양성(Variety) 등 3V로 정의하였으며, 이후에도 여러 사람이 유효성(Validity), 진실 성(Veracity), 가치(Value), 가시성(Visibility) 등의 다양한 V를 추가하며 빅데이터에 대한 정의를 확대해오고 있음. 따라서 빅데이터에 대한 정의는 주관적이고 상대적이며, 기술의 발달에 따라 계 속 변화해 나갈 것임 29
데이터인텔리전스 - 빅데이터기반 SW * 출처 : 빅데이터 ; 산업지각변동의지원( 삼성경제연구소, 2012년 5 월) [ 빅데이터의 3V ] 빅데이터가주목을받는이유는크게세가지로정리할수있음. 첫째, 데이터양이급격하게 증가하였고, 둘째, 데이터처리기술이비약적으로발전했으며, 마지막으로, 미래경쟁력의가치 를창출하는원천으로인정받고있기때문 오늘날데이터사용량이급격하게증가하고있음. 아래그림[1 분동안인터넷에서일어나는일들] 에서보이듯 1 분이라는시간동안인터넷에서는엄청난양의데이터가생성됨. 트위터(Twitter) 의 경우, 98,000 개의트윗이생성이되고, 페이스북(Facebook) 의경우 695,000개의글또는사진 이게시됨 또한 1억 6천 8 백여만개의이메일(e-mail) 이송수신되고있음. 이추세로볼때, 2020년에는데 이터사용량이약 40ZB가될것으로추정되며 ZB(Zeta Byte) 라는양의크기는 GB(Giga Byte) 의 2의 40승배에해당하는엄청나게방대한크기이므로 2011년의정보량은총 1.8ZB로 1.8조 GB 에해당하는양임 이양을고화질영화의데이터크기로비교해본다면, 그수는무려고화질영향 2,000억개정도 가되며이는한사람이 4,700만년동안보아야다볼수있는크기이므로더욱이이제는얼마만 큼의데이터를보유하고있느냐를넘어서, 보유하고있는다양하고수많은데이터에서어떻게하 면유의미하고실질적으로활용될수있는정보를찾아낼것이냐가더욱중요한요소로부각되고 있음 * 출처 : Go-Globe.com [ 1 분동안인터넷에서일어나는일들 ] 30
전략제품 현황분석 데이터 처리기술이 발전하면서, 하둡과 같은 분산병렬처리 기술이 등장하였고, 이로 인해 데이터 처리 속도 역시 엄청나게 빨라짐 분산병렬처리 기술의 등장은 슈퍼컴퓨터가 하던 일을 분산된 수십 대의 PC를 병렬로 연결하여 데 이터를 저장하고 분석할 수 있는 기술로 2006년에는 오픈 소스 하둡(Hadoop) 이 등장하여 분산 병렬처리의 대중화를 이끌었고, 빅데이터 분석 시간이 획기적으로 단축하게 됨 또한 데이터 처리 속도와 더불어 데이터 저장 비용의 급감도 빅데이터 산업의 발전에 이바지함. 80년대 초의 1GB 저장 비용은 10억원이 넘을 정도였지만 2000년대 초반에는 100원 정도의 금 액으로 감소하였고, 현재는 그 비용이 채 10원도 되지 않음. 저장 비용의 감소로 인하여 최근 구 글과 네이버와 같은 포탈업체들의 클라우드 서비스가 더욱 보편화 됨 [ 클러스터 기술과 하둡의 등장 ] 빅데이터의 활용은 경쟁력 있는 미래 가치를 창출함. 정보화 혁명으로 기술적인 패러다임이 근본 적으로 변화하였고, 더불어 데이터의 사용량이 엄청나게 팽창함 이러한 결과로 빅데이터가 출현하게 되었고, 빅데이터를 가공하고 분석하는 기술들이 새로운 가치 를 창출할 수 있게 됨. 예를 들어 경제적 가치 창출에 활용된다거나 범죄 예방 및 수사에 활용할 수도 있으며 또한, IT패러다임 변화에 따라 새로운 산업 분야에 진출할 수도 있음 뿐만 아니라, 재해 예방과 대피, 후속 처리 등에도 빅데이터를 활용할 수 있음. 이처럼 오늘날 빅 데이터의 출현과 팽창으로 인해 IT 패러다임이 새롭게 바뀌는 시점에 와있다고 할 수 있으므로 세 계 각국의 정부와 기업들은 빅데이터가 향후 기업의 성패를 가늠할 새로운 경제적 가치의 원천이 될 것으로 기대하고 있으며, 앞으로는 빅데이터에서 유용한 정보를 찾아내 그 안에 잠재된 정보를 활용할 수 있는 기업들이 시장을 선도할 것으로 예상됨 빅데이터를 활용한 일련의 사례들을 통하여 빅데이터가 주는 이점은 너무나 분명해졌으며 오히 려 아직까지는 그 이점을 제대로 다 활용하지 못하고 있다고 볼 수 있음 31
데이터인텔리전스 - 빅데이터기반 SW 빅데이터가주는이점에는우선소비자세분화와맞춤형비즈니스활동을가능하게한다는점을 들수있으며이러한이점은여러사례에서이미확인한바있으며, 시장세분화에이은소비자들 에대한맞춤형서비스는앞으로빅데이터의활용이점차다양해짐에따라마찬가지로함께진화 해나갈것임 여기서정보를생산해내는사람들간의협업과그결과로얻어지는지식체계를말하는집단지성 (Collective Intelligence) 의활용이기대되고있으며기존의소비자세분화와맞춤형서비스가가 능했던 DB 구축방식은이제옛것이되어가고서비스생산자뿐만아니라소비자들까지포함한 다양한사람들이쏟아내는정보들을모은집단지성의결과물이실시간으로분석되어제공되고있 어지금과는또다른맞춤형서비스의등장이예견되고있음 빅데이터의활용은산업의투명성을높여효율성을제고해주며, 빅데이터의산업적활용은생산 자와소비자, 자금을대고있는투자자와실행자사이의간격을줄여주고, 실시간확인가능하게 하며, 이들에게필요한데이터를빠르고신속하게제공해줌으로써불필요한행위와그로인한낭 비를줄여줌 뿐만아니라우리의의사결정을보조하거나대신하는기능을수행하기도하는데이는빅데이터기 술이대용량데이터를분석해결과를제시함으로써수행되며소비자또는빅데이터를구성하는일 련의이슈들에대한실험(Experiment) 을가능하게함. 이후상황에맞는대처방법을시뮬레이션 (Simulation) 함으로써빅데이터는기본적으로우리가이때까지보지못했던새로운정보를제공해 줄수있음. 따라서새로운비즈니스모델의성공가능성을제시할뿐만아니라이미제시되었으 나그성패를예견할수없었던비즈니스모델의성공가능성도제시할수있음 이러한빅데이터의일련의기능과과정은현재에만족하지않고새로운것에도전하는개인과기 업, 국가들에게매우매력적으로다가설수있으며, 따라서혁신(Innovation) 의과정에반드시필 요한요소로기능하게됨 * 출처 : K-ICT 빅데이터센터, 2015 [ 빅데이터분석활용현황 ] 32
전략제품현황분석 나. 범위 (1) 데이터형태별분류관점 빅데이터를데이터형태별로분류해보면정형데이터(Structured Data), 반정형데이터 (Semi-structured Data), 비정형데이터(Unstructured Data) 3가지로구분할수있음 정형데이터(Structured Data) 는고정된필드에저장된데이터를말하며관계형데이터베이스 (RDB, Related DataBase) 와스프레드시트(Spread Sheet) 등을예로들수있음. 정형데이터의 경우에는데이터베이스의스키마형식을설계한 DB 기술자에의해, 수집되는정보의형태가정해 지게되어서한정된데이터들속에서유의미한패턴이나결과를도출해야하는한계가있지만, 분 석에있어비교적수월하게분석이가능하다는장점이있음. 정형데이터의예로는고객정보, 상 품판매수량과같이일정한형식에맞춰저장되는데이터들이있음 비정형데이터(Semi-Structured Data) 는정형데이터와같이고정된필드에저장되는데이터는 아니지만, XML(eXtensible Markup Language), JSON(JavaScript Object Notation), HTML(Hyper Text Markup Language) 텍스트등메타데이터(Meta Data) 및스키마(Schema) 를포함하는데이터로특히 HTML의경우인터넷의확산으로 HTML 자료들이방대해지고있는 상황에서정보탐색을위한요구사항들이점차늘어나며웹문서를보다쉽게탐색하고정확하게 해석하여의미있는정보를추출하기위해 HTML5라는변화를가져옴 HTML5 의경우머리글, 바닥글, 탐색줄, 사이드바와같은문서의의미를위한시멘틱태그 (Semantic Tag) 들이추가되며, 문서의구조와영역그리고범위를명확히함으로서웹페이지의 전체또는일부분에의미를부여할수있게되어검색시보다정확한정보를추출할수있도록 도와줌 비정형데이터(Unstructured Data) 는고정된필드에저장되어있지않은데이터를의미하며, 페 이스북, 트위터, 유투브(Youtube) 영상, 이미지파일, 음원, 워드문서, PDF 문서등을예로들 수있음. 비정형데이터는페이스북, 트위터, 네이버(Naver), 다음(Daum) 등에서생성되는실시간 정보들을통해서더많은정보들을수집하고분석할수있음 빅데이터의 80% 이상이형태가정해지지않은비정형데이터이거나반정형데이터이며, 정형데 이터분석을위해서이용되고있는많은기술들이비정형이나반정형데이터에서는활용하기어렵 다는한계를가지고있음. 이러한형태가정해지지않은정보들은분석을위해서비교적복잡하고 수준높은전처리기술을요하지만, 분석방향에따라다양하고유의미한결과를유출할수있다 는장점이있음 33
데이터인텔리전스 - 빅데이터기반 SW (2) 빅데이터처리프로세스분류관점 빅데이터처리프로세스는데이터수집에서출발하여, 데이터저장및관리기술단계를거쳐 데이터전처리, 데이터분석및데이터분석활용, 그리고시각화단계로구성됨 * 출처 : 알앤비소프트, 2013 [ 빅데이터처리프로세스 ] 데이터분석을위하여가장먼저고려해야할사항이데이터수집(Data Collector) 단계로서데이터를수집하기위해서는수집절차를설계하고충분한테스트를걸쳐수집을진행해야함데이터수집은서비스의품질을좌우하기때문에데이터수집절차중심각한문제가발생한다면, 프로젝트전체를다시설계해야할경우도발생하기때문에수집할데이터가결정되었으면수집방법을결정하고수집방법에따른다양한수집기술을선택해적용해야함 수집방법의종류는일반적수집데이터의형태와종류에따라크롤링 (Crawling), ETL(Extraction, Transformation, Loading), 로그수집(Log Aggregator), FTP(File Transfer Protocol), HTTP(Hyper Text Transfer Protocol), RDB 수집방법등으로분류함. 또한, 오라클(Oracle), MySQL 등과같은 RDBMS(Related DataBase Managed System) 데이터를병렬분산처리하기 위해서는 Apache Sqoop(Sql to Hadoop) 을이용하여앞서말했던하둡 HDFS(Hadoop Distribute File System) 로옮겨야함 이외에도오픈소스로그데이터수집기로는 Apache Flume이나 Apache Chukawa 등이있음 [ Apache Sqoop 의역할 ] 34
전략제품 현황분석 데이터 저장 단계에서는 웹(Web) 데이터, 소셜 미디어 데이터(Social Media Data), 비즈니스 데 이터(Business Data), 센싱 데이터(Sensing Data) 등의 다양한 형식의 데이터를 실시간으로 저장 및 관리할 수 있는 분산 컴퓨팅 기술을 말하는 것으로, 분산 파일 시스템(Distributed File System), NoSQL(Not only SQL), 병렬 DBMS(Data Base Managed System) 등의 기술이 있음 빅데이터 전처리 단계에서는 앞서 수집되어 저장된 방대한 양의 데이터와 다양한 형태의 데이터 중 분석에 실질적으로 필요한 데이터를 여과(Filtering)하고 적당한 형태로 변환(Transformation) 하며 정제(Cleansing)과정을 거쳐 통합(Integration)하여 저장하는 일련의 과정을 수행함. 이외에 도 필요에 따라 데이터 축소(Reduction)과정을 거치기도 함 빅데이터 분석 단계에 있어서는 데이터를 효율적이며, 정확하게 분석하여 비즈니스 등의 영역에 적용하기 위한 단계로 과거의 데이터분석과 가장 큰 차이점은 과거에는 다루지 못했던 양의 데이 터를 다양한 컴퓨팅 기술과 기법을 통해 다룰 수 있게 됨 구글은 이러한 측면에서 초기에 MapReduce 라고 하는 프로그래밍 모델과 대용량 데이터 분산처 리프레임워크와 대용량 데이터를 효과적으로 저장하고 확장할 수 있는 GFS(구글파일시스템) 기술 을 확보하고 이를 적극적으로 활용하였음. 이를 바탕으로 구글만의 검색기술과 검색서비스를 가능 하게 함 이러한 그들만의 기술이 논문으로 공개되면서 이를 기반으로 오픈소스 형태의 다양한 대용량 분산 파일시스템과 대용량 분산처리프레임워크 등이 등장하게 됨. 이로 인해 등장한 현재 가장 중요한 분석도구가 스파크(Spark)이며 스파크는 분산병렬처리를 이용한 분석도구로 다양한 머신러닝 (Machine Learning) 라이브러리와 GraphX 등을 제공하며, 대표적인 통계분석 툴인 R만으로는 분석이 불가능하던 방대한 양의 데이터 역시 분석을 가능하게 해주며 스칼라(Scala)와 자바(Java), 파이썬(Python)으로도 분석이 가능함 *출처 : DataBricks [ 스파크(Spark) 구성도 ] 35
데이터인텔리전스 - 빅데이터기반 SW 빅데이터의시각화(Visualization) 는빅데이터분석을통하여도출된결과를쉽게이해할수있도 록시각적으로표현하여전달하는과정을말하는것으로분석에서나타난정보를효과적으로전달 하는것을말함 빅데이터시각화는최소한으로편집된데이터를사용하여데이터의최초형태보다접근하기편하 게데이터를가공하고, 직관적으로분석해서쉽게결과를도출할수있어야함 빅데이터의시각화를도와주는도구(Tool) 에는기초적인도구에서부터프로그래밍(Programing) 이 필요한도구까지다양한도구가존재하며기본적으로정형화된적은양의데이터시각화에적합한 Microsoft Excel에서부터분석과동시에다양한시각화를위한라이브러리를제공하는 우에따라적절한도구의선택이요구됨 R까지경 [ 다양한빅데이터시각화도구 ] 구분 Basic Tools Interactive GUI Control 도구 Excel, CVS/JSON, Gooogle, Chart API, Flot, Raphael, D3(Data-Driven Documents), Visually, infogram Crossfilter, Tangle Mapping Modest Maps, Leaflet, Polymaps, OpenLayers, Kartograph, CartoDB Professional Tools Processing, NodeBox, R, Weka, Gephi * 출처 : 한국데이터베이스진흥원의데이터분석전문가가이드도서, LG CNS 재구성 (3) 빅데이터분석기법관점 빅데이터분석은여러첨단기술들이통합적용되어야하는매우복잡하고, 섬세한작업이며 분석해야할데이터양이방대하고비정형데이터의비중이높기때문에정확한정보추출을위 해서는무엇보다기술력확보가중요함. 또한, 대용량데이터의실시간처리를위해클라우드 컴퓨팅기술은기본이며, 자연어처리, 텍스트마이닝, 기계학습, 시맨틱기술과같은인공지능 기술이폭넓게활용되어야함 자연어처리(NLP; Natural Language Processing) 는글로된인간언어를컴퓨터를통해처리하기 위한기술이며이에는형태소분석, 구문분석, 개체명인식등의기술을포함하며, 주위에서가장 쉽게만날수있는자연어처리예로는구글번역기가있음 정보검색(IR; Information Retrieval) 은빅데이터처리를위한필수기술이며대규모데이터를색인하고, 이중에서주제와관련된데이터를빠르게찾아분석에적용하는기법으로기존의검색과다른점은기존검색은인간을위한정보검색이라면, 빅데이터분석에서의정보검색은컴퓨터가검색시스템을사용하는수요자라는것 36
전략제품현황분석 기계학습(Machine Learning) 은빅데이터분석의핵심기술중하나이며기계학습은충분한학 습데이터로부터모델을생성하고, 해당모델을통해대용량데이터를자동분석, 귀납추론하는 시스템을의미하며통상 SVM 과같은통계이론에기반하며, 자동분류, 자동군집, 베이지안네 트워크기반추론등강력한데이터분석기능을제공함 텍스트마이닝(Text mining) 은대규모텍스트말뭉치로부터의미있는정보를추출, 분석하는기 술로서기계학습기반의통계적방법과규칙기반의방법이있으며, 최근에는이들이하이브리드 형태로결합되어기존의분류, 군집기능외에감성( 평판) 분석과같은기능구현을할수있는 기술임. 특히, 텍스트마이닝은소셜네트워크분석(Social Network Analysis) 의핵심적인기술임 시맨틱(Semantic) 기술은데이터에대한의미적분석이매우중요하며시맨틱메타데이터자동 추출, 시맨틱네트워크생성, 지식베이스구축, 온톨로지의활용, 논리및통계적추론등을통하 여비정형데이터와정형데이터를의미적으로연결하고, 분석하기위한핵심기술임. 왓슨컴퓨 터, 애플의시리, 울프람알파등이이런사실을증명함 데이터마이닝(Data Mining) 은대규모로저장된데이터안에서체계적이고자동적으로통계적규 칙이나패턴을찾아내는기법을의미하며다른말로는 KDD( 데이터베이스속의지식발견, knowledge-discovery in databases) 라고도함 웹마이닝(web mining) 은인터넷을이용하는과정에서생성되는웹로그(web log) 정보나검색 어로부터유용한정보를추출하는웹대상의데이터마이닝기법으로웹마이닝에선웹데이터의 속성이반정형혹은비정형이고, 링크구조를형성하고있기때문에별도의분석기법이필요. 웹 마이닝은분석대상에따라웹구조마이닝(web structure mining) 과웹유시지마이닝(web usage mining), 그리고웹콘텐츠마이닝(web contents mining) 으로구분하며이중웹콘텐 츠마이닝은웹페이지에저장된콘텐츠로부터웹사용자가원하는정보를빠르게찾는기법으로 검색엔진에많이사용함 (4) 빅데이터처리기술관점 빅데이터시대를맞이하면서데이터의폭발적증가와비정형데이터증가로데이터의저장및 처리에어려움이발생함 이러한어려움에대응하기위해선스토리지장비를추가하는것이가장쉬운해결책이지만, 난속도로증가하는데이터양을따라잡기에는비용면에서한계가있음 엄청 이에대안으로현재대기업에서사용하는 MPP(massive parallel processing) 방식역시고비용구조이기에한계상황에거의다다름. MPP란고도병렬처리로프로그램을여러부분으로나눠여러프로세서가각부분을동시수행하는것을말하며이런시장흐름에따라새로운데이터처리 기술에대한수요가증가하고있으며, DBMS 시장에서도빅데이터를위한프로그램들이개발되고있는상황임 빅데이터처리기술을이야기할때빠지지않고등장하는것이바로 하둡(Hadoop) 이며이는저가서버와하드디스크를이용해빅데이터를상대적으로쉽게활용해처리할수있는분산파일시스템으로야후의지원으로개발된오픈소스솔루션임 37
데이터인텔리전스 - 빅데이터기반 SW 현재는아파치소프트웨어의프로젝트로관리되고있으며하둡은빅데이터활용을가능하게만든 빅데이터플랫폼의핵심기술이자사실상의표준임 하둡은빅데이터를저장하는하둡분산파일시스템(Hadoop Distributed File System, HDFS) 과 분산병렬처리를하는맵리듀스(MapReduce) 로구성되며저가장비및스토리지활용으로저비 용으로방대한양의데이터저장및처리가가능하고 터를분산저장하며맵리듀스로빅데이터를초고속으로처리할수있음 HDFS를통해다양한형태의초대용량데이 하둡은크게네가지용도를가지고있는데, 첫째는검색엔진색인저장소(Indexing), 둘째는데이 터분석또는통계분석, 셋째는데이터의전처리(Table Precomputaion and Rollup), 마지막은 정형데이터의저장소(Structured Data Storage) 로서의용도로사용됨 [ Apache Hadoop 및생태계구성도 ] 오픈소스프로젝트 R 은통계계산및시각화를위한언어및개발환경을제공하며또한 R 언어 와개발환경을통해기본적인통계기법부터모델링, 최신데이터마이닝기법까지구현하며개선 이가능함 이렇게구현한결과는그래프등으로시각화할수있으며, Java나 C, Python 등의다른프로그래 밍언어와연결도용이하고 Mac OS, 리눅스/ 유닉스, 윈도우등의대부분의컴퓨팅환경을지원 하는것도장점임 위와같은장점들로인하여 R 은통계분석분야에서인지도를높여왔으며, 하둡환경상에서분산 처리를지원하는라이브러리덕분에구글, 페이스북, 아마존등의빅데이터분석이필요한기업에 서대용량데이터통계분석및데이터마이닝을위해널리사용되고있음 NoSQL은 Not-Only SQL, 혹은 No SQL 을의미하며, 전통적인관계형데이터베이스 RDBMS와 다르게설계된비관계형데이터베이스를의미함 38 대표적인 NoSQL 솔루션으로는 Cassandra, Hbase, MongDB 등이존재. NoSQL은테이블스키 마(Table Schema) 가고정되지않고, 테이블간조인(Join) 연산을지원하지않으며, 수평적확장 (Horizontal Scalability) 이용이하다는특징을가짐
전략제품 현황분석 2. 산업환경분석 가. 산업특징 및 구조 (1) 산업의 특징 빅데이터 산업은 최근 ICT기술의 발전으로 데이터 축적이 급격히 이루어지면서 이를 활용하기 위한 각국 산업계 및 정부의 관심이 뜨거우며 방대한 양의 데이터를 분석하여 가치 있는 정보 를 추출하고 경제적 가치를 창출하는 4차 산업혁명의 핵심 기반 기술로서 산업 전반에 큰 파 급효과를 불러올 것으로 예상됨 각국 산업계와 정부는 빅데이터를 활용한 기술 및 산업의 잠재성에 주목 - 세계 각국은 빅데이터 기술이 기존 산업뿐 아니라 미래 산업에서도 경쟁 역량 차별화를 위한 필 수 자산으로 인식 - DT(Data Technology) 시대에서는 데이터를 활용해 돈을 버는 일이 미래의 핵심 가치가 될 것 (中 알리바바 CEO, 마윈) - 전 세계 기업 중 빅데이터 기술을 도입한 기업의 비중이 확대되며 업계의 관심 증가 - 미국, EU, 일본 등 선진국들은 정부 차원 육성책 추진 중 빅데이터는 4차 산업혁명의 핵심 기반 기술로서 업계 R&D 및 M&A 투자 활발 - 16.1월 다보스 포럼에서 WEF(World Economic Forum)는 인공지능이 4차 산업혁명을 이끌며 산업 전반에 큰 파급효과를 불러올 것이라고 예측 - 인공지능의 판단 및 학습능력 향상을 위해서는 빅데이터 수집 분석 활용 기술이 필수적으로, 구 글 페이스북 등은 M&A 및 R&D에 집중 투자하며 시장 선점을 위한 주도권 경쟁 중 - 빅데이터는 인공지능, 자율 주행차, 사물인터넷, 로봇산업 등 4차 산업혁명의 성공을 좌우하는 필 수 기술로 부각 중 *출처: 한국전자통신연구원( 15.7), 빅데이터, 인공지능에 의한 경제사회의 변혁 [ 4차 산업 혁명의 파급 효과 ] 39
데이터인텔리전스 - 빅데이터기반 SW 기업전반에서빅데이터에관심을보이던시기를지나, 이제특정업종또는워크로드별로실제인프라를구현하는시기로접어듦에따라운영분석및보안분석과같이내부통제나정보거버넌스등의직접적인비즈니스요구사항과맞물려, 대용량실시간로그분석등기존시스템관리나보안분야에서빅데이터분석기술을접목하는방식으로진화하는양상을보임 제조분야에서머신데이터분석을통한품질관리에투자를확대하고있으며, IoT와연계한센서 데이터의활용방안을모색하는등아직전사적이진않지만부분적으로빅데이터분석기술을활 용하는사례들이꾸준히증가하는추세임 대형제조사를중심으로소셜분석이나텍스트마이닝과같은빅데이터분석기술을적용해제품 개발및고객관계강화에활용하고있으며, 제조공정의기계설비, 장비들에서나오는머신데 이터분석을통해제품공급관리나품질관리의효율성을제고 유통분야는오프라인, 온라인, 모바일, 콜센터등폭넓은옴니채널의활용과온오프라인을넘나 드는고객과소통강화를위해빅데이터분석에투자를확대하고있는추세임 주요통신사는 CDR 분석, 네트워크및시스템관리등에빅데이터기술을적용해서비스품질강 화에활용하고있으며내부빅데이터적용성과를사업모델화해클라우드기반빅데이터분석플 랫폼을제공하고있으며, 공공분야에적용해공익사업에참여하는추세임 모바일, 소셜, 클라우드, 빅데이터를주축으로한차세대 IT환경인 3세대플랫폼에기업의 IT투 자가집중될것으로예상되며또제2의플랫폼에대한투자는 2015년부터하향세로돌아설 전망이며신흥시장의 ICT 투자는 7,1%, 선진시장은 1.4% 각각증가할것으로예상됨 3세대플랫폼이전세계 ICT 투자의 1/3을차지하며증가율은 100% 에달할것으로예상되며현 재 3 세대플랫폼에서가장중요한단계인 ' 혁신단계(Innovation Stage)' 로들어서고있는단계임 앞으로몇년간 3세대플랫폼에기반한혁신과가치창조가크게증가할것으로전망되며새로운 핵심기술이혁신가속기로작용하면서이단계를견인할것이고그러면전산업에걸쳐 플랫폼의힘과애플리케이션이확대될전망임 3세대 통신의 IT 투자가가장활발하며, 이가운데가장크게증가하는분야는무선데이터로, 규모는 5,360억달러며비중은 13%. 통신사업자는인프라공급자와의차별화를위해플랫폼과 API 기 반서비스를개발해부가가치를창조하고, 개발자를유치하는노력에박차를가할것이며한편으 로는혁신적인성과와이익공유약정을통해 강화해나갈방안을모색할것임 OTT(Over The Top) 클라우드서비스와의협력을 모바일기기와앱의성장세가계속유지되겠지만, 최근몇년간의성장세에는비하지못할것으로 전망되며스마트폰과태블릿매출액은미화 4,840 억달러로( 통신서비스를제외한) IT투자증가액 의 40% 를차지할전망임 특히중국업체들이세계시장에서점유율을넓혀갈것이며혁신적인웨어러블기기도더욱크게 늘어날것이며, 모바일앱다운로드수는하락이있겠지만, 엔터프라이즈모바일앱개발은 2배로 증가할것으로예상됨 40
전략제품현황분석 인지/ 머신학습, 사물인터넷(IoT) 분석분야에서도새롭고중요한발전상이전개될것으로전망되 고, IoT 지출의 1/3은 IT 및통신이외분야의지능형장치에집중될것으로보임. 또한통신산 업은유수 IT 회사와협력해산업솔루션시장을개척하는방안을검토중에있음 빅데이터분석은스마트데이터로발전하여점점더많은기업들이기계에서생성되는머신데 이터의가치를이해하기시작할것이며닥치는대로데이터를수집하기보다는실질적인정보를 확보하기위해가장관련성이높은데이터를수집하는데초점을맞출것임. 또한, 고객이나직 원으로부터데이터를수집하는것에그치지않고, 머신에서생성된데이터로비즈니스가치를 창조하는방법을찾는기업들이증가할것으로분석됨 가트너는불과몇년전만하더라도분석을위해고객이나직원의데이터를가능한많이수집하는 기업들이많았으나, 앞으로는기업이추구하는비즈니스성과와관련이있는부분에초점이맞춰 질것이며, 과거에는확보하지못했던통찰력을주는데이터를더욱추구하게될것임 사물인터넷과웨어러블기기가부상하면서기업들이이용할수있는머신데이터가더욱많아지게 되었으며, 가능한많은정보와통찰력을획득하기위해머신데이터를인간이생성하는데이터와 통합해이를활용한방법이가져다주는가치와기회를평가하는기업들이늘어날것으로전망됨 많은머신데이터를입수하고, 교통망, 분산형발전및공급, 의료, 비재생자원의재사용, 산업 자동화, 농업등에있어복잡한최적화문제를해결할때빅데이터의잠재력이실현될것이며, 빅 데이터는머신생성데이터에기반을두고있는모든경제부문의새로운자동화, 파괴적인혁신 의형태로가시화된혜택을가져올것임 (2) 산업의구조 다양하게정의되고있는빅데이터분야도산업구조적측면에서는여타 ICT(Information and Communications Technologies) 산업과마찬가지로크게하드웨어와소프트웨어그리고서비스부문으로구분되어짐 세부적으로는서버, 스토리지, 네트워크, 운영체제등을제공하는장비산업과빅데이터전문소프 트웨어와플랫폼을제공하는소프트웨어산업, 빅데이터솔루션을이용하기위하여요구되는유지 보수, 교육훈련및비즈니스분석에활용하는컨설팅등을포함하는서비스산업으로분류가능 하며특히, 소프트웨어부문에있어서는빅데이터수집및관리부문과빅데이터분석부문으로 세분화할수있음 빅데이터산업구조상각세부산업별비중을살펴보면, 시장조사기관별로다소차이는있으나 빅데이터서비스부문이 41.5~44%, 하드웨어부문이 28.9~31%, 소프트웨어부문 25~29.7% 의비중을차지하고있어빅데이터서비스부문이가장높은비중을차지하고있음을알수있으 며이를통해빅데이터의주요기술들이구현되어적용되는서비스영역이전체빅데이터시장에 서매우중요한비중을차지하고있음을알수있음 41
데이터인텔리전스 - 빅데이터기반 SW 빅데이터산업구조에서큰비중을차지하는서비스부문중, 전체빅데이터관련출원현황에서 중소기업이차지하는비중은 72.8% 이며, 특히 2015년상반기빅데이터관련전체출원 150건 중중소기업이서비스부문에만출원한건이 102 건(68%) 에달할정도로, 중소기업의서비스부문 출원이큰폭으로증가하고있는데이런결과는시장변화에맞춰신속하게의사결정을하여발빠 르게대처할수있는중소기업의이점이작용된것임 * 출처: 특허청 [ 빅데이터부문별/ 주체별출원비중 ] 소프트웨어부문의경우, IDC는소프트웨어가이분야에서 2019년 550억달러의시장을형성할 것으로예상되며특히최종사용자쿼리, 보고, 분석도구및데이터웨어하우스관리툴이이중 절반이상을점유할것으로전망함 빅데이터하드웨어시장은 2019년 280억달러규모를형성할것이라고 IDC 는예측. 산업별로는 다음 3가지업종이두드러짐 [ 산업별예상시장규모 ] 산업 시장규모 개별제조 (Discrete manufacturing) 19년 228억달러 은행 (Bank) 19년 221억달러 공정제조 (Process manufacturing) 19년 14억달러 * 출처: ciokorea 빅데이터및비즈니스애널리틱스를성장시키는주요견인요인은 500 인이상의대기업. 여기에 서 2019년 1,400억달러의매출이발생한다는전망되지만 500인이하의중소규모기업또한비 중이작지않아서전세계매출의 1/4 정도를담당할것으로관측 42
전략제품현황분석 빅데이터산업은데이터의생성과분석, 재가공의과정에서데이터를둘러싼많은개체가활동 을하고, 빅데이터서비스제공을위하여여러산업과기업이상호작용하는복잡한구조이며 빅데이터산업의구성은빅데이터자체와행위자, 가치생산자, 외부환경으로볼수있음 빅데이터는개인, 기업, 공공의서로다른분야에서생산되고있는데이터를의미함과동시에데 이터와데이터간의관계를포함하는개념 빅데이터생산자는서비스를이용하고, 기업활동을통한원시데이터를생산하는개체를말함. 생산자의범위와역할로개인의경우일상생활활동, 기업은단순비즈니스활동, 정부의경우에 는공공빅데이터생산이있음 가치생산자에는빅데이터제공자와빅데이터서비스제공자, 빅데이터유통업자로나눌수있으 며, 빅데이터제공자는빅데이터확보를위한수집, 저장, 가공활동을함 기업의경우빅데이터확보및활용을위한일련의프로세스과정에연관되며, 정부는빅데이터 제공자역할을수행하며빅데이터서비스제공자는빅데이터를분석, 추론및빅데이터서비스기 획, 제공, 빅데이터유통활동등의과정에관련되며빅데이터유통업자는새로운가치창출을위 한빅데이터공유, 재가공을통한빅데이터와서비스의재생산을수행함 외부환경으로는빅데이터산업을둘러싼다양한산업, 문화, 기술적환경을말하며외부환경으 로예로는클라우드, IoT, 스마트팩토리(Smart Factory) 등이있음 43
데이터인텔리전스 - 빅데이터기반 SW 나. 경쟁환경 국내빅데이터산업의산업수준, 기술경쟁력및환경측면에서의분석 산업수준 : 정부와산업계가방대한데이터를수집및저장하고있지만아직데이터분석과활용 은전통적방식에크게의존하고있었음. 하지만, 정부 3.0의추진등으로정부와민간의활용이 늘어나고있음 기술경쟁력의경우빅데이터핵심기술에서 2~4년의기술격차가존재해외국의솔루션들에의해 시장이잠식당하는현상이발생할우려되며또한빅데이터분석전문가, 데이터관리자등고급인 력이부족하고빅데이터산업을체계적으로지원할수있는정책안이나법, 제도적근거등이미 흡한상황임 빅데이터에대한인식부족등으로선진국과상당한격차를보이고있어정책적인뒷받침이필요 하며특히, 우리나라는통신, 제조업이발달해있어성장잠재력이매우큰상황이므로적극적인 촉진책과국가적전략및산업육성정책이뒷받침해준다면빅데이터의사회적확산과국민적호응 을기대해볼수있음 * 출처: NIA, 2015 년빅데이터시장현황조사, 2016 [ 국내빅데이터분석활성화관련정책요구사항 ] 빅데이터에대한밝은전망에도불구하고, 많은기업들이빅데이터분석의활용방안을모르고있으며, 국내빅데이터분석을활용한사례가아직적기때문에특히중소기업이쉽게진입하지못하고있음 국내기업들이빅데이터분석활용에참고할수있는성공사례와적용모델이전파될수있도록 최근정부차원에서빅데이터분석의활용을적극추진중이며, 미래창조과학부와 NIA에서또한 다양한산업에걸쳐시범사업을추진중 44
전략제품 현황분석 [ 2016년 빅데이터 분석 시범사업 선정 과제 ] 구분 주관기관/참여기관 과제명 KT/질병관리본부 로밍 빅데이터를 활용한 해외로부터의 유입 감염병 차단 서비스 개발 W쇼핑/한동대 빅데이터 딥러닝 기술 활용 스마트 T-커머스 서비스 개발 선도사업 매일유업/그린비즈니스협회 유가공 업종 제조 생산, 에너지 최적화를 위한 빅데이터 플랫폼 개발 유라/충북대 등 딥러님 기술 기반의 대용량 제조 데이터 분석 서비스 플랫폼 개발 ING생명/생명보험협회 생명보험 빅데이터 전략모델 개발 및 확산 산업확산 삼성중공업/현대중공업 등 제조업 빅데이터 전략모덱 개발 및 실증 *출처 : NIA, 미래부-NIA 2016년 빅데이터 시범사업 착수, 2016 다. 전후방산업 환경 빅데이터는 우선적으로 방대한 데이터를 다루다 보니, 서버, 네트워크, 스토리지 등의 하드웨어 (HW: HardWare) 장비들 중에서도 특히 스토리지 인프라 산업이 빠르게 성장해 나가고 있으 며 빅데이터 산업에서 하둡을 비롯한 오픈 소스 기반 분산 병렬 처리 플랫폼 도입이 보다 확 대됨에 따라, 분산 파일 시스템과 고용량 저가 인프라를 기반으로 한 소프트웨어 정의 스토리 지(SDS; Software Defined Storage)로의 전환이 빨라지고 있음. 또한 이와 함께 대용량 데이 터를 빠르게 분석하고 처리하기 위한 인 메모리(In-Memory) 기반 기술과 올 플래시 스토리지 의 활용도 확대될 전망임 *출처: IDC (단위: 억원) [ 국내 빅데이터 스토리지 인프라 시장 전망, 2014-2018 ] 45
데이터인텔리전스 - 빅데이터기반 SW 빅데이터소프트웨어솔루션은빅데이터처리프로세스전반에걸쳐데이터수집부터저장, 석, 시각화까지모든분야에서뜨겁게발전하고있음 분 또한빅데이터소프트웨어솔루션들의특징은많은부분에서오픈소스를기반을두고있음. 빅데 이터소프트웨어에서빼놓을수없는 MySQL, 몽고DB, 하둡, 스파크, 하이브, R 모든것이오픈 소스임 그러나오픈소스는비교적진입장벽이높고트러블슈팅(Trouble Shooting) 이슈가있음. 따라 서접근성과유저편리성측면에서우수한소프트웨어가필요하지만, 대부분해외기업이기술을 보유하고있으므로, 국내기업들의기술격차를줄이기위한지원이필요함 빅데이터는다양한산업에다양한형태로적용될수있으며의료산업의경우 ICT 힐링플랫 폼등을통한개인건강정보의축적및의료기관등과공유및활용, 정보보안산업의경우빅 데이터분석을통한해킹등의보안사고징후파악및조기대응, 제조산업은완제품품질향 상등을위한스마트팩토리, 소비산업에서는구매패턴및트랜잭션분석등을통한소비트렌 드예측및시뮬레이션, 물류산업의경우수요예측및제어등의물류, 유통체계최적화등에 적용가능함 빅데이터핵심기술산업으로는데이터가상화기술을통한분산된데이터의논리적통합지원, 분산, 병렬처리기술을이용한실시간분석엔진, 일체형의빅데이터관리, 데이터클라우드플 랫폼을이용한클라우드기반맞춤형하둡실행환경, 비정형데이터의 80% 이상이영상임을 해결하기위한대용량비정형이미지분석기술, 개인정보보호이슈해결을위한익명화 (Masking) 처리등이있음 * 출처: Gartner [ 산업별빅데이터관련투자현황및계획 ] 46
전략제품 현황분석 3. 시장환경분석 가. 세계시장 세계 빅데이터 시장은 두 자리 수 이상의 성장세를 지속할 전망으로 15년 333억 달러에서 20년 609억 달러로 성장할 것으로 예측 수요 산업별로는 제조업, 은행업 등에서 동 기간 중 연평균 60% 이상의 초고속 성장이 예상되며 공공행정, 통신, 유통업 등에서도 19년 100억 달러 이상의 시장규모 형성 전망 *출처: 위키본(ʼ15.5), Big Data Market Forecast 2011-2026ʼʼ [ 2015 ~ 2019 세계 빅데이터 시장 규모 전망 ] [ 빅데이터의 세계 시장규모 및 전망 ] (단위 : 십억달러, %) 구분 15 16 17 18 19 20 세계시장 33.31 37.97 43.4 49.28 55.22 60.91 CAGR ('13~'15) 30.4% * 자료: 위키본(ʼ15.5), Big Data Market Forecast 2011-2026ʼʼ, Statista, Forecast of Big Data market size, based on revenue, from 2011 to 2026 빅데이터산업의 급성장과 함께 전 세계적 투자붐 조성 중 신생 빅데이터 업체 중 상위 4개의 확보투자액이 14년 말 기준 약 700억 달러를 기록 '15년 미국의 기술관련 VC 투자 중 11.3%인 66.4억 달러가 빅데이터 스타트업에 투입 '13년 글로벌 벤처투자사인 Accel Partners(美)는 1억 달러 규모의 빅데이터 전문 투자 펀드 출 범투입 47
데이터인텔리전스 - 빅데이터기반 SW [ 빅데이터관련주요업체투자현황 ] 업체명확보투자액사업분야 Mongo DB Mu Sigma Cloudera Opera Solutions 231억달러문서기반데이터베이스 208억달러데이터분석서비스 (Daas) 141억달러 Hadoop 기반 SW, 서비스 114억달러데이터분석서비스 (Daas) ICT 산업의발전에따른방대한데이터축적및데이터분석기술이발전하면서다양한업종 에서빅데이터시장진출 마스터카드, 오라클등글로벌기업들은우수기술보유스타트업을 M&A 하면서빅데이터선도 기업으로성장 이들기업들은막대한자본, 기술을투입해빅데이터분석기술( 프로그래밍, 컴퓨팅인프라) 고도 화에노력 [ 美대기업들의빅테이터관련스타트업 M&A 현황 ] 구분시점인수액피인수회사 Master Card 15.2Q 6억달러 ORACLE 14.1Q 4억달러 YAHOO 14.3Q 3억달러 -Applied Predictive Technology - 클라우드기반데이터분석 -Bluekai - 클라우드기반마케팅서비스 -Flurry - 모바일정보분석및광고플랫폼 Microsoft 15.1Q 2억달러 -Equivo - 머신러닝기술, 데이터관리 * 출처 : 산은조사월보, 2016. 10 제731호 빅데이터선도국들은빅데이터산업활성화를위한필수조건인개인정보보호관련규제를비교 적명확하게규정함 다양한산업데이터의원활한융합을위해서는명확한개인정보보호법정비, 환경필수적인전제조건임 유연한데이터공유 미국의경우, 창출용이함 산업분야별로개인정보범위가확립되어모호한해석에따른비효율방지및성과 48
전략제품현황분석 EU 및일본의경우개인정보범위가비교적명확히규정되어있고개인정보이용의사전동의뿐아 니라사후동의도허용하는등빅데이터활용여건우수함 [ 각국의개인정보法내용 ] 구분국가내용 개인정보의정의 미국 EU 일본미국 공공통신등산업분야별개별법에따라상이 식별되거나식별가능한자연인ʼ에관한정보 다른정보와쉽게조합하여특정한개인식별이가능한정보 개별법에따라상이한사전사후동의방식채택 동의방식 EU 사전동의방식이기본이나, 정당한이익추구시사후동의허용 제재 일본 미국 EU 사전동의및사후동의방식동시허용 개별법에따라상이한형벌또는행정벌규정 개인정보처리위반시형벌적용 일본시정권고조치후, 추가위반시형벌 * 출처: 한국정보화진흥원 ( 15.12), 개인정보보호법제로인한빅데이터활용한계사례 49
데이터인텔리전스 - 빅데이터기반 SW 나. 국내시장 국내빅데이터시장은최근 ICT 업계의성장과함께높은성장세를기록중이나, 세계시장과는 큰격차가있음 15년기준국내시장규모는약 2,623 억원으로 14년대비 30.5% 성장하였으나, 세계시장 내비중은 0.2% 에불과 국내기업들의빅데이터도입률은 4.3%( 15년 10 월기준) 수준으로, 글로벌기업들의도입률 (29%) 에비해크게저조 국내빅데이터시장은포털사, IT 공을시작하는초기단계임 업체등이자사보유데이터를바탕으로빅데이터서비스제 국내 ICT 산업은경쟁력이높고데이터생산량이많아빅데이터산업의성장잠재력이크지만도입의필요성인지부족및개인정보법등법적리스크로활용은저조한상황 향후사물인터넷, 클라우드와빅데이터연계가이루어지면서성장세는지속될전망 국내시장은 13 년~ 17년중연평균 28.8% 의높은성장예상 제품별비중으로는하드웨어(34.8%), 소프트웨어(27.7%), 서비스(27.2%) 순으로높은성장예상 업종별로보면제조업, 물류, 유통, 금융, 의료분야에서높은성장예상 선진국들의빅데이터산업육성추세에따라정부도 13년부터지원정책을추진중 13 년 빅데이터산업발전전략 수립및추진, 정부 3.0 으로공공데이터개방추진함 한국정부도빅데이터를 14년 12월 19 대미래성장동력산업으로선정하고 15 년부터 20년까지 총 4,869억원투입예정임 국내업계는금융통신등특정업종을제외하면아직까지빅데이터도입에대한인식이많이 부족한상황이며국내기업이빅데이터도입에무관심한이유는아래 4가지등으로나타남 데이터분석필요성인지부족(31.6%), 부족한데이터양(30.7%), 경영진의무관심(11.9%), 도 입성과에대한불확신 (9.8%) 특히, 공정상충분한내부데이터확보가가능한제조업계의관심도가낮은데이는도입효과에대 한불신때문으로조사 기업규모가작을수록자사보유데이터양의문제로빅데이터도입을꺼리는경우가많음 금융권의경우아직은신규서비스제공, 응답기업의절반이상이도입을고려 신용평가개선등에제한적으로활용하고있으며향후 50
전략제품 현황분석 15년 시장조사에 따르면 도입역사가 짧아 성공사례가 없는 점도 기업들이 투자를 기피하는 주 된 요인임 국내 빅데이터 기술 수준은 선도국인 미국 대비 78.4%(기술격차는 3.7년)에 불과함 [ 국내 기업의 빅데이터 도입 무관심 사유 ] 내용(응답률) 1 데이터 분석 필요성 인지 및 활용법에 대한 판단의 어려움(31.6%) 2 미비한 내부 데이터 보유량(30.7%) 3 경영진의 무관심(11.9%) 4 빅데이터 도입 성과에 대한 불확신(9.8%) *출처: 한국정보화진흥원( 16.2) 모호하고 규제 중심의 개인정보 관련법, 전문 인력 부족 등도 빅데이터 산업 발전에 걸림돌이 되고 있음 개인정보보호 법제의 산재, 포괄적인 개인정보 범위로 데이터 활용시 과도한 제약, 형사 처벌 중 심의 규제 등이 문제점으로 작용 국내 빅데이터 인력은 기초 DB 구축 인력이 대다수로 빅데이터 분석 활용 전문가가 태부족인 실 정임 정부의 공공데이터 개방 수준 미흡, 데이터 거래시장의 全無 등 데이터 유통의 폐쇄성도 해결과제 임 국내 빅데이터 시장규모는 KISTI의 마켓리포트에 의하면 매년 70% 대의 고성장을 이룰 것으 로 전망되며 국내 빅데이터 시작 규모는 2016년 3,300억 원을 시작으로 2020년까지 1조 원 대 규모로 성장할 것이며, 국내 ICT 관련 산업에서 빅데이터가 차지하는 비중 역시 2020년에 는 약 2.6%에 이르고, 세계 빅데이터 시장의 약 2%를 점유할 것으로 전망되며 현재 국내에 는 SK텔레콤을 포함 센솔로지, 아크원소프트 등 14개의 대 중소기업이 빅데이터 솔루션 및 서 비스 사업을 추진 중에 있음 [ 빅데이터의 국내 시장규모 및 전망 ] (단위 : 백만달러, %) 구분 15 16 17 18 19 20 CAGR ('13~'15) 국내시장 263.2 332.8 422.7 539.3 692.1 893.8 26.9% *출처: 한국정보화진흥원( 16.2) 51
데이터인텔리전스 - 빅데이터기반 SW 4. 기술환경분석 가. 기술개발트렌드 빅데이터와클라우드의접목으로클라우드는어디에서든찾아볼수있을정도로확산중에있으며또한기업에서역시클라우드를채택하는사례가늘고있음. 빅데이터가이와같은클라우드의성장에한층더박차를가하고있음 SQL과 NoSQL간의과도기로업계내 NoSQL의입지가더욱굳건해지고있는상황이며 NoSQL 은확장성, 유연성, 크기가큰데이터집합을신속하게활용할수있는역량을제공할 수있도록고안되었다는장점을가지고있음 MarkLogic, Casandra, Couchbase, MongoDB와같은기업은 SQL 데이터베이스시장에새로운혁신을불러일으키고있으며새로운영역에대규모생산을구현함으로써상당한실적을거두고있음 Hadoop 이현데이터베이스아키텍처를독점하든, Hadoop과기타데이터베이스업체가경쟁 하는양상을보이든, 확실한것은바로 Hadoop이오늘날많은기업에서빅데이터아키텍처의 일부를구성하고있다는점 많은기존데이터저장소업체가다양한방식으로 대표데이터베이스제공업체중일부는시장선두기업으로손꼽히는 Hadoop 을자사의아키텍처에접목하고있음. Teradata, SAP, HP와같은 Hadoop 업체의서비스를도입하고있으며 IBM과같은기업은이미고유의 Hadoop을개발한 상태. 또 Spark와 Impala 는지속적으로성장하며기존의시장을한층더압박. 이렇듯 Hadoop 은향후오랜기간동안활용될것으로예상되며현재빅데이터아키텍처의필수요소로자리매김 [ Hadoop 의분산파일시스템(HDFS) 처리구조 ] 52
전략제품현황분석 대규모데이터레이크란별도로정제되지않은자연스러운상태의대규모데이터를의미하는개념으로현재는초기단계이며데이터레이크는한없이쏟아지는대규모데이터를효율적으로보관, 관리및사용하는문제와관련하여몇가지근본적인해결책을제시하기위한개념임 Google이나 Facebook 같은최첨단기업들은이미데이터레이크를효율적으로활용하는방안을수립한상태이나데이터레이크를본격적으로활용하는기업은아직극소수에불과하며 Gartner 에서지적한바있듯이데이터레이크를효율적으로활용하기위해서는새로운관리방식이필요하다는점에주목해야할것임 최근몇십년동안은분석워크로드가운영프로세스를방해하는것을방지하기위한방법으 로운영시스템과분석시스템을분리해서운영중 2014 년초가트너는데이터중복없이온라인거래처리(OLTP) 와온라인분석처리(OLAP) 가모두 가능한새로운데이터플랫폼시대를예측하며 HTAP(Hybrid Transaction/Analytical Processing; 하이브리드트랜젝션/ 분석프로세싱) 를언급한바있음 많은수의업계선도기업들이고객선호도, 경쟁력강화및비즈니스상황변화등에신속하게대응할수있도록실시간운영업무와대용량데이터분석업무를결합하는방식을채택함으로써컨버지드, 즉통합방식이주류로떠오를것으로예측되며이와같은통합방식은기업의데이터 실행(data-to-action) 단계를가속화하고데이터분석과비즈니스성과실현간의시간차를좁힐수있을것임 데이터기술은주기적으로중앙처리방식에서분산처리방식으로또그반대로반복적으로이 동을거듭하며발전해왔으며초기빅데이터솔루션은데이터중복제거, 간소화된관리및 360도고객분석을포함한다양한애플리케이션지원등에초점을두었으나 2016년대규모의 기업들은다양한디바이스, 데이터센터, 활용사례관리및데이터보안규정변경등빅데이 터운용시발생하는이슈에대응하기위해분산처리방식으로점차이동중이며, 분산처리방 식의도입은사물인터넷(IoT), 빠른네트워크, 센서(Sensor) 대중화및엣지프로세싱(edge processing) 분야의지속적인성장에힘입어앞으로더욱확산될것으로예상됨 기업들은모든데이터에서가치를이끌어내려할것이며, 이는단순히 IoT(Internet of Things) 가아니라통찰력을제공할수있는 IoAT 데이터( 기기, 센서, 기계를넘어서버로그, 지리적위치, 인터넷의데이터등으로부터생성된것등) 를말함 53
데이터인텔리전스 - 빅데이터기반 SW 나. 주요업체별기술개발동향 (1) 해외업체동향 빅데이터는대용량데이터처리기술인하둡을비롯해, 전통적인 RDBMS를보완하기위한 NoSQL(Not only SQL), 방대한기술세트를사용중에있음 그리고각종데이터시각화(Data Visualization) 기법에이르기까지 빅데이터에가장많은투자를하고업체는 IBM. IBM은 2009년 2월에스마트플래닛전략을 발표하면서일찍이 BAO(Business Analytics and Optimization) 을강조하기시작함 2010년 7월에통계분석솔루션업체 SPSS를 12 억달러에인수했고, 2010년 9월에는데이터웨 어하우스업체네티자(Netezza) 를 17억달러에인수하였으며이후 IBM은 2011년 11월에 10PB 의데이터를수분내에분석할수있는 IBM 네티자하이캐퍼시티어플라이언스 발표했고, 2012 년 3 월에는의사결정을위한예측분석역량을제공하는 IBM 스마터애널리틱스 를발표. IBM은 140억달러를투자해빅데이터관련업체 24개를인수하고 8천여명의 BAO 컨설턴트를확보해 빅데이터와관련된토털서비스제공에나서고있음 EMC의행보도주목할필요가있는데 2009년 11월 EMC는 VM 웨어, 인텔, 시스코와함께 VCE(Virtual Computing Environment) 를설립하고상호협력하여사업을전개하기시작함 그리고 2010년 7 월에데이터웨어하우스업체인그린플럼(Greenplum) 을인수했으며( 인수금액은 미공개), 2010년 11 월에는네트워크스토리지업체인아이실론(ISILON) 을 22억 5천만달러에인 수한바있음 EMC는 2012년에하둡분산파일시스템과통합된엔터프라이즈 NAS 인 EMC 아이실론스케일아웃 NAS 를출시하였으며 EMC는인수합병에 140억달러를투자한것으로알려지고있음 EMC의 3대슬로건은 Cloud Transforms IT, Big Data Transforms Business, Trust in Your Cloud인데클라우드와빅데이터를전면에내세우고있음을알수있음실제로는클라우드와빅데이터는밀접한연관성을갖고있는데많은세부기술들이상호중복되므로클라우드와빅데이터는앞으로서로영향을미치며동반발전할것으로전망됨 IBM, EMC 와사업방향은다르지만구글은빅데이터에서가장중요한업체중하나임 구글은플랫폼업체로서오래전부터온라인, 오프라인할것없이수많은데이터를모으고있는 중이며일찍이검색을위해인터넷상의웹페이지를수집하고있을뿐만아니라, 지메일, 캘린더 등의무료서비스를통한사용자데이터와스트리트뷰, 북스라이브러리프로젝트등을통해오프 라인데이터, 구글플러스등을통한 SNS 의데이터, 안드로이드기기를통한디바이스의데이터 까지모으고있음 54
전략제품현황분석 즉, 사용자가구글이제공하는서비스를이용하기만하면구글의클라우드에데이터가자동으로쌓이는구조이며구글은이렇게모은데이터를각종광고사업에활용해수익을창출하고있음 현재가장많은데이터를수집하고있을뿐만아니라가장다양한형태의데이터를수집하고있는업체가바로구글이며또한구글은그래프알고리즘의처리를지원하기위한기술인 Pregel, 대용량데이터를분산처리로빠르게분석할수있는기술인 Dremel, 검색인덱스를작성하기위한기술인 Percolator 등의빅데이터관련기술및도구들을직접개발하여사용하고있음 세계최대의 SNS인페이스북은그자체로이미클라우드이자빅데이터플랫폼이라고할수있음 페이스북은개인의신상정보및관심사, 활동내역에대한각종데이터를인터넷에서뿐만아니라오프라인을통해서도끝없이수집하고있으며이를소셜광고에활용해수익을창출하고있음 페이스북의기업가치는바로이러한빅데이터로부터나오는데흥미로운점은페이스북이내부조직의프로세스분석에도빅데이터기술을적극활용하고있다는점으로페이스북은페이스북에자사임직원들이올리는글과타임라인등을분석해서로커뮤니케이션이활발한직원들끼리팀을구성하게하는등조직향상에도빅데이터를활용중 55
데이터인텔리전스 - 빅데이터기반 SW [ 빅데이터기술/ 업체목록 ] Hardware Storage Servers Networking Big Data Distributions Open source Hadoop distributions Enterprise Hadoop distributions Non-Hadoop Big Data frameworks Data Management Components Distributed file stores NoSQL databases Hadoopoptimived data warehousing data integration Data quality and govermance Analytics Layer Analytic application development platforms Advanced analytics applications Applications Layer Data visualization tools Business intelligence applications Services Consulting Training Technical support Software maintenance hardware maintenance Hosting/ Big-Data-asa-Service/ cloud Vendors include Dell, HP, Arista, IBM, Cisco, EMC, NetApp. Vendors/ providers include Apache, Cloudera, Hortonworks, IBM, EMC, MapR, LexisNexis. Vendors/ providers include Apache, Datastax, Pervasive Software, Couchbase, IBM, Oracle, Informatica, Syncsort, Talend. Vendors/ providers include Apache, Karmasphere, Hadapt, Attivio, 1010data, EMC, SAS Institute, Digital Reasoning, Revolution Analytics. Vendors include Datameer, Clickfox, Platfora, Tableau Software, Tresata, IBM, SAP, Microstrategy, Pentaho, Qliktech, Japersoft. Vendors include Tresata, Tidemark, Think Big Analytics, Amazon Web Services, Accenture, Cloudera, Hortonworks. Next Generation Data Warehouse Appliances MPP, columnar data warehouse appliances. in-memory analytics engines Fast data loading Vendors include EMC Greenplum, HP Vertica, Teradata Aster, IBM Netezza, Kognitio, ParAccel. * 출처 : 위키본 56
전략제품 현황분석 (2) 국내업체동향 그루터는 국내외에서 잘 알려진 하둡 관련 기술을 보유한 업체로서 빅데이터 관련 플랫폼, 기 술, 솔루션 전문 기업으로 빅데이터 플랫폼 구축 및 컨설팅 서비스, 빅데이터 분석 및 데이터 제공 서비스, 빅데이터 분석 플랫폼 제공 서비스 구축 등의 사업을 진행 중임 빅데이터 플랫폼, BAAS(Bigdata Analysis & Application System) : BAAS는 다양한 오픈소스 와 그루터 자체 기술로 구성된 소프트웨어 스택 솔루션 제공함 [ BAAS 개념도 ] 하둡 솔루션 전문 업체인 넥스알은 KT에서 M&A하여 현재는 KT NexR이 된 기업이며 넥스알 빅데이터 분석 플랫폼(NDAP; NexR Data Analytic Platform)이 주력 솔루션임 빅데이터 배치 처리 및 근 실시간 검색 플랫폼, NDAP : 빅데이터 분석을 위한 모든 작업(수집/저 정/분석/검색/관리 등) 및 실시간 데이터 질의를 처리할 수 있는 소프트웨어 플랫폼 [ NDAP 구성도 ] 57
데이터인텔리전스 - 빅데이터기반 SW 다음소프트는 SNS 정보기반여론진단서비스, 소셜미디어트위터, 블로그트렌드분석등 을서비스하며, 소셜미디어상의데이터들에서의미있는정보를찾고, 조직화함으로써정보간 의관계나패턴, 트렌드등을분석하는서비스를제공 버즈량분석 : 특정이슈및아이템관련문서의발생건수를시간별, 일별, 월별, 연도별로분석 하여화제가된지점을포착 연관어분석 여통계적으로분석 감성분석 : 단어의사용비중을분석 빅마우스분석 : 특정이슈및아이템관련문서에서사용된단어를텍스트마이닝기법으로처리하 특정이슈및아이템관련문서에서연관어분석과비슷한방식으로감정과관련된 : (ex. 트위터: 팔로워수를조회) 특정이슈및아이템관련문서중에서영향력있는사람의작성여부를파악 사이람은소셜네트워크분석응용솔루션및컨설팅을제공하며대규모소셜네트워크및데이터간의관계를계량적으로분석해패턴을파악하고시각화하는기능을제공하는소셜네트워크분석소프트웨어넷마이너(NetMiner) 를개발 소셜네트워크분석전문소프트웨어인 시각화하며다양한 SNA(Social Network Analysis) NetMiner는노드와링크로이루어진데이터를분석하고 방법론과이론을포함하는포괄적인범위의 네트워크지표와분석모델들을제공하고기존통계분석모델과차트기능이내장되어있어서외부 통계처리프로그램을사용하지않아도다양한분석수행가능함 [ NetMiner 주요화면 ] 58
전략제품 현황분석 솔트룩스는 비정형 빅데이터 분석 및 시맨틱 기술 전문기업으로 비정형 빅데이터 분석 플랫폼 (truestory), 클라우드 기반 시맨틱 검색 플랫폼(IN2), 시맨틱 기반 빅데이터 추론 플랫폼 (STORM), 빅데이터 분석 서비스 플랫폼(O2)을 서비스중 비정형 빅데이터 분석 플랫폼, 트루스토리(truestory)는 클라우드 컴퓨팅과 인공지능 기술이 결합 된 정형/비정형의 빅데이터 분석을 수행하며 솔트룩스 고유의 시맨틱 기술이 적용된 워크플로우 기반의 심층 분석이 가능함 소셜 빅데이터 분석뿐 아니라 기업 빅데이터 분석, 통신 및 금융 빅데이터 분석 등 다양한 도메인 에 활용 가능함 [ 트루스토리 아키텍쳐 ] 디지털팩토리 기업의 생산성 및 품질향상을 위한 시스템으로 빅데이터 관리 및 분석을 통해 생 산현장의 각종 정보를 분석하여 핵심지표 또는 저해요인을 도출하고 핵심요인 제거를 위한 개 선혁신 활동을 지원하는 솔루션을 제공함 생산관리 분석을 통하여 생산성, 비 가동성, 불량요인 특성을 분석해 주며 입출고 및 공정 검사 불량률을 관리해 줌. 또한 생산성과 비 가동, 불량요인 간의 연관관계를 상세히 분석해줌 마인즈랩은 음성, 텍스트 센서 데이터 등 비정형 고객의 소리를 State-of-the-art 수준의 음성 인식, 자연어처리, 텍스트마이닝, 데이터마이닝 기술을 통해 처리하고 이를 소셜 빅데이터 분석 정보 및 기업 내부의 정형 데이터와 교차 분석하여 비즈니스 활동에 필요한 정보 제공함 음성인식 : 심층신경망(Deep Neural Network) 기술을 활용한 높은 인식 정확도 제공함 텍스트 마이닝 : 고품질 개체명 인식, 내용기반 자동분류, 이슈 군집분석 등 고난이도 고품질의 결 과를 제공하는 텍스트 마이닝 서비스를 제공함 분석확장성 : 분석확장성 : 다양한 형태의 내 외부 데이터 및 분석모델 적용을 지원하는 유연성 제공함 59
데이터인텔리전스 - 빅데이터기반 SW 리비는온라인빅데이터기반의기업상품및브랜드에대한고객반응분석을제공하며, 간으로변하는온라인상의여론을빠르게파악하여즉각대응해주는서비스제공함 실시 자연어처리는자연어형태소사전을구축하고있으며기계학습을통한신조어보유하고있으며 확률기반감성분석, 조건부기반형태소분석기술을통해자연어분석수행함 데이터마이닝은유사패턴매칭을통해주요정보를군집화하여추출. 주제어추출, 연관키워드, 서술어추출등을이용하여데이터를분류하고정제함 지표기반보고서생성은브랜드상태를요약할수있는각종지표기반의보고서를생성하여인 사이트를제공. 보유한데이터를기업이원하는다양한차원으로나누어분석하고시각화된결과 를고객에게전달 코난테크놀로지는온라인미디어상에서자발적으로이루어지는소비자들의이야기를실시간으 로수집하고분석하는온라인미디어분석서비스제공. 숨어있는소비자의니즈를쉽게파악할 수있도록돕고, 이에대해실시간대응이가능하도록지원하며, 소셜미디어상에잠재돼있 는위기에대비할수있도록숨어있는맥( 脈 ) 을찾음 감성분석 : 특정주제와관련하여소비자들의긍정/ 부정/ 중립적평판분석 실시간분석 : 온라인에서특정키워드에대한관심사, 분위기를실시간으로감지 영향력분석 : 특정키워드와관련해영향력있는인물감지, 영향력정도산출 UX : 분석결과를효과적으로전달하는시각화기능강화 Zoy Corporation 은오프라인매장의방문객통계정보와기반으로매출원인분석및영업관 리개선을위한서비스와이를기반으로한퍼널개선, 프로모션효율화, 매장 Layout 변경등 매장관리를통한매출증대를위한서비스제공함 퍼널(Funnel) 분석 : 매장앞을지나가는통행객수, 매장에들어오는고객수, 매장안에일정시간 이상머무는고객수분석 존(Zone) 분석 : 매장안에서고객이가장많이머무는곳과머물지않는곳등의동선분석 상권분석 : 상권의트렌드분석 ( 요일/ 시간대별통행량, 통행량중매장방문객비율, 통행량중 외국인비율등 ) 스태프운영최적화 : 매장직원들의행동패턴분석, 출퇴근등의근태관리 60
전략제품현황분석 다. 기술인프라현황 (1) 국내사례 방송사(KBS, MBC, SBS 등) 플랫폼 SNS에서화제가된프로그램을확인하기위한버즈량분석과특정프로그램에대한시청자들의반응을분석하기위하여급상승한키워드분석을통해사람들의감성분석과화제가된이슈를도출하며또한프로그램구별없이방송관련문서전체를대상으로연관어, 감성정보등을통계분석하여최근방송에대한사람들의기대와방송트렌드도출 제조 생산전문기업 활용중인기존 IT 솔루션의문제점을분석및개선을통해활용도향상과 FDM시스템을연계하 여코드기반의생산현장분석수행 FOM 동수행 시스템을활용한빅데이터분석을통해숨겨진저해요소와부서간연관성관리및개선활 기업의콜센터 콜센터로유입된콜을음성인식기술을통해 Virtual Assistant 서비스제공추진 기계학습기술을통한내용기반의콜자동분류시스템구축 기업의마케팅부서및마케팅업체 세계최대가구사인 I사가국내가구업계에진출하면서 I사에대한관심도가폭발적으로늘어나 이에대한온라인상태를분석하고 A사의온라인마케팅에대한향후방향제시 농심브랜드와대표제품인신라면, 신라면블랙에대한소비자인식분석과소비자들의식문화 라이프스타일의마이크로트렌드를분석하여마케팅인사이트도출 매장관리 매장앞디스플레이에따른상품별고객전환율분석을통해 A상품의경우에는 93% 노출시 15% 의전환율, B상품의경우동일노출량대비 38% 의전환율등을파악함 따라서고객전환율이낮은 A상품보다효율이좋은 B상품으로주력디스플레이를변경으로고객전 환율에집중하여수시로제품을교체한결과 2년동안동일점포매출 30% 성장 카드사( 신한카드등) 신한카드는자사의월평균승인건수 2억건과 2,200만명에달하는고객의빅데이터분석을바 탕으로소비패턴에따라남녀각각 9개씩 18 개의생활방식을도출해새로운상품체계인 코드나 인 을선보였으며신한카드는 코드나인 을활용한세부적인맞춤형카드를앞세워포화상태에이 른국내카드시장에서활로를모색중임 61
데이터인텔리전스 - 빅데이터기반 SW [ 국내빅데이터분석시범사업선정과제 ] 구분 주관기관/ 참여기관과제명 KT/ 질병관리본부 로밍빅데이터를활용한해외로부터의유입감염병차단서비스개발 선도사업 W 쇼핑/ 한동대빅데이터딥러닝기술활용스마트 T-커머스서비스개발 매일유업/ 그린비즈니스협회유가공업종제조생산, 에너지최적화를위한빅데이터플랫폼개발 유라/ 충북대등딥러닝기술기반의대용량제조데이터분석서비스플랫폼개발 산업확산 ING 생명/ 생명보험협회생명보험빅데이터전략모델개발및확산 삼성중공업/ 현대중공업등제조업빅데이터전략모델개발및실증 * 출처 : NIA, 미래부-NIA 2016 년빅데이터시험사업착수, 2016 (2) 해외사례 영국아비바생명고객맞춤형보험상품 영국의아비바생명은운전자의운전패턴에기반을둔맞춤형보험상품을제공하고있는데, 이 를위해차량내운행기록장치를통해실제운전행태를수집및분석하고있으며, 주로운전하 는시간과지역등을감안해보험료를산정하는 Pay-as-you-drive 상품인 RateMyDrive 를내놓 아고객들로부터좋은반응을얻음 사우스웨스트항공의고객맞춤형광고 저가항공의대명사인사우스웨스트항공은비행기좌석스크린에승객별로다른광고를제공하고 있는데, 미국인의 96% 를비롯해전세계적으로 5억명에달하는고객정보를갖고있는액시엄 (Acxiom) 社의 별최적화된광고를제공 DB에저장되어있는항공기탑승객의쇼핑습관과구매패턴등을분석한후승객 타겟(Target) 의고객맞춤형프로모션 타겟은여성고객의임신여부를선제적으로파악하기위해빅데이터분석을활용하고있는데, 고 객의임신을높은확률로추정할수있게해주는주요아이템에대한검색이나구매등온/ 오프라 인에서행해지는고객의모든활동을지속적으로축적하여고객의임신주기까지알아맞힐수있 는수준의정보를확보. 이와같은분석결과를바탕으로관련상품에대한프로모션등의효과를 제고 62
전략제품현황분석 DHL 의물류효율화 일별배송정보를분석하여소비자의물류서비스이용흐름과패턴파악에활용하고있는 DHL은 실시간교통상황, 수신자상황, 지리적/ 환경적요소를고려한최적화된배송경로를실시간으로분 석해적기배송실패율을제로수준으로만드는한편불필요한연료소모도최소화. 또한이렇게 얻어진데이터분석결과는물류서비스수요증가추세를예측하여물류센터확장과배송차량추 가등에대한투자결정에도활용 자라(Zara) 의효율적인물류배송망 패스트패션(SPA) 기업의대표주자중하나인자라는빅데이터분석을활용해전세계매장의판매현황을실시간으로분석한뒤고객수요가높은의류를실시간으로공급할수있는물류망을구축함으로써재고부담은줄이고매출은극대화하는성과 후지쯔(Fujitsu) 의농업용빅데이터분석솔루션 후지쯔는농지작업실적과작물이미지등데이터를분석해수확량증가와품질을향상시키는클 라우드기반의농업용빅데이터분석솔루션을 2012 년부터제공. 이는기후와토양환경등에대 해센서로부터수집되는데이터와과거수확실적등을비롯한빅데이터를분석하여최적의파종, 농약살포, 수확시점을제공하는솔루션 아마존의예측배송 빅데이터분석을이용한고객이해와구매추천의선구자인아마존은 예측배송 이라는또다른 파격적행보를시도할계획인데, 이를위해 2013년 12월고객이구매하기전에배송을준비하는 예측배송(anticipatory shipping) 서비스에대한특허를취득 구글의데이터센터성능및에너지사용최적화 구글은데이터센터서버와기타장비들의사용시간과에너지사용량에대한방대한분량의운영데이터를분석하여데이터센터의성능과에너지사용량이라는트레이드오프관계에있는두가지지표를최적의상태로운영하고있음 63
데이터인텔리전스 - 빅데이터기반 SW 라. 특허동향분석 (1) 연도별출원동향 빅데이터기반 SW 기술의지난 7 년( 10~ 16) 간출원동향5) 을살펴보면연도별출원경향이전 체적으로 2010 년도를시작하여꾸준히증가되는경향을나타내고있어, 본기술에대한연구 개발이활발하게이루어지고있음 각국가별로살펴보면한국의출원경향은 2012년도까지조금씩증가하다가 2013년부터급증하는 경향을보이고있음, 향후지속적으로증가될것으로예상됨, 미국은지속적으로증가하는추세를 보이고있으며, 일본은소폭증가추세를지속하다가점차로줄어드는경향을보이고있음 국가별출원비중을살펴보면미국이전체의 53.2% 로최대출원국으로빅데이터기반소프트 웨어기술을리드하고있는것으로나타났으며, 한국이 32.7%, 일본은 10.1%, 유럽은 4.6% 순으로나타남 [ 빅데이터기반 SW 기술연도별출원동향 ] 5) 특허출원후 1년 6개월이경과하여야공개되는특허제도의특성상실제출원이이루어졌으나아직공개되지않은미공개데이터가존재하여 2015, 2016년데이터가적게나타나는것에대하여유의해야함 64
전략제품 현황분석 (2) 국가별 출원현황 한국의 출원현황을 살펴보면 10년부터 꾸준히 증가추세로 2013년부터는 급증하는 경향을 보 이고 있음 한국은 2010~2013년도에는 외국인 비중이 20% 정도 수준에서 점차로 비중이 줄어드는 것으로 주로 국내출원인이 대다수 비중으로 나타나고 있음 미국의 출원현황은 출원건수가 꾸준히 출원건수가 증가하고 있는 추세를 보이고 있는 점이 특 징임 2010년도 이후 미국의 외국인 출원이 10~20% 정도로 최근까지 이러한 추세가 나타나고 있어, 타 국가에 비해 내국인 출원이 다수 이루어지고 있는 것이 특징으로 나타남 일본의 출원현황은 10년도 이후부터 소폭 증감추세를 보이고 있으며, 증가추세를 보이고 있으 나, 출원경향을 파악하기에 특허출원 건수가 적음, 내외국인 비중은 외국인이 40% 이상으로 외국인 출원이 높은 경향을 보이고 있는 점이 특징임, 유럽의 경우에는 소폭 증가추세를 보이 고 있으며, 외국인 비중이 전체 50% 이상으로 외국인 비중이 타 국가보다 높은 것으로 나타 남 [ 국가별 출원현황 ] 65
데이터인텔리전스 - 빅데이터기반 SW (3) 투입기술및융합성분석 빅데이터기반 SW 기술 분야의투입기술을확인하기위하여특허분류코드인 IPC Code 6) 를통 하여살펴본결과가장많은비중을차지하고있는 IPC는 G06F 분야가가장많은 872건으로 나타났으며, G06Q이 320 건, H04L가 71건으로 G06F분야가대다수를차지하고있음 이외에 G06N 38 건, H04N 35 건, H04W 31 건, G05B 30 건, G06K 18 건, G06T 18 건, A61B 11건등의기술이투입되어있어빅데이터기반소프트웨어기술분야에다양한기술이존재 하지만, 데이터처리, 시스템기술분야에집중되고있음 더불어해당 IPC의특허인용수명을살펴보면 A61B로서기술분야의수명이 9년으로가장긴것으 로나타났으며, G06Q 기술분야는 4년으로가장짧은것으로분석 [ 빅데이터기반 SW 기술분야상위투입기술 ] IPC 기술내용특허인용수명 (TCT) 7) G06F 전기에의한디지털데이터처리 6년 G06Q 관리용, 상업용, 금융용, 경영용, 감독용또는예측용으로특히적합한데이터처리시스템또는방법 ; 4 년 H04L 디지털정보의전송 6년 G06N 특정계산모델방식의컴퓨터시스템 4년 H04N 화상통신 7년 H04W 무선통신네트워크 4년 G05B 제어계또는조정계일반; 이와같은계의기능요소; 이와같은계또는요 소의감시또는시험장치 6 년 G06K 데이터의인식; 데이터의표시; 기록매체; 기록매체의취급 7년 G06T 이미지데이터처리또는발생일반 6년 A61B 진단; 수술; 개인식별 9년 6) 전세계적으로통용되고있는국제특허분류(IPC: International Patent Classification) 를통해특허정보기술분야에서공지기술을조사할수있으며, 기술및권리정보에용이하게접근가능 7) 특허인용수명지수는후방인용(Backward Citation) 에기반한특허인용수명의평균, Q1, Q2( 중앙값), Q3 에대한통계값을제시함. 특히이와같이산출된 Q2는 TCT(Technology Cycle Time, 기술순환주기또는기술수명주기) 라고부름 66
전략제품 현황분석 투입기술이 가장 많은 G06F 분야와 융합이 높게 이루어진 기술은 G06N 분야로 나타났으며, G06Q, H04L 분야와도 나타 융합된 기술의 건수가 높은 것으로 분석 이외에 G06Q 분야와 융합된 기술은 A61B, H04W, G06K 분야와 융합된 기술이 많은 것으로 나타났으며, H04L 분야와 융합된 기술은 H04W, G06Q, G06N 기술로 분석됨 [ 빅데이터 기반 SW 기술 분야 IPC 기술 및 융합성 ] (4) 주요출원인 분석 앞서 국가별 특허건수에서 미국이 가장 많은 특허를 출원하고 있는 것으로 나타났으며, 상위 출원인에서도 미국 출원인이 다수를 차지하고 있으며, 그 외 한국, 인도 등의 출원인이 상위 그룹에 포함되었음 주요 상위 출원인을 살펴보면 미국의 IBM, Microsoft, 한국의 한국전자통신연구원, 미국의 Splunk, FIsher Rosemount Systems, Google, Qualcomm 등이 상위그룹을 차지하고 있음 주요 한국 출원인으로는 기업 보다는 연구소의 출원이 활발한 것이 특징이며, 전자통신연구원이 유일하게 상위그룹에 포함되었음 67
데이터인텔리전스 - 빅데이터기반 SW 한국출원인인한국전자통신연구원은한국출원이외에미국출원도활발하게하고있는것으로 나타남, 다국적기업인 Qualcomm사와 Microsoft, Google사가 3극출원에대한활동이활발 한것으로나타남 피인용지수에대한통계에서는대부분상위그룹출원인에서 Microsoft 와, Splunk사가높은 것으로나타났으며, IBM, Tata Consultancy Service사가상대적으로높은수치를나타내고있 음 주력기술분야는빅데이터분석지원시스템, 데이터검색엔진, 빅데이터분류기술등이연구개 발대상으로하고있는것으로나타남 [ 주요출원인의출원현황 ] 주요출원인 국가 주요 IP 시장국 ( 건수 %) 3극패밀 IP시리수 한국미국일본유럽 장국 종합 ( 건) 피인 용지 수 주력기술분야 IBM 미국 3 117 3 2% 95% 2% 0% 미국 0 2.78 빅데이터검색엔진기술 Microsoft 미국 31 4 0% 89% 0% 11% 미국 4 6.36 데이터검색시스템 한국전자통신연구원 한국 23 11 1 66% 31% 0% 3% 한국 0 0 빅데이터분석을위한지원시스템 Splunk Inc. 미국 31 0% 100% 0% 0% 미국 0 3 시맨틱검색을위한데이터모델링 Fisher Rosemount Systems 미국 10 14 0% 42% 58% 0% 일본 3 0 프로제스제어시스템의빅데이터처리기술 Google 미국 13 1 2 0% 81% 6% 13% 미국 4 1.9 비구조적정보생성기술 Qualcomm Inc. 미국 4 11 27% 0% 73% 0% 일본 15 0 비정형비디오처리기술 Tata Consultancy Services 인도 9 4 0% 69% 0% 31% 미국 0 4 다량서비스데이터처리기술 EMC Co 미국 11 0% 100% 0% 0% 미국 0 0.4 빅데이터분류화기술 Oracle International Co 미국 11 0% 100% 0% 0% 미국 1 5 기업데이터분석, 검색기술 68
전략제품 현황분석 (5) 국내 출원인 동향 국내 출원인 동향을 살펴보면 대기업은 에스케이텔레콤, 현대자동차, 케이티 등이 상위그룹에 나타났으며, 중소기업으로는 솔트룩스, 시엠아이코리아, 가이온 등 빅데이터 정보처리 전문기업 이 참여하고 있는 것으로 나타남 기업 이외의 주요출원인에서 연구소와, 대학의 출원이 활발한 것으로 나타났으며 연구소에는 한국전자통신연구원, 한국과학기술정보연구원, 한국과학기술원 등이 활발한 연구를 하고 있는 것으로 판단되며, 여러 대학에서도 많은 참여를 하고 있는 것으로 나타남 [ 국내 주요출원인의 출원 현황 ] 69
데이터인텔리전스 - 빅데이터기반 SW 5. 가. 중소기업환경 중소기업경쟁력 빅데이터기반 SW 분야의중소기업경쟁력은기술분류별로차이가있으나데이터분석/ 처리기 술은중소기업이다수참여하여시장에서의역할이점차커지는분야로나타났으나, 데이터수집, 저장기술은높은기술력을요구하는분야로중소기업의경쟁력이낮은것으로분석됨 기술분류주요기술대기업중소기업중소기업참여영역중소기업 데이터수집기술 크롤링 (Crawling), ETL(Extraction, Transformation, Loading), 로그수집(Log Aggregator), FTP(File Transfer Protocol), HTTP(Hyper Text Transfer Protocol), RDB [ 빅데이터기반 SW 분야중소기업현황 ] KT 넥스알 솔트룩스, 마이즈랩, 빅데이터배치처리및실시간검색플랫폼 참여정도 데이터저장기술 분산컴퓨팅기술, 분산파일시스템, NoSQL, 병렬 DBMS 기술, HDFS Spark 다음소프트 그루터 빅데이터관련플랫폼구축및컨설팅서비스 데이터분석/ 처리기술 데이터시각화 자연어처리 (NLP; Natural Language Processing), 정보검색 (IR; Information Retrieval), 기계학습 (Machine Learning), 텍스트마이닝 (Text mining), 시맨틱(Semantic) 기술, 데이터마이닝 (Data Mining) Infomation Visualization, EDA(Exploratory Data Analysis), Info Graphics, Data Storytelling 다음소프트 KT 넥스알 다음소프트 KT 넥스알 구루터, 사이람, 솔트룩스, 와이즈넛디지털팩토리, 마이즈랩, 리비, 코난테크놀로지, Zoy Corporation 사이람, 리비, 코난테크놀로지, Zoy Corporation 소셜네트워크분석, 머신러닝을통한솔루션개발, 패턴분석, 데이터분석을통한시각화, 도식화, 클러스터링 * 중소기업참여정도와점유율은주요제품시장에참여하는중소기업의참여규모와정도( 업체수, 비율등) 를고려하여 5단계로구분 ( 낮은단계:, 중간단계(,, ) 높은단계: ) 70
전략제품현황분석 나. 중소기업기술수요 빅데이터기반 SW 분야의중소기업의기술수요를파악하기위하여중소기업기술수요조사및중 소기업청 R&D 신청과제(2013~2015 년) 를분석한결과아래표의내용과같은수요들이다수있 는것으로분석 빅데이터기반 SW 분야중소기업은최근에데이터분석/ 처리기술과관련된기술개발에다수수요 가있는것으로나타났으며, 이는 IoT 를통한방대한데이터수집으로분석/ 처리기술에대한관 심이높아지고있는추세를반영한것으로분석됨 [ 빅데이터기반 SW 분야과제신청현황및수요조사결과 ] 전략제품기술분류관심기술 데이터수집기술 영상데이터추출/ 수집기술, 이미지추출/ 수집기술, 실시간데이터수집기술, 크롤링, 위치정보기술, 센서정보수집 데이터저장기술 클라우드서버기술, 하둡리듀스, 분산처리기술, 병렬처리기술, 데이터베이스 NoSQL, 데이터보안기술 데이터인텔리전스 데이터분석/ 처리기술 영상처리기술, 언어및음성처리, 머신러닝, 추천시스템, 예측분석기술, 인공지능플랫폼, 챗봇플랫폼, 검색시스템, 자연어처리기술, 패턴인식분석기술 데이터시각화정보분석시각화, 데이터분석탐색기술, 클러스터링기술 71
데이터인텔리전스 - 빅데이터기반 SW 다. 중소기업핵심기술 (1) 데이터기반요소기술발굴 빅데이터기반 SW 기술의특허및논문데이터검색을통해도출된유효데이터를대상으로데이터마이닝기법(Scientometrics 기법) 을통해클러스터링된키워드의연관성을바탕으로요소기술후보군을도출 빅데이터기반 개의요소기술후보군을도출 SW 기술의특허및논문유효데이터를기반으로키워드클러스터링을통하여 11 제품별 dataset 구축 : 빅데이터기반 SW 기술관련특허/ 논문데이터를추출하여노이즈제거 후제품별 dataset 구축 1 차클러스터링 : 키워드맵을통한고빈도키워드확인- 빈도수(tf-idf) 8) 가상위 30% 에해당하는 키워드를대상으로 1차추출 2 차클러스터링 : 1차클러스터링에서추출된고빈도키워드사이에서고연관도키워드를 2차추 출 ( 고연관도기준은연관도수치9) 가 2 이상인클러스터로제한) 다음그림은키워드간연관네트워크를시각화한것으로, 간의연관도를나타내는직선으로구성 각키워드를나타내는원과키워드 각키워드가특허와논문중어느데이터에서도출되었는지원의색으로구분하였으며, 도출된클러스터는황색음영으로표시 키워드로 키워드를나타내는원은고빈도의키워드일수록원의크기가크게표현되며, 선은키워드사이의연관도수치가높을수록굵게표현 연관도를나타내는 빅데이터기반 SW 기술전략제품의특허논문유효데이터에대하여키워드클러스터링결과를기반으로요소기술도출 데이터기반의요소기술도출은키워드클러스터링을통해도출된요소기술에대하여전문가의 검증및조정을통하여요소기술을도출 8) 빈도수(tf-idf) : 각키워드가출현되는특허또는논문수를의미 9) 연관도수치: 두개이상의키워드사이의특허또는논문수를의미 72
전략제품 현황분석 [ 빅데이터 기반 SW 분야 키워드 클러스터링 ] [ 빅데이터 기반 SW 분야 주요 키워드 및 관련문헌 ] No 주요 키워드 클러스터 01 big data, machine learning 클러스터 02 data storage, cloud computing 클러스터 03 knowledge base, discovery 연관도 수치 관련특허/논문 제목 6~8 1. METHOD FOR PROVIDING DATA SCIENCE, ARTIFICIAL INTELLIGENCE AND MACHINE LEARNING AS-A-SERVICE 2. Automatic Crowd Sourcing for Machine Learning in Information Extraction 3. Facies classification using machine learning 6~8 1. A system and method for massive call data storage and retrieval 2. APPARATUS AND METHOD FOR PROVIDING SUBSCRIBER BIG DATA INFORMATION IN CLOUD COMPUTING ENVIRONMENT 3. A distributed big data storage and data mining framework for solar-generated electricity quantity forecasting 4~6 1. COMPUTER-GENERATED SENTIMENT-BASED KNOWLEDGE BASE 2. Knowledge discovery agent system 3. Large-scale heterogeneous program retrieval through frequent pattern discovery and feature correlation analysis 73
데이터인텔리전스 - 빅데이터기반 SW No 주요키워드연관도수치관련특허/ 논문제목 클러스터 04 클러스터 05 클러스터 06 클러스터 07 클러스터 08 클러스터 09 business intelligence, system unconstructe d data, search method-syst em, source extraction rule, query software platform, virtual machine software development, engineering 4~6 4~6 4 6~8 4~6 6~8 1. Interest-driven business intelligence systems and methods of data analysis using interest-driven data pipelines 2. Systems and methods for providing performance metadata in interest-driven business intelligence systems 3. Comparison of generalized and big data business intelligence tools 1. BIG DATA EXTRACTION SYSTEM AND METHOD 2. Method and apparatus for searching a hierarchical database and an unstructured database with a single search query 3. Classification of research efforts in dynamic/big data analytics 1. Discovery of new business openings using web content analysis 2. Client-Side Search Templates for Online Social Networks 3. Fuzzy Integral Based on Mutual Information for Software Defect Prediction 1. PREVIEWING AN EXTRACTION RULE FOR A FIELD IN EXEMPLARY EVENTS AND MODIFYING THE RULE THROUGH COUNTER-EXAMPLE 2. Sampling of events to use for developing a field-extraction rule for a field to use in event searching 3. A framework for real-time information derivation from big sensor data 1. ENTERPRISE-LEVEL DATA PROTECTION WITH VARIABLE DATA GRANULARITY AND DATA DISCLOSURE CONTROL WITH HIERARCHICAL SUMMARIZATION, TOPICAL STRUCTURING, AND TRAVERSAL AUDIT 2. Actor system and method for analytics and processing of big data 3. Performance and energy efficiency of big data applications in cloud environments: A Hadoop case study 1. EXTRACTING COMPLEX ENTITIES AND RELATIONSHIPS FROM UNSTRUCTURED DATA 2. Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors 3. Design and Development of a Medical Big Data Processing System Based on Hadoop 클러스터 10 game state, batch file 8 1. DATA DRIVEN RELATIONAL ALGORITHM FORMATION FOR EXECUTION AGAINST BIG DATA 2. Network security threat detection by user/user-entity behavioral analysis 3. ClowdFlows: Online workflows for distributed big data mining 클러스터 11 business object, diagnosis 4 1. LITIGATION DOCUMENT MANAGEMENT LINKING UNSTRUCTURED DOCUMENTS WITH BUSINESS OBJECTS 2. Systems and Methods for Archiving Business Objects 3. A development of streaming big data analysis system using in-memory cluster computing framework: Spark 74
전략제품현황분석 [ 빅데이터기반 SW 분야데이터기반요소기술 ] No 요소기술명키워드 요소기술 01 실시간데이터수집기술 sementic, data storage 요소기술02 대용량분산 DW 저장기술 data warehouse, distributed data 요소기술 03 실시간처리/ 분석기술 data analytics, 요소기술 04 데이터시각화기술 data visualization 요소기술 05 인메모리저장기술 in-memory storage 요소기술 06 서비스시각화기술 service visualization 요소기술 07 대용량트랜잭션데이터저장기술 transaction storage 75
데이터인텔리전스 - 빅데이터기반 SW (2) 요소기술도출 산업시장분석, 기술( 특허) 분석, 전문가의견, 타부처로드맵, 중소기업기술수요를바탕으로로드맵기획을위하여요소기술도출 요소기술을대상으로전문가를통해기술의범위, 요소기술명확정 요소기술간중복성등을조정검토하여최종 [ 빅데이터기반 SW 분야요소기술도출 ] 분류요소기술출처 특허/ 논문클러스터링, 실시간데이터 수집기술 전문가추천. 기술/ 시장분석 수집 데이터연계및통합기술 기술/ 시장분석, 기술수요, 전문가추천 대용량분산 DW 저장기술 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 저장 대용량트랜잭션데이터저장기술 기술/ 시장분석, 기술수요, 전문가추천, 특허/ 논문클러스터링 인메모리저장기술 기술수요, 특허/ 논문클러스터링, 전문가추천 실시간처리/ 분석기술 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 분석/ 처리 네트워크분석기술전문가추천, 기술/ 시장분석 분산인메모리 SQL 컴퓨팅기술기술/ 시장분석, 전문가추천 시각화 데이터시각화기술 서비스시각화기술 기술수요, 특허/ 논문클러스터링, 전문가추천, 타부처로드맵 기술/ 시장분석, 기술수요, 특허/ 논문클러스터링 76
전략제품현황분석 (3) 핵심기술선정 확정된요소기술을대상으로산학연전문가로구성된핵심기술선정위원회를통하여중소기업 에적합한핵심기술선정 핵심기술선정은기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업적합 성(10) 을고려하여평가 [ 빅데이터기반 SW 분야핵심기술 ] 분류핵심기술개요 수집 실시간데이터수집기술데이터연계및통합기술 사물인터넷이나머신에서실시간으로생산되는비정형데이터를수집하여안정적인대용량저장소에저장하는기술 내/ 외부데이터베이스, 공공DB, 웹/ 모바일등다양한데이터소스에있는정형/ 비정형/ 준정형데이터를연계수집하여통합저장하는기술 저장 대용량트랜잭션데이터저장기술인메모리저장기술 데이터를블록단위가아닌레코드단위로실시간으로저장하고조회하고처리할수있는 NoSQL과같은비구조적저장소및검색엔진기술 대량의데이터를파일이아닌메모리에상주시켜저장하고운영하는일종의데이터베이스로매우빠른입력및읽기성능을제공하는저장기술 분석/ 처리 시각화 실시간처리/ 분석기술네트워크분석기술데이터시각화기술서비스시각화기술 데이터수집과동시에처리및분석을수행한후그결과를 RDBMS나 NoSQL에저장하거나특정조건을만족하는이벤트에대해서는경고메시지를발생시키는기술 문헌, 특허, 사회관계망, 금융거래, 교통정보등노드와노드의링크로구성된네트워크관계를분석하는기술 데이터의패턴을쉽게찾을수있도록점, 선, 면, 색채, 이미지등의그래픽요소를활용한도표나그래프를만들어데이터를시각적으로표현하는기술 빅데이터분석결과를쉽게이해하고탐색할수있도록시각적으로표현하여전달하는것으로웹이나모바일을통한서비스를구현한기술 77
데이터인텔리전스 - 빅데이터기반 SW 6. 기술로드맵기획 가. 빅데이터기반 SW 기술로드맵 최종중소 중견기업기술로드맵은기술/ 시장니즈, 연차별개발계획, 최종목표등을제시함으로 써중소기업의기술개발방향성을제시 78
전략제품현황분석 나. 연구개발목표설정 로드맵기획절차는산학연전문가로구성된로드맵기획위원회를통해선정된핵심기술을대 상으로기술요구사항, 연차별개발목표, 최종목표를도출 [ 빅데이터기반 SW 분야핵심기술연구목표 ] 분류핵심기술기술요구사항 연차별개발목표 1차년도 2차년도 3차년도 최종목표 수집 실시간데이터수집기술 데이터연계및통합기술 실시간성, 유실없는수집기술 상호호환성및데이터표준화기술 로그수집및서비스기술 데이터표준화기술 실시간데이터수집기술 데이터상호교환및통합기술 대용량실시간데이터수집 저장 대용량트랜젝션데이터저장기술 인메모리저장기술 대용량유입데이터에대한분산저장기술 인메모리데이터저장및관리기술 분산저장된데이터의관리기술 분산메모리구조활용기술 대용랼분산데이터의고가용성기술 멀티노드확장과레이턴시최소화기술 대용량실시간저장소구축 분석/ 처리 실시간처리/ 분석기술 네트워크분석기술 실시간유입데이터의수집및실시간처리기술 데이터마이닝및기계학습기술 실시간데이터분산처리 기계학습알고리즘의네트워크적용 실시간분산처리결과데이터활용/ 전달기술 네트워크분석활용한서비스모델 빅데이터분석기법 데이터시각화기술 시각화표현기술 데이터감각화기술 상호작용서비스기술 시각화 서비스시각화기술 스마트정보서비스의특성에적합한효율적시각화기술 스마트서비스를위한데이터시각화기술 서비스맞춤형웹/ 모바일서비스기술 웹서비스를통한데이터시각화 79
전략제품현황분석 클라우드기반 SW
클라우드기반 SW 정의및범위 클라우드기반 SW 는클라우드서비스( 가상의자원을제공하고사용한만큼비용을청구하는서비 스) 를이용하여컴퓨터나휴대폰등에불러와서사용하는웹에기반한소프트웨어서비스를의미 클라우드기반 SW 는크게클라우드기반서비스, 클라우드기반인프라로분류 정부지원정책 정부는공공부문의비용절감과업무혁신, 민간산업육성을위해 2015년 9월세계최초로클라우 드발전법을제정하여클라우드선도국가도약을위한시동을검 현재정부는클라우드발전법의후속조치로공공기관클라우드도입가이드라인을마련하고있으 며이와관련한보안체계, 품질인증주체및범위, 인증절차등은클라우드산업확산속도의 변수가될전망 중소기업시장대응전략 강점 (Strength) 약점 (Weakness) 타산업과의융합을통한수요및분야확대 클라우드기반의다양한서비스출시증가 외산제품과의치열한시장경쟁 미국및유럽기업과의기술격차 기회 (Opportunity) 주요통신사를중심으로다수의중소기업이협력하는생태계확대 범정부차원의클라우드활성화정책 위협 (Threat) 국내오픈플랫폼의부재로서비스호환성부재 보안이슈의대두및사회적인식부족 중소기업의시장대응전략 가상화기반기술을개발하여글로벌기업과의기술격차해소 주요통신사의서비스를위한클라우드인프라서비스개발로중소기업의경쟁력답보 Iaas기반의국내오픈플랫폼확보
핵심기술로드맵
전략제품 현황분석 1. 개요 가. 정의 및 필요성 클라우드 컴퓨팅은 인터넷 환경에서 제공되는 다양하고 편리한 기술들을 활용하여 IT자원을 서 비스로 제공하거나 혹은 특정 클라우드 서비스에 맞는 개발환경을 제공하거나 아니면 특정 애 플리케이션이나 서비스를 클라우드 기반으로 제공하는 컴퓨팅을 의미함. 이는 PC에서 개별적 으로 운영체제와 프로그램을 설치하고 각각의 데이터를 개별적으로 관리하던 방식에서 벗어나, 인터넷이라는 네트워크를 통하여 데이터를 저장하고 다양한 IT리소스들을 물리적인 위치와 상 관없이 가상화 기술을 활용하여 통합하여 제공하는 것을 의미함 클라우드 컴퓨팅은 크게 하드웨어 리소스들을 가상화하여 서비스로 제공하는 방법과 그 위에 개발 환경이나 애플리케이션을 서비스로 제공하는 방법으로 구분됨 IaaS(Infrastructure as a Service)는 서버, 스토리지, 네트워크를 가상화 환경으로 만들어, 필요에 따라 인프라 자원을 사용할 수 있게 서비스를 제공하는 방법, PaaS(Platform as a Service)는 SaaS의 개념을 개발 플랫폼에도 확장한 방식으로, 개발을 위한 플랫폼을 구축 할 필요 없이 필요 한 개발 요소들을 웹에서 쉽게 빌려 쓸 수 있게 하는 방법, SaaS(Software as a Service)는 "on-demand software"로도 불리며, 소프트웨어 및 관련 데이터는 중앙에 호스팅되고 사용자는 웹 브라우저 등의 클라이언트를 통해 접속하는 형태의 소프트웨어 전달 모델 방법임 [ 클라우드 서비스 ] IaaS PaaS SaaS 85
데이터인텔리전스 - 클라우드기반 SW 서버를운영하기위해서는서버자원, IP, Network, Storage, 전력등의인프라가필요하지만, IaaS 는이러한것들을가상의환경에서쉽고편하게이용할수있게서비스형태로제공하고, 기존 의서버호스팅보다 H/W 확장성이좋으며탄력적으로서비스를제공할수있음. 특히 Iass는 Pass, Saas 의기반이되는기술임 가상서버, 는기술임 데이터스토리지및데이터베이스와같은일련의빌딩블록이나기본서비스를제공하 사용자는이러한서비스를조합하여애플리케이션을전개하고실행할수있는플랫폼을구성할수 있으며, 시스템을편리하게구축하거나해체할수있고 SOAP나 REST 기반메시지를사용하는 API 를통해액세스할수있음 스크립트를통해자동화하거나확장할수있고, 필요시프레임워크를편리하게작성할수있으며 완전한애플리케이션환경을빠르게어셈블리할수있는기능을갖고있음. 이는오늘날의 IT 부 서에매우유익한기능으로필요에따라자원을확장하거나축소할수있도록도움을주며이러한 탄력성외에도서비스를사용한만큼비용을지불한다는장점이있음. 사용자는사용한서비스에 대해서만비용을지불하여더이상자원을미리할당할필요가없으므로총소유비용(CTO) 를절 감할수있음 완전한테스트환경과스테이징환경을구축하여사용할수있으며필요없는경우에는해체할수 있음. 더이상환경을준비하거나하드웨어를조달할때까지기다릴필요가없고, 테스트하고자 하면언제든지새로운환경을구축할수있으며테스트가완료된후에는구축한환경을해체할수 있도록하는용통성이필요함 사용자는 IaaS 를사용하여웹사이트를실행할수있고, 필요시에는자원을확장하여트래픽증가 량을쉽게처리할수있음. 또한, IaaS 클라우드서비스를사용하여특정마케팅캠페인이나영업 전략을제공하는임시웹사이트를추가로작성할수도있는매우탄력적이고시기적절한서비스 배포및제공의기반이되는기술임 * 출처 : gotocloud [ IaaS 의특징 ] 86
전략제품 현황분석 PaaS란 Platform as a Service의 약자로, 서비스로서의 플랫폼이라고 해석할 수 있음. 이는 SW가 아닌 표준화된 플랫폼을 서비스로 제공하는 것을 의미하며 SaaS를 제공하는 곳에서 OpenAPI 형태로 애플리케이션을 통합할 수 있는 플랫폼을 제공하는 기술을 의미함. PaaS는 개발자를 위한 일련의 서비스로, 개발자들이 기반 인프라스트럭처에 대해 신경 쓰지 않고 앱을 개발하고 테스트할 수 있게 해주며, 앱을 개발하는 과정에서 서버, 스토리지, 백업 프로비저닝 에 대해 걱정하지 않아도 되는 서비스임. 개발자들은 단지 코드를 작성하고 테스트하며 지속적 으로 버그를 수정하는 데 전념할 수 있도록 함. 서버 설비와 관련된 모든 백엔드 작업은 자동 으로 진행되고 개발자가 인지하지 못하는 사이에 백그라운드에서 이루어지는데, 이러한 역할을 담당하는 것이 바로 PaaS임 애플리케이션, 시스템을 구축하기 위해서 플랫폼을 전체적으로 구성하는데 소요되는 시간 및 비용 이 획기적으로 절감되며 전문가의 조언도 필요 없게 됨. 단지 클라우드 상에 클라우드 사업자가 제시하고 자신이 원하는 플랫폼을 선택만 하면 모든 구성이 완료되도록 하는 기술임 시스템 또는 애플리케이션 개발 후 배포 및 운영의 안정성을 보장 받을 수 있음. 배포 이전에 테 스트 도구를 이용해 면밀한 테스트를 할 수 있을 뿐 아니라 클라우드 인프라를 통해 빠른 배포가 가능하며 로드밸런싱, 오토스케일링 기능 등을 활용하여 안정적인 운영을 할 수 있는 기술임 플랫폼을 제공하는 IT 서비스 기업의 노하우를 최대한 이용하여 기업의 사용자가 원하는 시스템을 만들 수 있음. 기업은 기업의 비즈니스에 최적화된 시스템을 구축할 수 있을 뿐 아니라 세일즈포 스닷컴과 같은 기업이 제공하는 우수한 노하우와 기술을 제공받을 수 있음. 개발자는 서비스 운영 노하우가 담겨 있는 플랫폼을 활용하기 때문에 안정성을 보장받는 시스템 구축이 가능해짐 [ PaaS의 사례 ] 87
데이터인텔리전스 - 클라우드기반 SW SaaS 란기업및개인을대상으로응용소프트웨어를서비스로제공하는것을의미함. 예를들 어노트북, PC, 스마트폰등에응용소프트웨어가설치되어있지않아도인터넷을통해접속하 여응용소프트웨어를사용할수있는환경, 즉서비스로서의소프트웨어를의미하며사용자가 응용소프트웨어를구입하지않아도웹에서응용소프트웨어를빌려쓰는서비스를말함. 이런 SaaS 의장점은따로회사내에구축비용이나유지, 관리하는비용이소요되지않아중소기업 이이용하기에더욱적합함. 중소기업은업무환경이나업무의질을높이기위한투자능력이대 기업에비해상대적으로떨어지고, 무엇보다도 SaaS형태로제공되어지는애플리케이션의수 준이회사가내부적으로혹은자체적으로개발하여사용하는서비스에비하여높기때문임. 또 한, 지속적인유지보수와데이터에대한관리의부담을덜어주어회사의핵심업무에집중할 수있는장점이있음 자신의 PC 나기업/ 조직내의서버에소프트웨어를설치할필요가없으며, 서비스를제공하는기업 서버에 Web 브라우저등을사용하여액세스하면곧바로이용을개시할수있음. 또한, 응용소프 트웨어나서버를관리하는수고를줄일수있으며응용소프트웨어를설치한서버는 공기업에서관리/ 제공하는서비스임 SaaS의제 SaaS 모델의비지니스적특징은가입(Subscription) 기반으로소비자가매월또는매년정해진비 용을지불하는형태와거래(Transaction) 기반으로발생한만큼비용을지불하는일종의종량제 모델이있음. 또한광고(Advertisement) 기반으로 PPC(Pay Per Click) e-비즈니스모델처럼관련 광고를보는대신무료로서비스를이용하는 3가지비즈니스적특징이있음 SaaS 는사용자요청에따른커스트마이징없이네트워크기반으로접속및관리되는상업용소프 트웨어서비스로사용자가이용하는응용소프트웨어를웹( 혹은인터넷) 을통하여중앙에서관리 활동이이루어지는서비스모델임. 응용소프트웨어의제공이전형적인 Architecture, Pricing, Partnering and Management Characteriss를포함하는 1 대 1 모형이아닌 Single Instance, Multi-Tenant Architecture를포함하는 1 대다모형에가까움 출처 : http://blog.scribesoft.com/ [ SaaS 의개념 ] 88
전략제품현황분석 나. 범위 (1) 클라우드요소기술분류관점 클라우드서비스를이용하는사용자는수천대이상의컴퓨터서버, 스토리지장치및네트워 크장비들로이루어진클라우드에서무슨일이, 어떤과정으로일어나는지에대하여는알지못 한채편리하게제공되는클라우드컴퓨팅서비스자체만을이용하게됨. 단지컴퓨터나노트 북, 스마트폰등으로인터넷에접속하여클라우드에서제공하는자원이나서비스를이용하면 됨. 이러한클라우드서비스의요소기술들을살펴보면우선클라우드서비스사용자와컴퓨팅 서비스사이의관계를 ' 사용자-사용자인터페이스-시스템관리-프로비저닝서비스-웹애플리케 이션' 형태로생각해볼수있음. 클라우드서비스를이용하려는모든개별사용자들은데스크 톱컴퓨터, 노트북, 스마트폰등다양한기기를이용해클라우드서비스제공자가제시하는사 용자인터페이스로클라우드서비스에접근할수있으며하나의응용소프트웨어나서버시스 템또는문서서비스를받을수있음. 또한, 사용자인터페이스로클라우드서비스를시작하면 클라우드시스템관리부분은요청받은내용에따라적절한자원을찾고, 서비스에필요한자 원을웹애플리케이션형태로제공( 프로비저닝) 하게됨 가상화(Virtualization) 는소프트웨어기술을활용해물리적자원을논리적으로추상화하여물리적 한계에종속되지않고원하는형태로해당자원을분리, 통합할수있게하는기술을말함. 이는 하나의시스템을논리적으로분할해여러개의논리적시스템으로만들거나혹은여러개의시스 템을마치커다란하나의시스템처럼만드는것으로 ' 가상' 이라는단어는실제로있지않지만마 치실제로존재하는사실이나개체로취급된다는의미인것처럼실질적으로하드웨어가존재하거 나변하지는않지만이를논리적으로변한것처럼만든다는기술을말함. 가상화기술은클라우드 컴퓨팅에있어서가장중요하고도필수적인기술이며멀리있는컴퓨팅자원을마치가까이있는 것처럼인터넷을통해이용할수있으며실제로는한대의서버를여러대인것처럼나눠서이용 하거나여러대의서버를한대인것처럼묶어서이용할수도있음. 이러한개념들은모두가상 화기술로구현됨 컴퓨터클러스터(Cluster) 는많은양의계산을하거나데이터를저장하기위해여러대의컴퓨팅 자원을하나로묶어놓은시스템이라고정의할수있음. 클라우드서비스를제공하는클라우드시 스템역시구름속에가려져있는매우방대한시스템들의집합인클러스터시스템으로정의할수 있음. 물리적으로는여러대로나뉘어있지만논리적으로엮여있기때문에시스템을이용하는사 용자입장에서는하나의시스템을사용하는것과같은효과를얻을수있음. 원활한클라우드서 비스를위해서는다양한부분에서클러스터를관리해야하고, 계속가용상태를유지할수있도록 관리, 감독해야함. 또한, 수많은서버들을한번에관리할수있는시스템이마련되어야하고, 자 원을어떻게적절하게배분할것인가에대한해결방안도필요함. 클라우드시스템에서클러스터 관리계층은클라우드컴퓨팅환경을구성하는기본적인하드웨어자원들을서로연결하고관리하 며, 분산컴퓨팅플랫폼을구성하고있는다양한다른계층의자원관리, 부하분산, 프로비저닝 등의기능을제공함 89
데이터인텔리전스 - 클라우드기반 SW 클라우드컴퓨팅서비스업체들이고객사들이원하는만큼의서비스를중단되는일이없이제공하 기위해서는엄청나게거대한시스템을운영해야함. 실제로아마존이나구글등이보유하고있는 컴퓨팅자원들은그성능면에서상상을초월하고, 이러한방대한클러스터를관리하기위해전문 적인지식과인력, 많은비용등을지출하고있음클라우드컴퓨팅서비스를관리하는데있어서가장중요한요소는클러스터를개별적으로관리하는방법이아닌전클러스터를상대로긴급한보안업데이트작업이나프로그램설치, 삭제등을모두자동으로관리될수있는시스템이필수적으로구축되어야함 [ 제품분류관점기술범위 ] 전략제품제품분류관점세부기술 가상화기술 물리적인컴퓨팅리소스를논리적으로재구성하는기술논리적인재구성을통하여리소스를통합및분할하여제공하는기술 클러스터기술 복수의컴퓨팅리소스들을묶는기술묶여진컴퓨팅리소스를활용하여고가용성및대용량데이터처리를제공하는기술 서비스관리관점 자동화관리기술 노드관리기술 자주수행하는오류발생가능성이높은클라우드관리작업을자동화하는기술도구, 시스템및부서사이에걸쳐있는프로세스를효율적으로처리하여더빠르고더일관된서비스를제공하는기술 오류가발생한노드를재빠르게교체하여전체클라우드서비스의가용성을높이는기술대규모확장성을확보하기위하여서비스를받고있는기업의요구변화에맞추어서재빠르게클러스터노드를추가하거나제거될수있도록하는기술 클라우드 부하분산및자동확장기술 외부트래픽의갑작스러운증가나자원활용상황에따라필요한만큼의자원을즉각적으로제공하는기술동일한주소로접속한사용자들을각노드의부하에따라적절하게접속할수있도록분배해주는기술 분산데이터관리기술 대규모의구조화된데이터를서로분산되어있는환경에저장하는기술데이터베이스를사용하는사용자수가많아지거나데이터가증가했을때새로운시스템을추가해손쉽게확장이가능하도록하는기술 기반기술관점 분산병렬처리기술 연산이많이필요한업무는처리할데이터의양은적지만많은양의컴퓨터연산을위해여러개의시스템을활용하는기술처리할데이터가많은업무는여러개의시스템에업무를나누어처리할때시스템간데이터전달로인한네트워크부하를막기위해가능한한데이터가저장되어있는시스템에업무를분산하는기술 분산파일시스템기술 거대한양의데이터를저장하고관리하기위해수많은서버들에데이터를나누어저장하고관리하는파일시스템기술단순히데이터의저장과관리만을맡는것이아니라하드웨어장애에유연하게대처가능하도록하는기술 90
전략제품현황분석 (2) 공급망관점 클라우드컴퓨팅기술은제품분류관점에서의분류외에배포하는방식에따라사설 (private) 클라우드, 공용(public) 클라우드, 하이브리드(hybrid) 클라우드로구분가능하며이는클라우드 서비스제공을위한인프라소유방식에따른분류방식임 사설(Private) 클라우드란자사의 IT 자원을활용하여내부에클라우드를구축해비용면, 운용면, 보안 측면의최적화구성방식으로자원에대한적절한통제및내부정보보호가가능한자사보유 원활용방식의클라우드를말함 IT 자 공용(Public) 클라우드란대규모클라우드를외부공개용으로구축하고비용을지불한사용자에게 정보자원을할당하여누구나서비스받을수있도록제공하는방식임. 공개된 API 또는웹접속 방식을활용하여사용의편리함을제공하는한편, 초기클라우드도입시간을최소화할수있으며 모든고객에게균일한 공방식임 SLA 기준으로제공가능하여국가/ 지역에구애받지않는글로벌서비스제 하이브리드(Hybrid) 클라우드란비지니스환경에따라두가지방식을혼용하여사용하는방식으로 내부에구축하여운영하다필요에따라외부의공용클라우드를한시적사용함으로써비용및시 간의단축을보장받을수있기때문에최근선호하는방식임. 자사의정보자산을보호하는동시에 필요할경우에만한시적으로공용클라우드를사용함으로서비용효율성을추가하는방식 [ 공급망관점기술범위 ] 공급망관점전략제품세부기술 컨텐츠제작유통경로확대및 Long tail 컨텐츠성장 IT 인프라개발단기성장은가능하나 Commodity화될가능성 공급자 (Supplier) 플랫폼개발 애플리케이션개발 멀티플랫폼들을아우르는통합플랫폼구축 - 모바일단말별통합플랫폼 - 스마트기기간통합플랫폼 통합플랫폼등장에따른개발환경개선및스마트기기간연결성에기반한앱의성장 서비스제공자 (Service Provider) 클라우드서비스제공 창의적서비스제공 네트워크서비스제공 클라우드서비스마켓플레이스를구축하며생태계의중심역할 클라우드-스마트기기-소비자주문형서비스로구성되는새로운비즈니스모델의급격한성장 연합마켓플레이스구축실패시망대여사업자로역할제한가능 단말제조사 (Manufactu rer) 단말기제조 Zero client 등장및사용자인터페이스의진화 91
데이터인텔리전스 - 클라우드기반 SW 2. 가. 산업환경분석 산업특징및구조 (1) 산업의특징 컴퓨팅자원의사용을소유에서임대로전환하는패러다임의변화 (Pay-as-you-go) 클라우드서비스란인터넷상어딘가에구름(Cloud) 처럼존재하는하드웨어소프트웨어등의컴퓨팅자원을필요한만큼만빌려쓰고(On-demand), 이에대한사용요금을지급하는방식 - IT 자원을 소유 하던기존방식에서 임대 로의전환을통해비용절감과업무의시공간제약을해 소 - 06 년구글직원( 크리스토프비시글라아) 이최고경영자회의에서처음사용 - 클라우드컴퓨팅 과혼용되기도하나, 클라우드컴퓨팅 은기술을지칭하는용어이며 클라우드서 비스 는이를통해구현되는서비스를지칭 클라우드서비스를통해 는) 가상공간(Cloud) 에존재 IT 자원은사용자의컴퓨터에장착되지않고사용자가모르는( 알필요없 - 사용자가생산또는수집한데이터는사용자만쓰는고유의장치에저장되지않고, 연결된어딘가의저장장소에보관 네트워크로 - 사무용 S/W 등의애플리케이션, 미디어파일등도사용료를지불하면클라우드에보관되어있다 가필요할때사용자의컴퓨터로불러냄 - 유휴컴퓨팅자원을최소화하면서네트워크가연결된곳이면어디서나, 어느기기로나 클라우드에보관된정보나애플리케이션을불러내활용할수있는서비스 제3의 IT 혁명을이끄는핵심동력이자 IT 기업들의성패를좌우할요소 클라우드서비스는 IT 환경을근본적으로바꾸는제3의 IT 혁명으로서산업전체에영향을주고 있으며특히미국에서가장활발하게전개 - 메인프레임시대(1980 년대이전), PC 중심분산형컴퓨팅시대(1980~2000 년) 에이어자원의통 합, 공유, 분배를지향하는클라우드컴퓨팅이부각 - IT 산업뿐아니라전산업계최대의핫이슈로서 2012년이후 IT 환경에대한영향력가시화 예상 - 2010 년이후구글, IBM, 아마존, MS 및국내의네이버, KT 등유력 IT업체들이클라우드서비 스를출시하여전략사업으로육성중 클라우드컴퓨팅은 IT 패러다임변화를이끄는핵심동력이자 IT 기업들의성패를판가름하는결 정적요소가될전망 92
전략제품현황분석 - 시장조사기업인 IDC에따르면 2020년엔 IT 공룡의 3분의 1 이멸종하고, 클라우드화에적응한 기업들이생존할전망 - 클라우드컴퓨팅기술은모바일과의결합을통해 모바일클라우드 로진화 - 개인고객들에게는새로운라이프솔루션을, 스솔루션을제시하며발전 기업고객들에게는스마트워크등의혁신적비즈니 최근대형 IT 업체를중심으로클라우드사업을위한 M&A가매우활발 - 특히미국업계가 09~ 10년상반기동안이루어진전체클라우드 M&A의 85% 를차지하며가장 적극적으로대응 - 전세계클라우드 M&A 추이: 09년상반기 54 건 09년하반기 58 건 10년상반기 84건 빅데이터(Big Data), 모바일화, Green IT가주요확산배경 기존분석체계로감당할수없는빅데이터(Big Data) 대두 시대의도래로클라우드컴퓨팅의필요성 - 시장조사기업인 IDC 는 12년전세계적으로생성되는디지털정보량이 2.7Zb에이를것으로추정 - 자신이직접소유하는 IT 자원으로는저장관리가불가능, IT 자원임대사업자에의한전문적관 리서비스의필요성증대 - 효율적이고경제적인빅데이터의전달, 처리, 분석, 관리기술이기업의핵심경쟁력으로등장하 고있으나, 고도화된 IT 인프라에대한막대한고정비지출은기업에게부담으로작용 - 대규모고정비투자없이전문 IT 인프라서비스를통한효율적인데이터분석및관리가가능한 클라우드컴퓨팅서비스가주요대안으로등장 스마트폰본격성장에따른대용량컨텐츠수요증가및스마트기기와모바일 OS 다양화가클라 우드서비스성장가속화 - 스마트폰의보급은대용량컨텐츠수요를증가시키고있으나, 아대용량데이터처리역부족 휴대성때문에자체저장용량이작 - 선진국을중심으로신흥국까지스마트폰보급이본격화되어 12년전세계스마트폰보급대수는 전체휴대폰보급대수의 34% 인 6억 5천만대에이를것으로전망 - 태블릿 PC, 넷북등의등장으로개인이 2개이상의스마트기기를보유함에따라동일컨텐츠를 중복구매해야하는불편발생 - 대용량컨텐츠를저장하지않고스트리밍형식으로사용할수있으며, 에서나컨텐츠사용이가능한클라우드서비스가필요 한번의구매로어느단말기 - 다양한 OS 기반스마트폰의등장으로개발자들이동일한애플리케이션을여러 OS 버전으로개 발해야하는불편을해소 93
데이터인텔리전스 - 클라우드기반 SW 컴퓨터자원의효율적인사용을통해에너지효율을높일수있는클라우드컴퓨팅이 해결책으로대두 Green IT의 - Gartner에따르면전세계 CO2 배출의 2% 를 IT 업계가차지하고있으며이는항공업계와비슷 한수준 - 개별적으로소유한단절된서버에서는많은유휴자원이발생하나, 클라우드컴퓨팅을통해네트 워크로연결된서버는유휴자원을즉시탐색해데이터를저장하여자원낭비를최소화 - 각각의 IT 자원중저전력형자원을우선적으로선택함으로써에너지소모도최소화 - 방대한에너지사용데이터를실시간으로분석관리해야하는스마트그리드에클라우드컴퓨팅 기술이접목되어효율적인에너지관리시스템제공가능 설비투자비, 서비스구매비용, 개발비등 IT 생태계참여자비용절감 - 클라우드서비스는고도화된 IT 인프라설비를사용하는만큼만지불(Pay-as-you-go) 하므로초기 설비투자비용절감가능 추가보수비용발생이없어운용비절감및계획적예산운영도가능 - 서비스를즉시이용할수있으므로 IT 효율성을향상 인프라설비투자에소요되는기간을단축시켜기업업무 - Gartner 에따르면 10년전세계 IT 인프라투자비용은 1.4 조달러( 약 1,600 조) 수준이며, IT 컨버 전스화에따른전산업에걸친 IT 인프라확충추세로 15년까지매년 7% 씩성장할것으로전망 클라우드컴퓨팅은사용량에따라컴퓨팅자원이배분되는유연성(Elasticity) 과확장성(Scalability) 을토대로시스템운용효율성제고가능 - 클라우드서비스의가장핵심적인특징은컴퓨팅시스템축소및확충이이용자의요구에따라 언제든지가능하다는점 - 확장성을토대로갑작스러운시스템과부하등의사고에유연한대처가능 - 뉴욕타임즈의마크프론스 CTO 는 오스카시상이있는경우시간당 100만명의트래픽이발생하 는데별도의인프라도입없이얼마든지시스템확충이가능하다 라고밝힘 높은 IT 설비투자없이참가자모두가동일한환경에서업무수행이가능하여재택근무, 원격협 업을통해업무생산성을향상 - 구글의 Google Docs, MS 의 오피스 365 등오피스제품들의클라우드화로언제어디서나공 동으로업무를수행할수있는환경구축 - 기업내 ERP(Enterprise Resource Planning) 시스템에의한업무수행여건조성 클라우드시스템도입시전세계어디서나동일한 94
전략제품현황분석 특정장치나 OS 에대해독립적이므로애플리케이션개발자의동일컨텐츠의중복개발, 사용자의 중복구매를방지 - 클라우드서비스는웹플랫폼에기반하므로인터넷접속이가능한모든기기에서사용가능하여기 기와 OS 독립적으로이용가능 - 세분화된 OS별앱개발비절감및사용자앱구매비용절감으로애플리케이션시장활성화 - 동일한애플리케이션을애플의 ios 용, 구글의안드로이드 OS 의버전별( 프로요, 진저브레드, 허니 콤, 아이스크림등) 로개발해야하는부담해소 통합플랫폼의구축으로단말기간동일한사용환경구축 모바일클라우드의확대에따라단말간플랫폼을아우르는커다란통합플랫폼등장가능 - 모바일클라우드의가장큰특징은특정플랫폼에종속되지않고데이터이동이자유로워별도의연동과정없이동기화된컴퓨팅환경제공 - 현재의단말종속형플랫폼에서는진정한의미의모바일클라우드서비스구현불가 - 최근활발하게논의되고있는 Web as a platform이이러한흐름을반영한것으로이는모바일 OS의미래에도큰영향 - Web App 의발전으로향후네이티브앱의영향력이축소될전망도제시되고있으며, 티브앱과모바일웹을혼용한하이브리드앱이성장하는추세 최근네이 - 궁극적으로 TV, 자동차, 선박등이종기기까지아우르는통합플랫폼으로도발전가능 소셜플랫폼의영향력이점차확대되면서미래클라우드서비스통합축으로서생태계의중심 역할을할전망 페이스북과트위터가폭발적인성장을할수있었던이유는클라우드서비스에기반하여 벤처기업들이높은투자비용부담없이창의적인서비스를제공할수있었기때문 - 페이스북 CIO 팀캄포스에따르면페이스북 IT 인프라의 70% 가 SaaS로운영 소셜서비스로고객체류시간을확보하여다양한클라우드서비스통해새로운수익모델을제시하 며성장 - 구글방문자당체류시간이평균 82분인반면페이스북은 360분 - 소셜서비스업체들은클라우드기반컨텐츠스트리밍, 게임, 쇼핑, 영상채팅등다양한영역으로 서비스를확대하며세력확장 소셜플랫폼제공업체들이향후인터넷사용의 Gateway로자리잡으며클라우드서비스들을 통합하는역할수행 (Aggregator) 95
데이터인텔리전스 - 클라우드기반 SW ROI = ( 수익 비용)/ 비용자료 : Microsoft and Merriman Curahn Ford(2010) [ 클라우드컴퓨팅도입을통한비용절감효과 ] 96
전략제품현황분석 (2) 산업의구조 클라우드컴퓨팅서비스오픈플랫폼및핵심기술의확보 오픈플랫폼제공으로서비스활성화요구는증가하지만국내오픈플랫폼제공부재로클라우드 서비스활성화장애 비공개독점플랫폼의확산은다양한분야로의시장확산과발전의장애를초래하며, 개발자생태계를취약하게함 특히관련 미국의 NIST는 2011 년에클라우드컴퓨팅표준로드맵을발간한이후, 관련한다양한연구를하 고있으며최근클라우드컴퓨팅서비스의중계를위한클라우드서비스브로커의역할및참조 아키텍처를정의함. 플랫폼핵심기술은대부분외국기업이보유하고있으며, 기술격차존재 클라우드컴퓨팅서비스를제공하는외국기업에비해국내에서는클라우드서비스를위한플랫폼 핵심기술보유업체부재 국내기업들이클라우드컴퓨팅서비스로진출하여경쟁적우위에설수있는저렴하고도강력한 플랫폼기술확보시급 클라우드컴퓨팅을이용할경우벤처기업은초기투자비용에대한부담없이클라우드서비스를 개발하여서비스가능하므로벤처기업의활성화유도 차별화된클라우드컴퓨팅서비스모델발굴 차별화된클라우드컴퓨팅기술부재에따른미래시장및기술경쟁력약화우려 다양한응용분야를고려하여확장가능하며유연한클라우드컴퓨팅플랫폼및핵심응용기술 개발필요 국내에서는글로벌 IT 벤더중심으로서비스보급이가속화되고있으나, 주로응용개발에중심을 둔비즈니스모델구축으로플랫폼제공기업부재에따른개발자생태계취약 사용자와개발자참여를확대시키는클라우드컴퓨팅플랫폼기술개발역량강화와국내환경에 최적화된비즈니스모델확보 클라우드컴퓨팅서비스의상호운용성지원 기술에대한표준화요구와표준화부재에따른서비스및시장혼란우려 현재클라우드컴퓨팅의가장큰문제점으로이기종서비스플랫폼간상호호환성보장이안됨 클라우드서비스도메인별서비스확장성및상호운용성제공을위한표준마련시급 97
데이터인텔리전스 - 클라우드기반 SW 클라우드서비스모델의변화에따른대응 다양한응용분야활용에대한요구및클라우드서비스모델의변화에대응 아마존, u-cloud 등 public 클라우드서비스와각기업이소유하는 private 클라우드서비스와같 은개별적인클라우드모델에서점차적으로산재된클라우드들이서로연결되는연동클라우드모 델로변화중이며클라우드가서로연결되는연동클라우드플랫폼은다양한응용분야에활용될 전망 예기치않은클라우드서비스폭증, 장애및재해대비, 서비스품질보장등의다양한목적으로 활용가능 기존클라우드서비스사업자에게는구축된클라우드인프라의낮은활용률을개선하거나새로운 클라우드서비스비즈니스모델발굴의기회를제공 클라우드서비스사용자는사업자종속성문제에서벗어날수있으며, 손쉽게선택, 이동할수있는사용자중심의서비스실현 적합한클라우드서비스를 중소기업의국내시장진입환경개선 개방적이용환경및합리적인가격구조에대한기대및클라우드컴퓨팅서비스는대규모외국사업자에의한국내시장잠식가능성이있으며, 사업자종속적시장지배구도로폐쇄적이용환경및불합리한가격구조초래와외산클라우드컴퓨팅솔루션중심으로국내서비스시장이형성될경우, 시장종속으로인한기술자주성분실우려 주요외국솔루션기업들은기존제품을기반으로클라우드솔루션을출시하여국내도입을추진 중 삼성SDS와 KT는자체운영중인데이터센터등의 IT 인프라를활용하여유틸리티컴퓨팅서비스를 시작으로클라우드컴퓨팅을접목하는작업을진행 [ 클라우드산업구조 ] 구분촉진요인저해요인 수요 - - 클라우드서비스는타산업과의융합을통하여수요및응용분야가계속확대중임국내급성장중인모바일산업과맞물려클라우드서비스의수요는꾸준한증가추세임 - - 국내클라우드서비스의적용확대를위한우수한참조사이트가부족함외산제품과의치열한시장경쟁으로국내서비스의위축가능성 환경 - - - 범정부차원의적극적인클라우드활성화정책지원클라우드컴퓨팅서비스의기반이되는안정적이고고성능의통신인프라구비클라우드기반의다양한서비스출시가증가 - - 선두주자로출발한미국및유럽기업들과의기술격차가존재보안이슈대두및클라우드에의한사회적인식부족으로시장활성화장애 기술 - 주요한통신기업을중심으로다수의중소기업들이국내의우수한컴퓨팅인프라를기반으로클라우드기술의연구개발및서비스를출시중임 - 국내클라우드서비스의성숙도는 3~5년이내에해외서비스수준에도달할것으로전망 - - 국내오픈플랫폼제공부재로클라우드서비스간의호환성부족클라우드컴퓨팅서비스를위한자체보유핵심기술부족으로해외의존도가높음 98
전략제품현황분석 국내클라우드서비스는다양한산업과의융합을통한꾸준한성장및정부의지속적인활성화 정책을기반으로서비스안정성, 사용편의성및고신뢰성을보완한다면, 높은성장가능성을 기대할수있음 현재, 클라우드컴퓨팅서비스플랫폼은외산제품대비기술격차가존재하나, 클라우드서비스 모델의변화에따른새로운서비스모델창출및기술의연구/ 개발은국내클라우드서비스가 외산제품대비서비스차별성및기술경쟁력을가질수있음 클라우드컴퓨팅관련산업은태생적으로 IT 자원의아웃소싱과밀접한관련을가지고있으며, 2012년부터 2016년사이에가장빠른성장이예상되는분야는클라우드컴퓨터서비스와스 토리지서비스분야이며, 가장큰시장을형성할것으로예상되는분야는데이터센터아웃소싱 분야임 클라우드컴퓨팅생태계는벤더, 프로바이더, 사용자로구성되며, 벤더는클라우드컴퓨팅데이 터센터를구성하는제품군(HW, 솔루션, 응용) 을제공하고프로바이더는클라우드컴퓨팅서비 스를제공, 운영하며사용자는클라우드컴퓨팅서비스의소비자( 기업. 개인) 및 3rd party 서 비스제공자를포함 클라우드컴퓨팅서비스는다양한분야의기존비즈니스영역들과관련성을가지며, 2015년까 지공공분야에서는전체수요의 15% 정도를꾸준히유지할것으로예측되고금융, 통신및 제조분야에서의수요는각각전체의 15~20% 의수요를차지할것으로전망 [ 클라우드서비스플랫폼의연관산업구조] 후방산업클라우드서비스플랫폼전방산업 가상화시스템SW, 스토리지, 네트워크, 시스템, 운영체제, 응용소프트웨어등 클라우드인프라스트럭처 (IaaS), 클라우드소프트웨어 (PaaS, SaaS) 클라우드스토리지, 협업, 콘텐츠관리,CRM, ERM, SCM, 제조, 엔지니어링, 가상데스트탑, 응용서버미들웨어등 99
데이터인텔리전스 - 클라우드기반 SW 나. 경쟁환경 국내클라우드컴퓨팅산업의산업수준, 기술경쟁력및환경측면에서의분석 산업수준 : SaaS 서비스의비중이가장높고, 미국(100) 대비 66% 의낮은산업경쟁력을 유지하고있으며인력및마케팅채널은부족하나 IT 인프라및관리측면의경쟁력을보유 기술경쟁력 : 미국대비 4.1년의기술격차가존재하고안정성의이유로외산솔루션비율 이높은상태임. 기초기술부족및기반기술의개발이어려운상황이므로기술력강화를 위해정부의개발및자금지원이필요한상태 인력경쟁력/ 제도/ 지원 : 미국(100) 대비인력수준은 60% 정도이며, 클라우드전문인력이 부족한상황이므로서비스인식개선, 신뢰성확보를위한법제도개선이필요한상태 가상화솔루션, 존성심화 빅데이터플랫폼등클라우드컴퓨팅의원천기술미확보로해외기술에대한의 국내기업은원천기술기반의응용개발에만주력하여해외원천기술에대한라이센스비용으로많 은금액을지불 - 국내 VDI기업인 T사는전체판매비용의 30% 정도를라이센스비용으로지불 공공및민간기업의외산선호현상과국내제품에대한정보부재, 제품보급이낮음 레퍼런스부족등으로국내 공공기관의클라우드기반데스트탑구축공고시외산/ 특정제품만참가할수있는조항을포함시 켜국내기업의진입을차단하는사례발생 국내인력수준은선진국대비 60% 수준에머무르고있음 국내클라우드컴퓨팅산업발전장애요인( 클라우드컴퓨팅산업실태조사, 2011, CCCR) : 1우 수인력부족(25%), 2마케팅채널/ 판로부족(18.2%), 3정부지원부족(13.6) 클라우드전문인력은미국기준으로(100) 일본(82), 유럽(76), 한국(60) 수준의인력보유 (CCCR,2011) 국내는자동차, 주택구매등 HW 소유중심의가치관형성으로, IT자원도소유하고자하는문 화를보유 미국, 유럽등선진국은자동차, 주택등주요자산을빌려쓰는형태가사회전반에만연하여 IT자 원을소유하지않고빌려쓰는클라우드에대한거부감적음 본인의 IT자원을외부시스템에존치함에따른보안우려도클라우드컴퓨팅도입확산을지연 100
전략제품현황분석 [ 클라우드총괄현황 ] ( 단위 : 백만달러, %) 산업재산권 2012년매출액 2013년매출액 2014년매출액 2012년근로자 2013년근로자 구분 보유 현황 출원 진행 현황 전체 매출액 Cloud 매출액 전체 매출액 Cloud 매출액 전체 매출액 Cloud 매출액 전체 상시 근로자 Cloud 관련 근로자 전체 상시 근로자 Cloud 관련 근로자 합계 243 105 6,406,884 190,485 8,153,560 393,235 7,302,988 523,856 64,814 2,035 70,253 3,666 IaaS 32 12 2,170,800 60,906 2,913,207 199,909 2,218,153 259,893 44,640 649 46,333 723 PaaS 25 34 13,594 8,686 11,055 7,259 12,751 12,211 327 131 484 180 SaaS 117 31 2,118,393 53,551 2,247,631 96,100 2,043,367 133,515 5,873 614 9,177 2,011 Cloud HW Cloud SW 13 1 47,430 11,416 82,962 16784 101,711 20,609 190 60 553 99 56 27 528,040 52,126 596,951 70,683 501,040 95,628 9,284 546 9,406 633 기타 0 0 1,528,627 3,800 2,301,754 2,500 2,425,966 2,000 4,500 35 4,300 20 출처 : IDC 15년 8 월, 국내클라우드산업실태조사 (2014). NIPA 101
데이터인텔리전스 - 클라우드기반 SW 다. 전후방산업환경 HW 는서버, 스토리지, 네트워크등의 IT 장비로구성되며, IDC 설비는전력장치, 냉방장치등 으로구성됨. 그에따라데이터센터내에너지소모의 67% 를차지하는서버의전력소모를 줄이는그린서버기술의중요성이부각되고있음. 따라서외산장비의의존에서탈피하고서 버의전력효율을높이기위한그린서버기술의확보가시급함. 또한국내기업은스토리지, 네트워크장비의일부를공급하는수준에그쳐전반적으로제조( 기술) 역량및인력수준이낮 은편임. 따라서스토리지, 네트워크장비등의분야에서하이브리드스토리지및중 소형급 QoS 라우터등일부경쟁력있는제품의제조( 기술) 역량을확충하고관련전문인력의양성 이필요한상태 클라우드서비스단말시장은스마트폰, 웹패드및노트북/PC 등을포함하며, 향후웹기반클 라이언트단말및센서등장치를포함하는서비스에특화된단말로의진화가예상됨. 따라서 단말기는시장의급격한변화흐름에맞도록개발되어야하므로기업이주도함이바람직함. 특 히, 모바일기기의사용환경이 모바일웹 으로변화함에따라클라우드환경이융합된기업용 모바일오피스사업등이유망할것이므로, 관련기업들은차세대웹 OS 개발등모바일 SW 역량강화에주력할필요가있음 클라우드 SW 솔루션은프로그래밍환경, 클라우드실행미들웨어, SaaS 플랫폼및보안등으 로이루어짐. 기술에있어서는미국등선진국보다기술경쟁력이낮은편으로세계시장에서 경쟁력이있는핵심기술( 가상화등) 은보유하고있지않은편임. 따라서우리나라는일부기 술력을보유하고있는 VDI 등의분야에대해정부의집중지원이필요함 IT-비IT 산업간융합에따른대규모데이터처리가급격히증가할것이며, 데이터안정성을위 협하는보안이슈가본격화될것임. 뿐만아니라분산컴퓨팅기술과보안기술의지속적인개 발이필요하며, 서비스이용자의심리적불안감해소도중요한이슈임. 클라우드의가장큰특 징은확장성과자동화에있으므로, 결국승부는 auto provisioning & auto scale out, auto monitoring 및 auto metering 편리성을강화할필요가있음 지원등자동화기반의클라우드관리툴을제공함으로써유저 응용 SW 솔루션은 SLA, 서비스관련기술등으로구성되는데국내의경우, 클라우드서비스 의급격한수요증가에즉시대응가능한개발자편의의클라우드개발환경이구축되지않은 상태임. 따라서클라우드환경 SW 개발에정부의지원이필요함 국내응용 SW 업계에서보유중인기존 PC 기반의최적화된응용프로그램을클라우드컴퓨팅 환경에적합하도록변경하는노력을하지않고있음. 따라서클라우드컴퓨팅에최적화된응용 프로그램을많이만들어이를활성화할수있는기반구축도필요함 102
전략제품현황분석 3. 가. 시장환경분석 세계시장 미국은아마존, MS, 세일즈포스닷컴등기존강자는 IoT, 빅데이터를결합하여제조업등다 양한분야에적용중이며, 중국은정부의산업육성의지와함께바이두, 알리바바, 텐센트등 기업들의적극적인투자로인하여관련시장은 50% 이상성장하고있음 일본의경우아마존등글로벌기업과후지쯔, NEX 등국내 SI기업간경쟁이이루어지고있 고, 국내외기업이같이공존하는 CSB시장도활성화하고있음 2014년도일본클라우드시장점유율은 NTT커뮤니케이션즈가 15.6%, 아마존이 14.2% 를 차지하고있었으며, 시장규모는 14년 3.5조에서 19년엔 10.1조로커질것이라고기대하고 있으며이러한예상은제조업과인공지능과같은전체산업에클라우드가적용되어보편적인 ICT 가될전망임 [ 16 년세계지역별클라우드점유율전망 ] 지역캐나다남미미국 아시아 / 태평양 일본 중동부 유럽 ( 단위 : 백만달러, %) 서유럽아프리카 점유율 2.8% 1.8% 66.9% 4% 2.4% 0.9% 20.5% 0.7% 출처 : IDC 15년 8월 IT 시장분석및컨설팅기관인 IDC의클라우드인프라지출규모관련전망보고서에따르면 클라우드환경구축을위한전세계 IT 인프라제품의지출규모가 2016년 16.2% 증가해 374 억달러( 약 41 조원) 규모에이를것이라고분석했으며반면, 비클라우드환경구축용엔 터프라이즈 IT 인프라지출은 2016년 1.8% 의감소할것으로전망 퍼블릭클라우드데이터센터부문은 18.6% 성장해전체지출에서 62.6% 의비중을차지할 것으로보임. 오프프레미스클라우드환경구축을위한 IT 인프라지출은 2016년 284억달 러( 약 31 조원) 를전망하며이는 IT 투자가오프프레미스 IT 리소스쪽으로급속히이동하고 있음을상징함. 온프레미스환경에서프라이빗클라우드용 IT 인프라지출규모도전세계모 든지역에서증가할것으로보임 103
데이터인텔리전스 - 클라우드기반 SW * 자료: IDC 2016 [ 클라우드세계시장현황및전망 ] [ 클라우드기반 SW 의세계시장규모및전망 ] ( 단위 : 억달러, %) 구분 15 16 17 18 19 20 CAGR ('13~'15) 세계시장 701 864 1,055 1,275 1,376 1,486 14.2% * 자료: IDC 자료를통한잠정추정치 104
전략제품 현황분석 나. 국내시장 현재 클라우드 컴퓨팅(이하 클라우드) 시장에서는 선두주자인 아마존, 구글 뿐만 아니라 마이크로소 프트(MS), IBM, 오라클 등 패키지 SW기업에서부터 이동통신사와 각종 장비 기업에 이르기까지 적 극적인 투자와 주도권 다툼이 벌어지고 있는 상황 초기 투자비용이 적으면서도 모바일 환경과 결합해 신속하게 시장에 진출하는 린스타트업 (Lean Startup) 방안으로도 인기를 끌고 있어 산업의 다변화와 시장규모 확대 잠재력도 충분한 상황 [ 클라우드 세그먼트별 국내 시장 규모 전망 ] *출처 : KISTI 정부도 공공부문의 비용절감과 업무혁신, 민간산업 육성을 위해 2015년 9월 세계 최초로 클라 우드 발전법을 제정, 클라우드 선도국가 도약을 위한 시동을 건 상태임. 이에 따라 민관협력 가시화에 따른 시장 확대와 신사업 출현에 대한 기대감이 그 어느 때보다 높아지고 있음 시장조사업체 가트너에 따르면 2016년 세계 클라우드 시장규모는 1,153억 달러로 2019년까지 16.9%(CAGR)의 고속 성장이 예상되며 국내 시장은 7억 5000만 달러로 2019년까지 17.7%의 성장률을 보일 전망이며 이는 SW산업 성장률보다 약 7배 높은 것으로 국내 SW산업이 신속하게 클라우드 중심으로 전환될 것임을 예고함 분야별 보면 세계 시장의 경우 IaaS(Infrastructure as a Service)의 성장률이 27.5%로 가장 높고, 국내는 SaaS(Software as a Service)의 성장률(21%)이 가장 높을 것으로 예상 이는 국내 클라우드 산업이 큰 폭의 성장을 하는 가운데 통신사 주도의 인프라 위주에서 독창성 중심의 응용 서비스 산업으로 이동할 것임을 시사하며 중소 벤처 SW기업에는 의료, 교육, 물류, 여행, 금융 등 다양한 융합 분야의 틈새시장을 공략할 기회가 될 것임 105
데이터인텔리전스 - 클라우드기반 SW [ 클라우드기반 SW 의국내시장규모및전망 ] 구분 15 16 17 18 19 20 ( 단위 : 억원, %) CAGR ('13~'15) 국내시장 4,137 5,106 6,183 7,397 7,586 7,781 13.4% * 출처: IDC 자료를통한추정치 [ 글로벌( 좌) 국내( 우) 클라우드분야의시장규모및전망 ] 106
전략제품 현황분석 4. 기술환경분석 가. 기술개발 트렌드 클라우드 서비스 도입을 위해 고려해야 할 요구사항이 늘어나고 복잡해짐에 따라 컨설팅부터 설치, 운영까지 전 과정을 전문으로 맡는 클라우드 서비스 브로커리지(CSB) 산업이 부상할 전 망 시장조사업체 마켓앤마켓은 현재 52억 4000만 달러인 이 시장이 2020년에는 191억 6000만 달 러로 성장, 연평균 29.6%의 성장률을 보일 것으로 예측 [ 클라우드 브로커지 서비스 개념도 ] CSB 사업을 위해서는 다른 클라우드에 흩어져 있는 자원을 필요에 따라 유연하게 활용할 수 있는 브로커링 기술이 필요함 가상머신 마이그레이션 기술(가상머신으로의 변환), 레이턴시 보장 기술(지연 현상의 최소화), 정보 보호 기술, 상호운용성 표준 기술 등이 중요 데이터의 은닉과 정보 반환, 파기의 투명성을 보장하고 사용자 인증, 통신보안 등을 지원하는 총체적 정보보호 기술의 중요성이 점점 커지고 있음 CSB 분야는 공공부문의 민간 클라우드 활용 촉진정책에 대한 기대감으로 관련 포럼이 창립됐으며 동부, 농심NDS, 코오롱베니트, 효성ITX 등이 시장진출을 선언했으며 이는 스토리지, 네트워크, 서 버 등 침체된 국산 장비 산업 활성화를 견인하는 효과를 낼 것으로 보임 기존의 클라우드 서비스의 기반 기술인 가상화와 더불어 도커(Docker)라는 오픈소스 솔루션으 로 잘 알려진 컨테이너 기술에 대한 활용이 높아질 전망 컨테이너 기술은 가상머신이 없는 환경에서도 애플리케이션 단위의 가상화를 구현할 수 있는 기술 로서 컨테이너를 이용해 원하는 화물을 옮기는 것처럼 애플리케이션의 기능이나 서비스를 한 데 담아 손쉽게 적용하고 바꿀 수 있음 107
데이터인텔리전스 - 클라우드기반 SW 이기능을이용하면적은비용과시간으로가상머신을적용하면서도보안이나시스템에미치는영 향을최소화할수있음. 컨테이너기술은구글등이주축이된공개 SW 인 도커(Docker) 를적용 하고있으며개발자커뮤니티활동도활발함 SaaS 개발환경을제공하고해당환경을손쉽게구성할수있도록도와주는 a Service) 가클라우드도입확산에중요한역할을할전망 PaaS(Platform as IaaS 분야에서는아마존, MS 등이글로벌시장을주도하는가운데국내기업과제휴, 데이터센터 리전을직접운영하고있으며국내는통신사들이기업용 SaaS(B2B) 나가입자용서비스(B2C) 등을 결합상품으로출시하고있으며또네이버, 더존비즈온등인터넷기업이나기업용솔루션기업도 독자적 IaaS 영역을확보하고있음 PaaS의경우시장은크지않지만 IaaS와 SaaS 사업의주도권을확보할수있다는점에서 MS, 세일즈포스, 아마존, IBM, 구글등의경쟁이치열하며또오픈쉬프트, 클라우드파운드리등공개 SW 도세력을확대중 SaaS 는세일즈포스닷컴, 구글, MS 등이주도하는가운데 SAP, 오라클, 어도비등전통적인 SW 기업도시장에진입했으며국내는더존비즈온, 한글과컴퓨터등이전사자원관리(ERP) 및오피스 SaaS 를기반으로글로벌시장진출을추진하고있음 클라우드서비스에대한표준화와브로커리지기술확보여부가클라우드비즈니스에서성공여 부를가늠할변수가될전망 현재정부는클라우드발전법의후속조치로공공기관클라우드도입가이드라인을마련하고있으 며이와관련한보안체계, 품질인증주체및범위, 인증절차등은클라우드산업확산속도의 변수가될전망 민간클라우드서비스의정부조달품목실현여부와조달시적용될라이선스체계( 사용기간, 금기준, 공급형태, 지급방식등) 또한생태계형성에중요한역할을할것으로보임 과 CSB 가우리나라에서신산업으로성장할지도관전포인트. 시장에는프라이빗클라우드를통해데 이터의보안성을높이고, 퍼블릭클라우드를통해전산시설운영경비를절감하겠다는상반된요 구가공존하고있으며이를하이브리드클라우드로수용하기위한 수가될전망 CSB의기술역량이중요한변 데이터와서비스의호환을지원하는표준화는하이브리드클라우드실현뿐만아니라특정업체에 종속되는현상을방지한다는면에서도중요한쟁점이될것임 다양한분야의제도와규제를클라우드친화적으로개선하는것도중요한과제로서시행규칙개정 안은전자의무기록의외부보관요건을완화하는내용을담고있으며, 교육부의원격교육설비기준 고시역시물리적으로별도서버를구성해야하는규정개선을검토중인것으로알려져있으며 제조, 농업, 관광, 교육, 금융등다양한분야의클라우드도입장애요인이어떻게개선될지도중 요한이슈가될전망 108
전략제품현황분석 기업에게데이터란한국가의석유자원과같은것으로미래비즈니스의주도권을선점하기위 한 ' 데이터수탈' 경쟁이벌어질것임 먼저 BI 및애널리틱스업체인태블루소프트웨어(Tableau Software) 의수석제품마케팅매니저 인더스틴스미스(Dustin Smith) 는데이터를놓고경쟁이벌어질것으로전망하며세일즈포스에 서아마존웹서비스까지대형클라우드기업은많은기업과기관이자신의생태계로데이터를이 전하기원하고있는데이는전형적인내부데이터자산에만국한되지않고워크데이 (Workday), 젠데스크(Zendesk) 같은웹플랫폼, 머신과장치의데이터가이들클라우드기업의표적임 이러한현상에대해한전문가는 " 이러한현상은놀랄일은아니다. 기업에데이터란국가의석유 자원과같다. 기업의핵심토대역할을추구하는클라우드서비스업체는기업의모든데이터를 확보해이용해야한다. 이미클라우드에엔터프라이즈데이터호수(Data lake) 를구축하기시작한 상태이다. 클라우드업체의스토리지가저렴하다는점을고려하면더매력적이다. 대규모자본투 자가필요없다는점도장점이다" 라고언급함 이미데이터웨어하우스를클라우드로이전한기업을중심으로비전통적인( 그러나점차중요해지 는) 데이터소스를계속확장하는플랫폼으로쉽게이전할수있을전망이며사물인터넷(IoT) 자 산에서소셜미디어매트릭스까지모든것이포함될수있고모두기업자원과고객에대한 된분석' 을높이는것을목표로함 ' 연결 대형기업을시작으로강하게기존온프레미스환경의 브리드클라우드로의전환을추진함 IT인프라를공용혹은사설내지는하이 거의모든산업의대기업이전체인프라와데이터생태계를클라우드로바꾸고있으며매장내고 객서비스를강화하는생산과정을개선하는것까지모든것에클라우드를적용하고있음. 이러한 과정에서가장전통적이고변화에소극적인업종의기업조차클라우드기술이비용과위험을줄여 준다는것을인식하고있으며이것은매우중요한메시지로서특히 CIO들은 5년을내다보는사람 이므로, 막대한비용을대체할수있는클라우드에대해정확히인지할필요가있음 최근빅데이터분석에대한관심과활용이폭발적으로증가하면서빅데이터를저장하고이렇게 저장된데이터에대한분산처리를지원함으로서빅데이터저장및분석인프라로서의클라우 드의역할이지속적으로증가 IT 리더는클라우드도입비용을산출하고단기간에확장할수있는능력을갖추기위해언제든 사용할수있는강력한분석솔루션이필요하며한전문가는 " 클라우드기술의가장큰매력이비 용절감과효율적인자원활용이라고가정하자. 그렇다면 CIO는이런편익을손에넣을수있는 지확인할수있어야한다. IT 리더는사용량현황과예측, 비용관련데이터를분석하는클라우드 솔루션을이용해큰비용이초래될서비스를찾고, 예산이초과하는문제를막을수있다. 게다가 회의도중에모바일장치를통해이를처리할수있다" 고말함 고에너지열처리기술의경우, 선진국과기술격차가매우커서해외장비에대한의존도높고, 그결과처리공정의고가화가발생하여다양한제품에대한적용가능성이낮은상태 109
데이터인텔리전스 - 클라우드기반 SW 한국은반도체, IT 분야세계 1 등기술을보유하고있는역량을기반으로레이저, 플라즈마관련 고에너지시스템산업의발전가능성도높으며, 이러한역량을통해향후고품질부품및소재개 발에중요한역할을하게될고에너지국부열처리시스템개발에적극적인투자필요 대기업들은데이터자본의현실을깨닫기시작했으며데이터는단순히과거일어난일의기록 이아니라새로운디지털제품및서비스를개발하기위한원료라고할수있음 이는기업들이새로운모바일앱, 웨어러블기술및기타지능적인커넥티드장치를통해고유의데이터자본자산을개발하는경쟁에돌입했다는것을의미기업들은이러한데이터자본을활용하여혁신적인디지털제품및서비스를찾거나, 또는경쟁업체들이따라올수없는수준으로효율성을향상시키는것과관계없이고유의가치를창출하는방법을찾기위해노력하고있음이러한것들이바로경쟁우위를확보하는방안으로서더많은일간활동에서더많은데이터를포착하고활용한다는빅데이터의실제적인의미를보여주고있으며또한향후새로운경쟁을위해서는새로운형태의컴퓨팅이필요하며여기에서도클라우드는중요한역할을하게될예정임 하지만새로운빅데이터와클라우드기술들은물론, 도록연동및통합에도관심을기울여야함 기존기술들과도원활하게함께연동될수있 [ 빅데이터와클라우드개념도 ] 개인이기술적배경이없어도빠르고손쉽게클라우드생태계로데이터를이전하는시대가도래 할것이며이런환경에서는데이터를클라우드로이전하는방법이복사/ 붙여넣기를하는것처럼 쉬워질전망 한때는셀프서비스데이터통합과데이터준비솔루션이크게유행했었으나최근에는조직내부 와웹플랫폼의데이터를클라우드데이터생태계로옮기는단순한기법에대한관심이커질전망 임. 이제는셀프서비스클라우드분석과데이터준비가완료되었으며이제데이터통합과단계 화, 변환등에있어복잡성을없애고, 기업이선호하는클라우드데이터와웨어하우스에데이터를 옮기는데초점을맞춘솔루션이구현이중요해지고있는단계임 110 기존에이미내부적으로 IT인프라를보유하고있는회사는기존의공용클라우드서비스를혼 용하여활용가능하도록하는하이브리드클라우드가더욱활성화될예정
전략제품 현황분석 하이브리드를 지원하는 솔루션과 서비스가 과거 어느 때보다 번창할 전망이며 특히 레가시(구형) 솔루션, 컴플라이언스(규제 준수), 책임 등의 이유로 일부를 온프레미스(내부)에 배치하는 기업이 늘어날 것이고, 더 선호하는 기업도 있으므로 이러한 이유로 클라우드 도입에 '올인'하고 싶어도 불가능할 때가 있으므로 대형 클라우드 업체는 '클라우드로 모든 것을 옮기지 않는 것은 잘못됐다 '는 주장을 점차 누그러뜨리고 있고, 공개적으로 하이브리드를 지원하기 시작하고 있음 클라우드 도입이 절정에 도달하고, 클라우드 컴퓨팅 활용의 저변확대가 이루어지면 IT의 역할이 시스 템 유지관리자에서 다양한 혁신의 기술의 제공하는 혁신 중개자로 바뀔 것임 IT 담당자는 기업이 클라우드를 다양하게 활용할 수 있도록 지원하는 새로운 생산성 도구와 정책 을 개발하여 제공함으로서 클라우드 서비스 이용자는 더욱 높은 생산성을 보일 수 있음 온디멘드 API를 통한 다양한 클라우드 서비스 활용 비즈니스가 창출되고 사용자들은 굉장히 다양한 서비스를 활용할 수 있게 됨 클라우드 업체가 API 판매를 새 수익원으로 활용할 전망이며 SaaS, PaaS, IaaS 업체는 많은 API 를 제공하도록 압력을 받게 되고 이는 보안 업체와 그들의 애플리케이션이 부가 서비스를 제공하 도록 유도할 것임 출처 : Oracle OpenWorld 2016 [ 온디멘드 API 개념도 ] 클라우드 서비스 제공 및 활용에 대한 보안 기준에 토론이 더욱 활성화되며 이에 따라 클라우 드 보안 기준이 점점 확립되어 갈 예정임 클라우드 서비스를 이용하는 기업이 늘어나면서 클라우드에 있어 보안 기준이 생길 전망이며 이를 통해 클라우드 이전이 증가하고, 기업이 클라우드 기반의 서비스를 IT 자원에 통합할 수밖에 없게 될 것임 클라우드 회복성에 관한 글로벌 WG(워킹그룹)가 클라우드의 다운타임과 보안 위험을 모니터하고 있으며 현재까지는 클라우드에 중대한 보안 침해 사고와 다운타임이 초래된 적이 없으나 기업이 클라우드로의 이전을 주저하는 이유 중 하나가 보안 이슈이며 데이터센터 보안 침해 사고가 클라 우드 관련 사고보다 잦다는 인식이 지배적이었음 앞으로 클라우드를 도입하는 기업이 증가하고, 사용자가 클라우드에서 이용하는 비밀 데이터와 앱 이 증가하면서, 보안 문제(DDoS 등 사이버공격), 데이터 손실, 다운타임이 증가할 전망 111
데이터인텔리전스 - 클라우드기반 SW 나. 주요업체별기술개발동향 (1) 해외업체동향 미국을중심으로시장을주도중이나, 특히잠재적인클라우드수요를가지고있는중국클라 우드시장이급성장할것으로전망하며중국국무원(State Council) 은 2010 년 전략적신흥사 업육성촉진및발전에대한결정( 院于加快培育和 展略性新 的 定 ) 을통해서 클라우드컴퓨팅을중점발전산업으로선정 국가발전개혁위원회는 Beijing, Shanghai, HÐngzh, ShnzhĿn,Wx XiĦn의 5개도시에서시 범사업을추진목표로 2011년부터 6억 6,000만위안의자금을투자하고있음 민간, 정부, 기업등고객수요에적합한서비스모델을발굴하고정보서비스핵심기업주도하의 산, 학, 연연계강화, 전국적산업연맹설립및협력체계구축, 기술서비스표준과안전관리규 범제정등을추진 시범사업대상 제점분석과대안을요구 5개도시의정보산업주관부서에게창신발전방안과사업추진중발생가능문 [ 중국클라우드컴퓨팅혁신발전위한도시별세부내용 ] 시범도시세부내역미래발전방향발전목표핵심응용영역 Beijing Shanghai Hangzhou Shenzhen - Beijing 공업대학실험인프라구축 - 공공클라우드컴퓨팅인프라구축 - Shanda 클라우드컴퓨팅인프라구축 - 클라우드컴퓨팅혁신기점마련 - Microsoft 클라우드컴퓨팅센터구축 - 과학기술대학클라우드컴퓨터응용센터구축 - 클라우드컴퓨팅산업협회설립 - Microsoft 클라우드컴퓨팅영역사업협력체결 - 전용칩및소프트웨어구축 - 클라우드기반서비스솔루션등생산및보급 - 가상핵심화기술혁신 - 클라우드관리인프라개발및기초시설구축 - 클라우드응용촉진및보안환경구축 개발/ 제조, 시스템통합, 운영유지보수등클라우드산업체계구축 - 지역기반의클라우드선도서비스개발및전자비즈니스시범도시구축 - 클라우드컴퓨팅생산기점마련 - 2015년 500억위안규모산업형성 - 연관산업규모 2,000억위안달성 - 아태지역클라우드허브화 - 1,000억위안규모산업형성 - Hangzho 중심의클라우드산업육성후주변지역으로의확대 - 화남클라우드컴퓨팅센터구축 - 전자정부, 핵심업종, 인터넷서비스, 전자비즈니스 - 도시관리, 산업발전, 전자정부, 중소기업서비스등 - 소프투웨어, 지적재산권보호 - 교육, 전자비즈니스, 전자정부등 Wuxi Xian - Wuxi Xian 클라우드컴퓨터센터구축 - Wuxi Xian 특구클라우드스토리지컴퓨팅센터구축 - 기업, 정부, 개발용등다양한클라우드인프라구축및서비스제공 - 소프트웨어와아웃소싱산업발전생태환경에최적화된클라우드산업구조형성 - 전자정부, 전자비즈니스, 과학기술서비스, 아웃소싱 * 자료: 중국클라우드발전백서 112
전략제품현황분석 중국 국가발전개혁위원회가추진하는중앙정부시범사업외에도지방정부가자체적으로클라우 드지원사업을추진하고있음 Beijing, Shanghai 등각도시를중심으로중앙정부시범사업을추진하여 2012 년에중국內면 적 150 제곱킬로미터규모의클라우드컴퓨팅데이터센터를구축 Beijing의경기정보화위원회는 2010년 10 월에상운공학( 祥云 程 ) 행동계획을공개해, 중앙정부 의클라우드혁신발전을위한시범사업추진계획을중심으로총 261억위안을투자하는 5개년 발전전략을수립 해당기관은 2015년까지클라우드서비스시장을 500 억위안규모로성장시키는것이목표이며, KDDI, Baidu 등의투자를받아데이터센터구축, 클라우드컴퓨팅시스템설비제조기점마련, 클라우드컴퓨팅개발운영센터구축등 5개사업을추진할계획 Shanghai 경기정보화위원회는 2010년 8월에클라우드컴퓨팅산업발전행동추진방안인운 해계획( 云海 ) 을추진 중앙정부의클라우드혁신발전을위한시범사업추진계획을중심으로클라우드산업육성계획 설립하여 2010년부터 3년간총 30억위안을투자 해당기관은정보산업종합경쟁력향상및신성장기반마련이목표이며, 10개의클라우드컴 퓨팅시범인프라구축, 100 개의서비스혁신기업의클라우드서비스촉진, 정보서비스산업에 서 1,000 위안규모의신규수익창출을목표로하고있음 중국 Chongqing은 2011년 11월에 IT 기업들과협력해클라우드컴퓨팅서비스를위한데이 터센터를구축할계획이며 2011년內 10만대규모의서버를확보하고 2015년까지총 100만 대의서버를갖춘다는목표를설정 클라우드데이터센터의총건설면적은 207만제곱미터이며투자금액은 400억위안 Chongqing은각급정부부문의 IT기반공공서비스와재난방지시스템을운영하기위한정부종 합비즈니스센터와공공부문클라우드컴퓨팅센터도마련할계획으로공공부문클라우드컴퓨팅센 터에는 16억위안을투자 중국공업신식화부는 2014년 8 월 클라우드컴퓨팅제13차 5 개년계획 을공표했는데, 2014 년클라우드컴퓨팅산업발전정책과사업의핵심내용은 선도기업육성, 완비된산업체인의 구축, 기술력을갖춘대형기업의합병및구조조정, 자원의집약격려, 선도기업의산업발전 에영향력발휘 등임 현재공업신식화부를비롯한관련부처는공공클라우드컴퓨팅서비스플랫폼건설과이를기반으로한빅데이터서비스, 솔루션계획및보급을중점지원하고있음 중국전자정보산업발전연구원에따르면, 2012년글로벌클라우드컴퓨팅시장에서중국이차 지하는비중이 3% 를기록, 미국, 유럽, 일본등선진국에비해중국의클라우드컴퓨팅산업 은아직발전초기라할수있다고언급 113
데이터인텔리전스 - 클라우드기반 SW 그러나, 2015년에는클라우드컴퓨팅서비스기업사용률이 95% 에이를전망이며관련시장이 빠르게성장하고있다고밝힘 중국클라우드컴퓨팅이용자중 IaaS 이용자가 56% 를차지하며가장높은사용률을나타나고있 으나 2012년 IaaS의시장규모는 5억 1,100만위안으로전체클라우드시장에서낮은점유율을기 록 반면, 2012년프라이빗클라우드시장규모는 500~600 억위안으로주로통신사업자, 에너지, 전력, 의약등대기업과일부발달지역의전자정부시스템에집중분포되어있음 중국內대형인터넷서비스제공사업자들은 IaaS와 PaaS 형태의서비스를중심으로클라우드컴 퓨팅시장에진입, 일부기업은 PaaS 솔루션을상용화하였으며, 수십만명의개발자가사용중임 정보통신(ICT) 제조사업자는클라우드컴퓨팅전용서비스, 스토리지설비및기업프라이빗클 라우드솔루션기술개발을완료하였으며, 글로벌기업과경쟁이가능한수준 소프트웨어사업자들은클라우드컴퓨팅영역사업진출을목표로투자를확대중 China Mobile, China Telecom 등주요통신사업자들과휴대폰제조기업까지클라우드컴퓨팅산업에진출하고있어시장경쟁이치열해지고있으나, 클라우드플랫폼의경우대기업이해당시장을과점하고있고중소기업은주로소프트웨어개발이나응용서비스제공에종사하고있음 중국시큐리티저널에따르면, 중국클라우드컴퓨팅시장규모는 2013년 134 억위안( 약 2조 2,009 억원) 에서 2017년 372 억위안(6조1,101 억원) 으로발전할전망 글로벌시장조사기관 Frost & Sullivan은중국의클라우드서비스시장이 2013년부터 2020년까 지연평균 40.5% 의성장률을기록하며, 2020년시장규모가 43억달러에이를것으로전망 두기관모두세계에서클라우드시장이가장빠르게성장하는국가로중국을꼽았음 단위 : 천위안 출처 : 중국시큐리티저널 [ 중국클라우드시장규모및성장률] 114
전략제품현황분석 중국, 2020년클라우드서비스시장규모는 43억달러에달할것으로전망하며그에따라다양 한사업자들이참여하여경쟁할것으로전망 중국의클라우드서비스시장이 2013년부터 2020년까지연평균 40.5% 의성장률을기록하며, 2020년시장규모가 43억달러에이를것이라고시장조사기관 Frost&Sullivan이전망 중국정부의지원정책등에힘입어특히현지사업자들이막대한시장기회를얻을것으로예상 되는가운데, Aliyun, Chinac.com, Grand Cloud 등이대표적인현지클라우드서비스사업자로 자리매김할것으로예상 이와더불어인터넷서비스업체 Baidu, Sina, Tencent가최근자체클라우드플랫폼인 BaiduAppEngine, SinaAppEngine, TencentAppEngine 을각각출범시키며시장에동참 China Telecom, China Mobile, China Unicom 등통신사업자들역시풍부한인프라자원과 대규모고객기반, 탄탄한자금력을강점으로내세우며일찌감치클라우드시장에진출 이밖에 21 Vianet와 China Entercom같은기존의데이터센터서비스업체들과 SaaS 제공업체 인 800APP, XTool 등도기존역량을확장하여클라우드시장에서경쟁 중국정부의외국클라우드서비스업체견제와해외업체에대한이중적태도로인하여글로벌 업체의대중국진출및비즈니스성과부진함 반면, 글로벌클라우드서비스제공업체들의경우중국현지시장에서오랜기간이렇다할성과를내지못한상태이며, 여기에는중국정부의역할이중요한요인으로작용 Microsoft는 2012년초 21 Vianet과제휴를체결하며글로벌사업자중처음으로중국내에서 공공클라우드서비스를시작했으며, 2014년 3월부터 Windows Azure와 Office 365를제공 Amazon과 IBM 도현지사업자와손잡고중국클라우드서비스시장진출을추진해왔으며, Google은 2013년말대만과싱가포르에클라우드서비스관련시설을확보한것과달리홍콩에 서의데이터센터구축계획은취소 중국정부가정부PC에 Window8 사용을금하거나은행권에 IBM서버를사용하지못하게하는등 미국기술업체에대해잇따른불이익을제공해온전례에비춰볼때, 글로벌클라우드서비스제공 업체들의향후전망도불투명한상황 중국정부는한편으로는대형글로벌사업자들의투자와기술을유치하기위해노력하고, 편으로는자국의데이터주권수호를위한규제를강화하는양면적정책을추진 다른한 닝샤(Ningxia) 省의경우, 지방정부가동지역내대규모데이터센터건립을위한 AWS(AmazonWeb Service) 파일럿프로젝트를승인하고전자정부서비스를위해 Amazon의 플랫폼을사용하기로했으나, 중앙정부는여전히자국기업들의 IT 제품과서비스를우대하고있 는실정 115
데이터인텔리전스 - 클라우드기반 SW 일본은총무성(Ministry of Internal Affairs and Communications, MIC) 이정보통신(ICT) 방 송행정및정책전반총괄 출처 : KACI 일본클라우드관련정책동향 [ 일본정보통신방송규제및정책기관] 2015년 7 월, 일본총무성은 2020 년동경올림픽과그이후의지속성장을목표로 사회전체 ICT 화 를추진하기위한 2020년을향한사회전체 ICT 화 라고하는액션플랜을보고서로발간 도시서비스고도화의일환으로디지털사이니지, 다국어번역, 공중무선랜을통합하여클라우드기 반으로외국인등에게위치와사용언어등에따라맞춤형서비스를제공예정 1 무료공중무선랜환경의정비촉진 2 ICT 를활용한다국어대응실현 3 디지털사이니지기능의확대 4 4K 8K 의추진 5 5G 이동통신실현 6 오픈데이터활용환경의정비 7 방송콘텐츠해외전개촉진 8 세계에서가장안전한사이버공간의실현 출처 : KACI 일본클라우드관련정책동향 [ 2020년을향한사회전체 ICT화를위한 8 대액션플랜] 2014년 6월 ICT를활용한경제활성화의지를담은세계최첨단 ICT 국가창조선언( 개정판) 발표 3 대기본정책방향 1 혁신적인신산업과신서비스개발을통해전체산업이촉진되는사회 2 세계에서가장안전하고재해에강한사회 3 모든공공서비스가원스톱으로제공되는사회 116 모든공공서비스가원스톱으로제공되는사회구현의일환으로정부지방행정정보시스템개혁 을위해 2021년까지모든정부정보시스템의클라우드화통한운영비용 30% 절감하고, 자치단 체의정보시스템클라우드화촉진
전략제품 현황분석 일본 총무성(MIC)은 2010년 4월 새로운 성장전략인 Haraguchi 비전 을 구체화한 Haraguchi 비전Ⅱ 를 발표 기본 방향 ① 정보통신(ICT) 유신 비전 2.0 추진 ② 녹색 분권개혁 추진 ③ 사장된 자산의 활용 스마트 클라우드 전략 을 추진하여 2015년까지 2조 엔(약 23조 8,000억 원)의 신규 클라우드 서 비스 시장을 창출 미국은 미국 정부기관, IT 비용 절감을 위해 클라우드 기반 솔루션 투자 확대 계획에 따라 미 국 연방정부의 클라우드 기반 솔루션 관련 IT 예산을 18년까지 지속적으로 증가시킬 전망 IDC는 14년 미국 연방정부의 클라우드 관련 예산 지출 규모가 당초 예상했던 22억 달러(약 2조 4,400억 원)보다 큰 30억 달러(약 3조 3,300억 원)에 달할 것이며, 15년에는 34억 달러(약 3 조 7,800억 원) 수준까지 증가할 것이라고 전망 이러한 증가 추세는 꾸준히 이어져 16년 48억 1,000만 달러(약 5조 3,500억 원), 17년 78억 7,000만 달러(약 8조 7,500억 원), 18년에는 99억 달러(약 11조 1,100억 원) 수준까지 늘어날 것으로 관측 지난 5년 간 미국 연방정부의 CIO 협의회와 예산관리국(OMB)은 각 정부기관들의 미래 IT수요 를 충족시킬 방안으로 클라우드 기반 솔루션 도입을 촉구 신규 시스템, 저장된 데이터, 모바일 솔루션 등의 IT 시스템에서 클라우드의 활용 촉진으로 정부 기관들은 IT 시스템 운영 방식을 클라우드 환경으로 전환하는 추세 IDC 정부 인사이트 보고서를 총괄한 숀 맥카시(Shawn McCarthy) 리서치 디렉터는 클라우드가 정부 기관에 보다 저렴한 IT 솔루션을 조달할 수 있는 대안으로 부상한 것이 클라우드 지출 증가 의 원인이라고 언급 출처 : IDC 2014.9.16 [ 미국 연방정부의 클라우드 관련 지출액 증가 추이 및 전망( 14~ 18년) ] 117
데이터인텔리전스 - 클라우드기반 SW 클라우드서비스형태에따라서는 SaaS(Software as a Service) 가 Service) 를제치고정부클라우드지출의가장큰비중을차지할것으로전망 IaaS(Infrastructure as a 13 년당시예산관리국은 14년정부기관의 IaaS와 SaaS의지출액을각각 12 억달러( 약 1조 3,200 억원) 와 7억 2,400 만달러( 약 8,050 억원) 로추산하는등정부의클라우드지출은 SaaS 의비중이더큰산업계와다른양상을보일것으로예상 그러나 14년 9월 30 일기준, 연방정부의 IaaS 지출액은 9억 8,600 만달러( 약 1조 960 억원), SaaS지출액은 13 억달러( 약 1조 4,400 억원) 로추산됨에따라정부부문에서도 SaaS가클라우 드수요가증가할것으로전망 미국연방정부는프라이빗클라우드(Private Cloud), 퍼블릭클라우드(Public Cloud), 커뮤니 티클라우드(Community Cloud), 하이브리드클라우드(Hybrid Cloud) 등다양한유형의클라 우드솔루션을도입 프라이빗클라우드와퍼블릭클라우드는인프라구축방식으로구분되는개념으로, 프라이빗클라우드는특정조직만을위한서버인프라를구축하는방식이며, 퍼블릭클라우드는민간업체의서버를임대해사용하는방식 커뮤니티클라우드는특정조직에한정되어서버인프라를공유하는방식이며, 은각유형의특징이나장점을종합한형태 하이브리드솔루션 프라이빗클라우드는특수한 IT 보안표준이요구되는정부기관에서의수요가늘어날것이며정부클라우드지출의가장큰비중을차지할것으로전망 사회보장국이나국토안보부와같이민감한정보를다루거나국가안보를책임지는기관에서프라 이빗클라우드를주로활용 14년정부프라이빗클라우드서비스비용은약 23 억달러( 약 2조 5,500 억원) 로추산되며, 18 년에는약 59 억달러( 약 6조 5,600 억원) 에달할것으로예상 빠르고유동적인솔루션도입을선호하거나비용절감효과를극대화하려는기관일수록퍼블릭 클라우드투자를확대중 퍼블릭클라우드는국방부나주택도시개발부와같이위험요소가낮은퍼블릭정보 (public information) 를보관하기위한스토리지나웹사이트구축이필요한기관에서활용 14년정부의퍼블릭클라우드서비스비용은약 1억 7,300 만달러( 약 1,920 억원) 로추산되며 그수요가증가함에따라 17년에는약 30 억달러( 약 3조 3,300 억원) 를돌파할것으로전망 118
전략제품현황분석 커뮤니티클라우드는미국연방정부의 IT 자원공유를위해사용중인연방전사적아키텍쳐 (Federal Enterprise Architecture, FEA) 의업무참조모델(Business Reference Models) 과같은전통적인공유서비스솔루션으로활용 특히미국법무부가커뮤니티클라우드의활용을주도하고있으며, 정부지출비용은 14년 4억 690 만달러( 약 4,520 억원) 에서 18년 8억 6,890 만달러( 약 9,660 억원) 로비교적완만한성장 세를유지할것으로전망 하이브리드클라우드는차세대클라우드방식으로각광받고있으나, 일종의매시업(Mash-up) 방식의애플리케이션개발을위해다양한방식의클라우드솔루션을복합적으로활용하고있어정부부문에서의지출비용규모를산출하기어려운상황 하이브리드클라우드를활용하는정부기관은재무부가유일하며, 정부지출비용은 14년약 1억 3,510 만달러( 약 1,500 억원) 에서 18년에는 1억 1,880 만달러( 약 1,320 억원) 로다소줄어들 전망 미국연방정부의클라우드관련투자가과거에비해크게증가했음에도불구하고, 전체 IT 투 자비용에서클라우드관련투자가차지하는비중은여전히낮음 미국감사원이 7 개연방정부기관의클라우드프로젝트현황을조사한결과에따르면, 최근 2년 동안주요정부기관들의클라우드도입관련프로젝트는 12년 21 개에서 14년 101개로늘어났 으며, 그에따른투자비용역시같은기간 3억 700 만달러( 약 3,410 억원) 에서 5억 2,900만달 러( 약 5,880 억원) 로확대 그러나감사원은 14년기준정부의전체 IT 운영예산대비클라우드서비스관련투자예산비 중은 2% 에불과해실제로 IT 서비스운영을위한클라우드도입이수월하게이루어지지는못하 는상황이라고언급 기관명 [ 미국 7 개정부기관의클라우드프로젝트관련투자현황 ] 클라우드 서비스도입 프로젝트수 12 년 7 월 14 년 7 월 클라우드투자비용 / 전체 IT 예산 ( 백만달러( 십억원)) IT 예산 대비 클라우드 비용비중 12년 14년 14년 국토안보부 6 11 74/5.600(81.3/6,154.9 109/5,800(119.8/6,374.7) 2% 조달청 3 21 13/537(14.2/590.2) 30/593(32.9/651.7) 5% 보건복지부 3 36 26/7.200(28.5/7,913.5) 64/7,300(73.4/8,023.4) 1% 중소기업청 1 4 0/102(0/112.1) 3/102(3.2/112.1) 3% 주정부 3 14 11/1,400(12.0/1,538.7) 32/1,400(35.1/1,538.7) 2% 재무부 3 5 165/3.400(181.3/3,736.9) 202/3,500(222.0/3,846.8) 6% 농무부 2 10 18/2,500(19.7/2,747.7) 89/2,600(97.8/2,857.6) 3% 전체 21 101 307/20,700(337.4/22.751.3) 529/21,300(581.4/23,418.3) 2% * 출처 : General Accountability Office (2014.9.25) 119
데이터인텔리전스 - 클라우드기반 SW 감사원은정부부문에서의클라우드도입이원활하게이루어지지못하는원인으로클라우드의 도입과정이복잡하다는인식때문인것으로분석 즉, 정부기관에서는클라우드를기존의 IT 운영방식과연계시킬수있는솔루션이아닌전혀새 로운대체프로젝트로인식하고있어정부기관특유의경직된문화에서쉽게받아들여지지못하 는상황 시장조사기관메리토크(MeriTalk) 가연방정부기관내 IT 관리자들을대상으로실시한설문조사 에따르면, 기존 IT 서비스의클라우드전환이매우수월할것이라는응답자는전체의 11% 수준 반면, 클라우드도입에불편함을느낀다는응답자는 32% 에달했으며, 24% 는중립적인입장 감사원의데이비드파우너(David Powner) IT 라우드도입을저해하는주된요인으로지목 관리부장은보안에대한우려도정부부문의클 메리토크의조사결과, 정부 IT 관리자들의 54% 가클라우드서비스보안을가장큰우려사항으 로꼽았으며, 클라우드서비스보안이충분히안전하다는데동의하는응답자는 20% 에불과 IDC의숀맥카씨는클라우드는비용절감측면에있어서큰이점을발휘할수있는기술이기때문에, 보안적측면을보완하고정부부문의클라우드도입을촉진시켜야한다고주장 숀맥카씨는최근미국정부가추진하고있는 연방리스크및인증관리프로그램(Federal Risk and Authorization Management Program, FedRAMP) 이정부클라우드도입의촉매도작용 할것이라고언급 해당프로그램은미국연방정부기관에도입되는클라우드제품및서비스에대한보안성평가 인증및지속적인모니터링위해도입된인증프로그램으로서정부전반에걸친클라우드보안프 로토콜을제공 현재미국정부에분산되어있는 18 개클라우드서비스에도입되어있으며, 점차도입범위가확 산될것으로예상 120
전략제품현황분석 (2) 국내업체동향 국내클라우드시장은중견기업이상이차지하는비중이높지만, 성장률도점점높아지고있는상황 중소기업시장비중및매출 [ 15 년기업규모별매출액현황및비중 ( 15 년클라우드산업실태조사) ] 구분 2014년 2015년전년대비성장률 전체 523,856 766,353 46.3% 기업규모 중견기업이상 314,300 (30.0%) 138,552 (57.2%) 39.5% 중소기업 209,556 (40.0%) 327,801 (42.8%) 56.4% * 출처 : NIPA 15년국내클라우드기업수는중소기업의클라우드시장적극진출로전년대비 36.8% ( 14년 258 개 15년 353 개, 95 개 ) 성장 국내기업은 SaaS(31.1%), IaaS(24.2%) 분야에집중하고있으며, 클라우드관련인력도약 1,900 명( 13년 3,830 명 14년 5,722 명) 정도증가 하지만, 국내클라우드기업은아직외산제품 서비스(52.5%) 를더선호하고있으며, 중견기업이 상의외산선호가더두드러짐 [ 15 년국내클라우드기업의국내외제품 서비스활용비중 ] 구분 국내제품 서비스활용률국외제품 서비스활용률 전체 47.5% 52.5% 중견기업이상 23.7% 76.3% 중소기업 48.2% 51.8% * 출처 : NIPA 클라우드이용률도 13년 3.3%(119 천개) 에서 14년 4.7%(172 천개) 로증가 중소기업보다는대기업(250 명이상, 20.9%) 의클라우드이용이높음 121
데이터인텔리전스 - 클라우드기반 SW 국내도민관의노력으로 2015 년클라우드시장규모는전년(5,239 억원) 대비 46.3% 가증가 한 7,664 억원으로성장하였으며, 국내 IT.SW 기업도클라우드시장에적극진출하여전년대 비 95개가증가한 353개가비즈니스를진행중에있으며클라우드이용기업도 2013년대비 52천개가증가하여 2014년 171 천개( 이용률 4.7%) 가클라우드를이용하고있음 특히, 클라우드이용이 ICT 기업중심에서금융( 삼성페이), 방송(YTN) 및공공( 서울시) 등다양한분 야로확대회고있어앞으로교육, 의료등다양한산업에서의클라우드이용이확대될전망임 국내일부 SaaS 기업은글로벌진출이용이한클라우드특성을고려하여, 글로벌클라우드기업으 로성장하기위하여아마존, 구글등글로벌플랫폼을활용하여중국, 일본등해외시장진출을 강화하는중이며, 일부스타트업은처음부터국내서비스가아닌글로벌서비스를목표로개발중 에있음 [ 국내클라우드산업현황 ] 구분 클라우드시장성장률 국내클라우드기업수 2014년 2015년전년대비성장률 5,239억원 7,664억원 46.3% 258개 353개 36.8% 국내클라우드이용률 119 천개(2013 년) 172 천개(2014 년) 44.5% * 출처 : 2015 년클라우드산업실태조사 ( 시장, 기업수: NIPA, 2015 년), 2015 년정보화통계집 ( 이용률: NIA, 2016 년) [ 국내클라우드도입주요사례 ] 수요처공급자서비스내용 삼성전자(2015.2 월) KT 국내최초클라우드에 fintech( 삼성페이) 적용 YTN(2013. 11 월) 더존비즈온사용자업무환경의프라이빗서비스구축, 관리 한화테크원(2015. 11 월) 이노그리드전산인프라가상화및프라이빗서비스구축, 관리 서울시(2015. 9 월) KT 공공사업인무인자전거대여반납서비스를하이브리드클라우드를통해제공 * 출처 : NIPA [ 국내클라우드기업의해외진출사례 ] 구분 인프라웨어 한글과컴퓨터 주요내용 SaaS 오피스출시 1 년(2014. 4 월) 만에가입자가 244개국에 2,600만명 ( 해외이용자 2,366 만명, 91%) SaaS 오피스출시(2015. 4 월출시) 후가입자 330만명 2016 년본격해외진출(1,000 만명가입목표) 영림원소프트랩 SaaS ERP(2015. 4 월출시) 후일본 중국진출, 2016년동남아진출예정 * 출처 : NIPA 122
전략제품 현황분석 [ 글로벌 클라우드 기업의 국내 진출 사례] 구분 아마존 주요내용 전 세계 5번째로 서울 리전(클라우드 데이터센터 거점) 발표(2016. 1월) KT(목동), SKT(일산) 데이터센터 임차 사용 IBM SK C&C와 함께 판교에 IBM 클라우드 센터 구축 발표(2015. 12월) MS SaaS 오피스 출시(2015. 5월), 국내 클라우드 데이터센터 구축(2016년 초) LGCNS(부산) 데이터센터 임차 사용 *출처 : NIPA '클라우드 컴퓨팅 법' 및 '민간 클라우드 규제개선 추진단'을 통하여 클라우드 도입을 저해하는 규제를 발굴하고 있으나, 아직 의료, 금융, 교육 등 다양한 산업에서 클라우드를 저해하는 규제 가 잔존해 있으며 이는 ICT 발전을 따라가지 못하는 기존의 규제가 국가 및 산업 전반의 경쟁 력을 저해하는 요소로 볼 수 있으므로 정부 및 민간이 협업하여 적극적으로 규제를 해소하여 클라우드를 통한 신서비스가 창출되고 업무 및 산업이 혁신될 수 있는 기반을 빨리 마련해야 함 출처 : [세계] Gatner 2015. 3월 인용, [국내] 2014년 클라우드산업실태조사, 2018년은 추정 [ 클라우드 분야별 점유율 현황 및 지향점 ] 국내 클라우드 컴퓨팅 분야를 대표하는 전문업체 가운데 하나인 이노그리드는 지난 2011년 중소기업을 위한 퍼블릭 클라우드 서비스인 클라우드잇(www.cloudit.co.kr)의 기능을 강화한 새로운 버전 개발을 추진하였으며 그 과정에서 이노그리드는 기존 하이퍼바이저의 문제점과 보 안 취약성을 해결하기 위해 공개SW인 젠(Xen)을 도입해 서비스의 안정성은 물론 신속한 장애 대응능력까지 확보할 수 있었고 또한 회사 측은 중소기업이 요구하는 다양한 서비스를 공개 SW에 기반을 두고 개발된 서비스 템플릿 형태로 제공할 수 있었음 클라우드잇 1.0은 도입 기업의 특성에 맞춰 특화된 서비스를 제공한다는 점에서 주목받았고, 사용 자가 실시간으로 모니터링하지 않아도 서버 과부하 시 자동으로 신규 서버를 생성하고 복제하는 기능을 탑재해 안심하고 사용할 수 있는 환경을 제공했음 123
데이터인텔리전스 - 클라우드기반 SW 기능적인차별화를모색하기보다는장애가발생하면이에대해신속하게대응하는데초점을맞춰 개발이진행됐고, 이를위해무엇보다아마존이아마존웹서비스를개발할때와동일하게가능한 한많은소스코드를확보하려고노력 클라우드잇 2.0 개발은안정적인서비스제공과손쉬운개발및유지보수그리고사용자편의성 향상에초점을맞춰진행되었으며이과정에서이노그리드가가장주력한부분은이전버전에서 문제가됐던하이퍼바이저에대한소스코드확보였고, 이를위해다양한하이퍼바이저관련 SW 를비교분석함 클라우드잇 2.0 은가상환경에서서버, 스토리지, DB 등과같은중소기업을위한 IT 인프라외에 도공개SW 로개발된메일, 고객관계관리(CRM), 개인용클라우드등다양한서비스를템플릿형 태를제공함 모비젠은클라우드컴퓨팅솔루션(IRIS) 은고객들이전화, 인터넷등다양한서비스를사용함으 로써발생되는 call data, log data 등방대한양의데이터를실시간으로요약처리하여데이 터베이스에저장하고, 운용자의분석을위한조회요구에빨리응답하여결과를제공하는 클 라우드컴퓨팅기반의병렬분산형 션 을제공 Hybrid(In-memory and On-disk) 고속데이터처리솔루 IRIS의각 node는 CPU, memory, storage 및전원이통합된하드웨어와소프트웨어로구성되어 개별적으로운영되며, Master Node가기동하여전체 Data Node들을제어하는구조로설계 Master Node는각 Data Node 의상태를실시간으로파악하고있으며, 데이터가입력되는즉시 각 Data Node 에데이터를분산저장함. 또한, Master Node 는사용자가쿼리를요구하면, 이를 분석한후관련데이터가포함된 에응답 Data Node를호출함으로써최단시간내에사용자의쿼리요구 영림원소프트랩은토종 ERP( 전사자원관리) 솔루션기업으로현대경영환경에서최적의사결정 을내리는데필수인 ERP 솔루션을자체개발해공급해왔으며특히클라우드시대를맞아유 연하고도입장벽을낮춘 SaaS형 ERP를개발하여제공 다년간연구개발(R&D) 로탄생한클라우드 ERP `K-시스템지니어스`는클라우드장점에따라회사 수준에맞는업무기능을골라쓰고월사용료만으로최신 이표준 ERP 시스템업그레이드도가능함 ERP를사용할수있으며별도비용없 최근일본시장진출을위해현지협력업체를발굴중이며인도네시아소재협력업체와도파트너 십을체결, 현지사업을전개하고있고베트남, 중국, 미얀마, 말레이시아, 싱가포르도진출예정 임 124
전략제품현황분석 퓨전데이타는가상화기반망분리및클라우드솔루션의개발/ 공급전문기업임 망분리는업무망과인터넷망을격리하여외부의악의적접근이나내부유출을원천차단하는보안정책으로공공기관및금융권, 일반기업등으로망분리의무화정책이확산시행되고있음동사의가상화솔루션은서버환경을논리적으로분할하여고객이원하는환경을쉽고빠르게제공하는기술로 IT 자원의최적화와망분리를위한필수소프트웨어로부각중 다우기술은그룹웨어솔루션인 다우오피스 를클라우드형태로제공함 비용절감효과가있으며 제공되는기능중다우오피스특화기능인 Works 는비용에민감한중 소기업이스스로업무용앱을만들어사용할수있다는점에서매우큰호응을얻고있음 다우오피스클라우드 는기존구축형제품과같은수준의기능을제공함. 구축형에서제공되던 모든기능을그대로쓸수있으며필수적인메일과전자결재뿐만아니라, 다우오피스만의협업특 화기능인 Works, ToDO+, 보고와주소록, 게시판, 캘린더, 커뮤니티, 설문, 근태관리등을포함 125
데이터인텔리전스 - 클라우드기반 SW 다. 기술인프라현황 클라우드컴퓨팅인프라장비 고성능서버시장은국외제품이주도하고있으며, 저성능서버는국내업체에서공급이가능하나 중국(Huawei, 인스퍼등) 의진입으로인해경쟁력이약화된상황임 고성능스토리지위주로국외제품이시장을주도하고있으며, 단계에머물고있음 국내제품은아직시장진입초기 글로벌네트워크장비업체위주의시장이형성되어있음 최근서버, 네트워크장비, 가상화 SW, 스토리지를일체화시켜통합한어플라이언스장비가출시 외산과국산제품이대체로혼용되어사용되고있긴하나, 의노력이필요한상황 국내제품의경우에너지효율개선등 클라우드컴퓨팅서비스단말 클라이언트가상화기술은국 내외산업체의솔루션이존재하고있으며국내공공기관, 스등으로일부사업화 시범서비 스마트폰, 태블릿PC, 스마트 TV 등은삼성, LG 전자등국내산업체가경쟁력을갖추고있으나 Zero, Thin 경량클라이언트는 Intel, Teradici, Pano Logic 등국외업체가원천기술확보 CPU, 핵심프로세서를제외한주요단말부품 ( 메모리, 디스플레이등) 은대부분국내산업체가 주도 클라우드컴퓨팅네트워크 스마트기기확산으로모바일네트워크 QoS 제어기술이주목받고있음 범용서버상의 Network 고속처리기술 (DPDK, SR-IOV) 을이용하여범용서버상에서네트워킹 기능을가상화한솔루션이등장하고있음 데이터센터간클라우드네트워크기술로최근 이슈로부각되고있음 SDN(Software Defined Network) 기술이주요 클라우드컴퓨팅보안 기존엔드포인트보안기술적용에서벗어나클라우드환경전용보안기술연구개발에초점을맞추고있음 126
전략제품 현황분석 클라우드 컴퓨팅 서비스 브로커 기술 검증을 위한 프로토타입 개발 및 시장 형성의 초기 단계에 있으며 클라우드 분야의 차기 성 장 동력으로 인식, 시장 형성 초기 단계임 이종 클라우드 서비스의 통합 관리 기능을 주요한 특징으로 하고 있으며 다양한 연구 결과물들이 상용 및 공개SW 기반으로 진행되고 있음 * 자료: 미래창조과학부 [ K-ICT 클라우드 컴퓨팅 활성화 계획의 비전, 전략 및 기대효과 ] 클라우드 서비스 활성화 지원 정책 국내에서는 클라우드 시장 활성화 및 글로벌 경쟁력 강화를 위해 2009년부터 다양한 정책적 노력 을 기울이고 있음. 특히 2015년 9월 클라우드 컴퓨팅법 이 시행됨에 따라 국내 클라우드 활성화 와 클라우드 기반의 국가 ICT 경쟁력 강화를 위한 법제도적 장치가 마련된 것으로 평가되고 있음 미래창조과학부는 2015년 K-ICT 클라우드 컴퓨팅 활성화 계획을 확정하고 2021년까지 클라우드 선진국 도양을 위한 2단계 계획을 수립하였음 127
데이터인텔리전스 - 클라우드기반 SW 라. 특허동향분석 (1) 연도별출원동향 클라우드기반 SW 기술의지난 7 년( 10~ 16) 간출원동향10) 을살펴보면연도별출원경향이전 체적으로 2010년도를시작하여꾸준히증가되는경향을나타내고있으며 2013년도이후조 금씩감소되는경향을보이고있지만본기술에대한연구개발이활발하게이루어지고있음 각국가별로살펴보면한국의출원경향은 2011년도까지증가하다가이후조금씩감소되는경향을 나타내고있음, 미국은 2012 년도까지급증하다가이후조금씩감소되는경향을보이고있음, 일 본은소폭큰증금폭없이점차로줄어드는경향을보이고있음 국가별출원비중을살펴보면미국이전체의 65% 로최대출원국으로클라우드기반소프트웨 어기술을리드하고있는것으로나타났으며, 한국이 18.5%, 유럽은 8.8%, 일본은 7.7% 순 으로나타남 [ 클라우드기반 SW 기술연도별출원동향 ] 10) 특허출원후 1년 6개월이경과하여야공개되는특허제도의특성상실제출원이이루어졌으나아직공개되지않은미공개데이터가존재하여 2015, 2016년데이터가적게나타나는것에대하여유의해야함 128
전략제품 현황분석 (2) 국가별 출원현황 한국의 출원현황을 살펴보면 11년까지 증가하다가 이후 조금씩 감소되는 추세로 나타나고 있 음 한국은 2010~2013년도에는 외국인 비중이 20% 미만 수준에서 점차로 비중이 줄어드는 것으로 주로 국내출원인이 대다수 비중으로 나타나고 있음 미국의 출원현황은 출원건수가 꾸준히 출원건수가 증가하다가 2013년 이후 감소된 상태로 유 지하고 있는 추세를 보이고 있는 점이 특징임 2010년도 이후 미국의 외국인 출원이 10~20% 정도로 최근까지 이러한 추세가 나타나고 있어, 타 국가에 비해 내국인 출원이 다수 이루어지고 있는 것이 특징으로 나타남 일본의 출원현황은 10년도 이후부터 소폭 증감추세를 나타내면서 유지되는 경향을 보이고 있 음, 내외국인 비중은 외국인이 40% 이상으로 외국인 출원이 높은 경향을 보이고 있는 점이 특징임, 유럽의 경우에는 소폭 증가추세를 보이고 있으며, 외국인 비중이 전체 80% 이상으로 외국인 비중이 타 국가보다 높은 것으로 나타남 [ 국가별 출원현황 ] 129
데이터인텔리전스 - 클라우드기반 SW (3) 투입기술및융합성분석 클라우드기반 SW 기술 분야의투입기술을확인하기위하여특허분류코드인 IPC Code 11) 를 통하여살펴본결과가장많은비중을차지하고있는 IPC는 G06F 분야가가장많은 1,127건 으로나타났으며, H04L이 521 건, G06Q가 280건으로 G06F분야가대다수를차지하고있음 이외에 H04N 58 건, H04W 45 건, H04M 21 건, G05B 10 건, G06K 10 건, A63F 7 건, G06N 6건등의기술이투입되어있어클라우드기반소프트웨어기술분야에다양한기술이존재하 지만, 데이터처리, 시스템기술분야에집중되고있음 더불어해당 IPC의특허인용수명을살펴보면 A63F로서기술분야의수명이 8년으로가장긴것으 로나타났으며, G06Q 기술분야는 4년으로가장짧은것으로분석 [ 클라우드기반 SW 기술분야상위투입기술 ] IPC 기술내용특허인용수명 (TCT) 12) G06F 전기에의한디지털데이터처리 6년 H04L 디지털정보의전송 6년 G06Q 관리용, 상업용, 금융용, 경영용, 감독용또는예측용으로특히적합한데이터처리시스템또는방법 ; 4 년 H04N 화상통신 7년 H04W 무선통신네트워크 4년 H04M 전화통신 7년 G05B 제어계또는조정계일반; 이와같은계의기능요소; 이와같은계또는요 소의감시또는시험장치 6 년 G06K 데이터의인식; 데이터의표시; 기록매체; 기록매체의취급 7년 A63F 카드게임, 보드게임또는룰렛게임; 작은움직이는물체를사용하는실내용게임; 그밖에분류되지않는게임 8 년 G06N 특정계산모델방식의컴퓨터시스템 4년 11) 전세계적으로통용되고있는국제특허분류(IPC: International Patent Classification) 를통해특허정보기술분야에서공지기술을조사할수있으며, 기술및권리정보에용이하게접근가능 12) 특허인용수명지수는후방인용(Backward Citation) 에기반한특허인용수명의평균, Q1, Q2( 중앙값), Q3 에대한통계값을제시함. 특히이와같이산출된 Q2는 TCT(Technology Cycle Time, 기술순환주기또는기술수명주기) 라고부름 130
전략제품 현황분석 투입기술이 가장 많은 G06F 분야와 융합이 높게 이루어진 기술은 H04L 분야로 나타났으며, G06Q, H04N 분야와도 나타 융합된 기술의 건수가 높은 것으로 분석 이외에 H04L 분야와 융합된 기술은 H04W, G06Q, H04N 분야와 융합된 기술이 많은 것으로 나타났으며, G06Q 분야와 융합된 기술은 H04W, H04N, H04B 기술로 분석됨 [ 클라우드 기반 SW 기술 분야 IPC 기술 및 융합성 ] (4) 주요출원인 분석 앞서 국가별 특허건수에서 미국이 가장 많은 특허를 출원하고 있는 것으로 나타났으며, 상위 출원인에서도 미국 출원인이 다수를 차지하고 있으며, 그 외 한국, 아일랜드 등의 출원인이 상 위 그룹에 포함되었음 주요 상위 출원인을 살펴보면 미국의 IBM, Microsoft, Oracle, Empire Technology, 한국의 삼성전자, 한국전자통신연구원, 에스케이플래닛 미국의 Google, Amazon, 아일랜드의 Accenture Global Services 등이 상위그룹을 차지하고 있음 131
데이터인텔리전스 - 클라우드기반 SW 한국출원인인삼성전자는한국, 미국, 유럽등다양한국가에해외출원을하고있는점이특징 이고, 한국전자통신연구원은한국출원이외에미국출원도활발하게하고있는것으로나타남, 다국적기업인 MIcrosoft, Oracle 등도 3극출원에대한활동이활발한것으로나타남 피인용지수에대한통계에서는 Accenture Global사가 18.86으로가장높은기술력을나타 내고있으며, Oracle, Microsoft 등도상대적으로높은수치를나타내고있음, 삼성전자도상 위그룹의피인용지수를보이고있음 주력기술분야는클라우드환경접속기술, 보안기술, 트래킹, 시뮬레이션기술등을주요연구 개발대상으로하고있는것으로나타남 [ 주요출원인의출원현황 ] 주요출원인 국가 주요 IP 시장국 ( 건수 %) 3극패밀 IP시리수 한국미국일본유럽 장국 종합 ( 건) 피인 용지 수 주력기술분야 IBM 미국 181 10 0% 95% 5% 0% 미국 0 5.83 클라우드환경데이터접속기술 Microsoft 미국 12 115 15 30 7% 67% 9% 17% 미국 65 7.67 가상저장환경접속보안기술 Oracle International Co 미국 3 66 5 7 4% 81% 6% 9% 미국 31 8.31 클라우드환경컴류터리소스관리기술 Empire Technology Development 미국 15 20 7 36% 48% 17% 0% 미국 0 1.9 리소스접속, 트래킹기술 삼성전자 한국 17 17 2 6 40% 40% 5% 14% 한국 10 13.4 모바일환경클라우드관리기술 Google 미국 1 32 1 3% 94% 0% 3% 미국 3 3.36 개발환경클라우드화기술 한국전자통신연구원 한국 24 10 71% 29% 0% 0% 한국 0 3.25 클라우드환경정보보안기술 에스케이플래닛 한국 28 100% 0% 0% 0% 한국 0 0 클라우드기반데이터접속, 전송기술 Accenture Global Services 아일랜드 17 8 0% 68% 0% 32% 미국 0 18.86 클라우드서비스모니터링기술 Amazon Technologies 미국 23 2 0% 92% 0% 8% 미국 5 4.24 클라우드환경시뮬레이션기술 132
전략제품 현황분석 (5) 국내 출원인 동향 국내 출원인 동향을 살펴보면 대기업은 에스케이플래닛, 에스케이텔레콤, 케이티, 삼성전자 등 이 상위그룹에 나타났으며, 중소기업으로는 이노그리드, 엔트릭스, 킴스정보통신, 아이리얼 등 클라우드 환경 솔루션 전문기업 등이 참여하고 있는 것으로 나타남 기업 이외의 주요출원인에서 연구소와, 대학의 출원이 활발한 것으로 나타났으며 연구소에는 한국전자통신연구원, 한국과학기술정보연구원 등이 활발한 연구를 하고 있는 것으로 판단되며, 여러 대학에서도 많은 참여를 하고 있는 것으로 나타남 [ 국내 주요출원인의 출원 현황 ] 133
데이터인텔리전스 - 클라우드기반 SW 5. 가. 중소기업환경 중소기업경쟁력 클라우드기반 SW 분야의중소기업경쟁력은기술분류별로차이가있으나클라우드기반서비스기술은중소기업이다수참여하여시장에서의역할이점차커지는분야로나타났으나, 대부분의기술은높은기술력을요구하는분야로중소기업의경쟁력이낮은것으로분석됨 [ 클라우드기반 SW 분야중소기업현황 ] 기술분류주요기술대기업중소기업중소기업참여영역중소기업참여정도 오픈인터페이스 클라우드보안기술레스트풀서비스가술 KT 퓨전데이타클라우드보안기술 클라우드기반서비스 측정, 과금, 프로비져닝자동스케일링기술고가용성기술모니터링기술부하분산및자동확장기술분산데이터관리기술병렬기술 KT 더존비즈온이노그리드다우기술 모니터링기술부하분삭자동확장기술 클라우드기반인프라 서버가상화네트워크가상화분산스토리지메시지기반미들웨어 한글과컴퓨터영림원소프트랩 LG CNS 모비젠 퓨전데이타 서버가상화기술네트워크가상화 * 중소기업참여정도와점유율은주요제품시장에참여하는중소기업의참여규모와정도( 업체수, 비율등) 를고려하여 5단계로구분 ( 낮은단계:, 중간단계(,, ) 높은단계: ) 134
전략제품현황분석 나. 중소기업기술수요 클라우드기반 SW 분야의중소기업의기술수요를파악하기위하여중소기업기술수요조사및중 소기업청 R&D 신청과제(2013~2015 년) 를분석한결과아래표의내용과같은수요들이다수있 는것으로분석 클라우드기반 SW 분야중소기업은최근에클라우드기반서비스관련된기술개발에다수수요가있는것으로나타났으며, 이는클라우드기반을통한개발기술에대한관심이높아지고있는추세를반영한것으로분석됨 [ 클라우드기반 SW 분야과제신청현황및수요조사결과 ] 전략제품기술분류관심기술 오픈인터페이스클라우드보안기술, 레스트풀기술 클라우드기반 SW 클라우드기반서비스 가상화기술, 클러스터기술, 자동화관리기술, 노드관리기술, 부하분산및자동확장기술 클라우드기반인프라 가상파일시스템개발기술, 인공지능형클라우드플랫폼구축기술, 사용자맞춤분석기술, 고속메모리기반클라우드형출력기술 135
데이터인텔리전스 - 클라우드기반 SW 다. 중소기업핵심기술 (1) 데이터기반요소기술발굴 클라우드기반 SW 기술의특허및논문데이터검색을통해도출된유효데이터를대상으로데이터마이닝기법(Scientometrics 기법) 을통해클러스터링된키워드의연관성을바탕으로요소기술후보군을도출 클라우드기반 개의요소기술후보군을도출 SW 기술의특허및논문유효데이터를기반으로키워드클러스터링을통하여 10 제품별 dataset 구축 : 클라우드기반 SW 기술관련특허/ 논문데이터를추출하여노이즈제거 후제품별 dataset 구축 1 차클러스터링 : 키워드맵을통한고빈도키워드확인- 빈도수(tf-idf) 13) 가상위 30% 에해당하 는키워드를대상으로 1차추출 2 차클러스터링 : 1차클러스터링에서추출된고빈도키워드사이에서고연관도키워드를 2차추 출 ( 고연관도기준은연관도수치14) 가 2 이상인클러스터로제한) 다음그림은키워드간연관네트워크를시각화한것으로, 간의연관도를나타내는직선으로구성 각키워드를나타내는원과키워드 각키워드가특허와논문중어느데이터에서도출되었는지원의색으로구분하였으며, 도출된클러스터는황색음영으로표시 키워드로 키워드를나타내는원은고빈도의키워드일수록원의크기가크게표현되며, 선은키워드사이의연관도수치가높을수록굵게표현 연관도를나타내는 클라우드기반 SW 기술전략제품의특허논문유효데이터에대하여키워드클러스터링결과를기반으로요소기술도출 데이터기반의요소기술도출은키워드클러스터링을통해도출된요소기술에대하여전문가의 검증및조정을통하여요소기술을도출 13) 빈도수(tf-idf) : 각키워드가출현되는특허또는논문수를의미 14) 연관도수치: 두개이상의키워드사이의특허또는논문수를의미 136
전략제품 현황분석 [ 클라우드 기반 SW 분야 키워드 클러스터링 ] [ 클라우드 기반 SW 분야 주요 키워드 및 관련문헌 ] No 클러스터 01 주요 키워드 virtual machine, server 클러스터 02 service provider, cloud storage 클러스터 03 network service, managemen t 연관도 수치 관련특허/논문 제목 6~8 1. Reducing usage of resource utilized by a virtual machine whose resource utilization is adversely affecting neighboring virtual machines 2. Shaping virtual machine communication traffic 3. Cloudbank: A secure anonymous banking cloud 4~6 1. METHOD AND SYSTEM FOR AUTOMATED IDENTIFICATION AND ENGAGEMENT OF SERVICE PROVIDERS 2. Methods and processes for storing and utilizing state information for service providers 3. Harnessing the Power of Multiple Cloud Service Providers: An Economical and SLA-Guaranteed 1. 6 METHOD TO JOINTLY SELECT CLOUD COMPUTING AND NETWORK SERVICES AND ASSOCIATED DEVICE 2. Host visibility as a network service 3. VCC-SSF: Service-oriented security framework for vehicular cloud computing 137
데이터인텔리전스 - 클라우드기반 SW No 주요키워드연관도수치관련특허/ 논문제목 클러스터 04 service request, environment 4 1. CLOUD-BASED SYSTEM FOR SERVING SERVICE REQUEST OF EMBEDDED DEVICE BY CLOUD COMPUTING AND RELATED CLOUD-BASED PROCESSING METHOD THEREOF 2. Method and system for processing a service request 3. The role of cloud forest restoration on energy security 클러스터 05 클러스터 06 클러스터 07 클러스터 08 mobile device, information software application, physical storage digital content, resource server, terminal 6 4~6 6 6~8 1. SYSTEM AND METHOD FOR REGULATING THE UPLOAD OF FILES FOR A MOBILE DEVICE 2. Backing up audio and video files across mobile devices of a user 3. Case study of vehicle parking mobile payment application: Data storage and synchronization solution 1. TAGGING PHYSICAL RESOURCES IN A CLOUD COMPUTING ENVIRONMENT 2. SYSTEMS AND METHODS FOR SECURELY PROVISIONING THE GEOGRAPHIC LOCATION OF PHYSICAL INFRASTRUCTURE ELEMENTS IN CLOUD COMPUTING ENVIRONMENTS 3. On the feasibility of (practical) commercial anonymous cloud storage 1. System for managing, storing and providing shared digital content to users in a user relationship defined group in a multi-platform environment 2. ITERATIVE CLOUD BROADCASTING RENDERING METHOD 3. Case study of vehicle parking mobile payment application: Data storage and synchronization solution 1. CLOUD-BASED MAIL SYSTEM AND MAIL SERVICE METHOD FOR PROVIDING IMPROVED SECURITY 2. Remote access to hosted virtual machines by enterprise users 3. A secure diverse ticket-sale system in a distributed cloud environment 클러스터 09 private key, social 6~8 1. System and method for securing authentication information in a networked environment 2. Method for controlling security of cloud storage 3. Anonymous service usage and payment in service-based systems 클러스터 10 inventory, distribution 4 1. PROVIDING CONTEXTUAL CONTENT BASED ON ANOTHER USER 2. CLOUD-BASED CONTENT COLLECTION AND DISTRIBUTION SYSTEM 3. Storming the cloud: A look at denial of service in the Google App Engine 138
전략제품현황분석 [ 클라우드기반 SW 분야데이터기반요소기술 ] No 요소기술명키워드 요소기술 01 클라우드보안 Security, Malware, Intrusion, Hypervisor 요소기술 02 레스트풀서비스 Restful, Web Service 요소기술03 측정, 과금, 프로비져닝 Metering, Billing, Provisioning 요소기술 04 자동스케일링 Scaling, Template, Cloud-init 요소기술 05 고가용성 Availability, Clustering 요소기술 06 모니터링 Monitoring 요소기술 07 서버가상화 Server, virtualization, Container 요소기술 08 네트워크가상화 Network, Virtualization 요소기술 09 분산스토리지 Distributed, Storage 요소기술 10 메시지기반미들웨어 Message, Middleware 139
데이터인텔리전스 - 클라우드기반 SW (2) 요소기술도출 산업시장분석, 기술( 특허) 분석, 전문가의견, 타부처로드맵, 중소기업기술수요를바탕으로로드맵기획을위하여요소기술도출 요소기술을대상으로전문가를통해기술의범위, 요소기술명확정 요소기술간중복성등을조정검토하여최종 [ 클라우드기반 SW 분야요소기술도출 ] 분류요소기술출처 클라우드보안 특허/ 논문클러스터링, 전문가추천. 오픈인터페이스 레스트풀서비스 특허/ 논문클러스터링, 전문가추천 측정, 과금, 프로비져닝 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 클라우드기반서비스 자동스케일링 고가용성 기술/ 시장분석, 기술수요, 전문가추천, 특허/ 논문클러스터링 특허/ 논문클러스터링, 전문가추천 모니터링 기술수요, 특허/ 논문클러스터링, 전문가추천 서버가상화 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 클라우드기반인프라 네트워크가상화 분산스토리지 전문가추천, 기술/ 시장분석, 특허/ 논문클러스터링 기술수요, 특허/ 논문클러스터링, 전문가추천 메시지기반미들웨어 기술수요, 특허/ 논문클러스터링 140
전략제품현황분석 (3) 핵심기술선정 확정된요소기술을대상으로산학연전문가로구성된핵심기술선정위원회를통하여중소기업 에적합한핵심기술선정 핵심기술선정은기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업적합 성(10) 을고려하여평가 [ 클라우드기반 SW 분야핵심기술 ] 분류핵심기술개요 측정, 과금, 프로비져닝 클라우드서비스의경우어떤사양의가상머신을사용하고얼마만큼의네트워크트래픽을사용했는지메터링하여과금의근거로제공하는기술 클라우드기반서비스 자동스케일링 클라우드내의특정가상머신인스턴스에트래픽이몰리는경우동일한서비스를처리하는인스턴스를추가적으로사용자의개입없이확장하여트래픽을분산하여처리하고트래픽이줄어들면동시에사용중인인스턴스의수를필요한만큼만제공하는기술 모니터링 수백내지수천대의호스트및가상머신을운용하는클라우드환경에서는각가의호스트나가상머신에대한 RRD(Round Robin Database) 를이용하여 CPU, Memory, Network I/O, Disk I/O에대한사용량등의정보를기록하여관리하여야하므로이러한정보를취합하고관리하기위한기술 서버가상화 단일물리서버를소프트웨어적으로여러개의서버처럼사용함으로서물리서버의하드웨적인성능을최대한활용하면서내부적으로여러대의가상의서버를운용함으로서다양한서비스를동시에제공할수있는편리함을제공하고특히총소유비용을절약할수있는기술 클라우드기반인프라 네트워크가상화 네트워크자원을효율적으로활용하고네트워크트래픽을물리적인장비에제한받지않고클라우드환경에적절하도록동적으로제공하는기술 메시지기반미들웨어 플랫폼을구성하는서버혹은모듈이증가하면서각각의요소간의의존성(Coupling) 을최소화하여각각의요소의변화에유연하게대응하면서데이터형식및프로토콜을통일하여각요소간의구조가통일되어더욱신속한개발이가능하도록하는기술 141
데이터인텔리전스 - 클라우드기반 SW 6. 기술로드맵기획 가. 클라우드기반 SW 기술로드맵 최종중소 중견기업기술로드맵은기술/ 시장니즈, 연차별개발계획, 최종목표등을제시함으로 써중소기업의기술개발방향성을제시 142
전략제품현황분석 나. 연구개발목표설정 로드맵기획절차는산학연전문가로구성된로드맵기획위원회를통해선정된핵심기술을대 상으로기술요구사항, 연차별개발목표, 최종목표를도출 [ 클라우드기반 SW 분야핵심기술연구목표 ] 분류핵심기술기술요구사항 연차별개발목표 1차년도 2차년도 3차년도 최종목표 측정, 과금, 프로비져닝 클라우드관리시스템기술 리소스사용량측정기술개발 리소스사용량확인및과금서비스개발 클라우드기반서비스 자동스케일링 리소스분산및부하분산기술 리소스분산기술개발 퍼시스턴트캐싱기술개발 클라우드서비스를위한자동화기술구현 모니터링 데이터관리시스템기술 모니티링데이터수집 모니터링데이터시각화기술개발 서버가상화 서버가상화기술 시스템가상화기술개발 가상화시스템관리기술개발 클라우드기반인프라 네트워크가상화 네트워크제어및관리기술 네트워크가상화제어기술개발 가상화리소스모니터링기술개발 가상화인프라기반기술구현 메시지기반미들웨어 신뢰성있는메시지전달프레임워크개발 메시지전달프로토콜개발 메시지전달제어관리기술개발 143
음성인식 SW 전략제품현황분석
음성인식 SW 정의및범위 음성인식 SW란외부에서발생된음성을텍스트와같은정보로변환하고변환된정보를이해하며반대로정보를합성음성으로변환해주는등일련의기술을통해제품이사용자의요구에따라적합한서비스를제공하고, 응용분야에서서비스목적에부합할수있도록하는시스템소프트웨어나응용프로그램 음성인식 SW 는음성인식기능과음성합성기능을포함하는음성인식기술과, 문서나음성인식된결과를입력으로받아이해하고추론하는언어처리기술, 사용자와소통하고편의성을제공해주는언어및음성인터페이스기술로분류함 음성인식 SW 는관점에따라다양하게분류할수있음, 발화자에따라화자종속방식(Speaker Dependent System), 화자독립방식(Speaker Independent System), 화자적응방식(Speaker Adaptive System) 으로구분할수있고, 발음에따라고립단어인식, 핵심어인식, 연결단어인식, 연속음성인식, 대화음성인식으로분류할수있으며인식대상어휘수에따라소용량, 중용량, 대용량인식기술로나눌수있고, 또한단어단위로인식하는단어인식기술, 음소단위로인식하는가변어인식기술로도나눌수있음 정부지원정책 2016년 3월 17일청와대에서열린지능보건사회간담회에서인공지능기술을연구하는지능정보기술연구소(AIRI, AI Research Institute) 를올상반기안에설립하고관계기술및전문인력양성, 인프라구축등에향후 5년간 1조원을투자하겠다고밝힘 엑소브레인은언어처리를위한 AI 원천기술확보를목표로지난 2013년 5월부터개발된언어처리 SW이고 ETRI 가연구주관을담당하고있음. 현재단계인 1 단계기간(2013.5~2017.2) 의정부지원금은 301억원임 2017년정부가설립할예정인 AIRI 는주식회사형태로운영되며, 참여하는각기업이 30억원씩 출자해총 180억원의자본금으로운영될예정임설립이후약 50명가량의규모를갖출것으로 예상되고미래부는 300 억원가량을연구개발지로지원할계획, AIRI에서는인공지능관련연구 개발을수행하고, 관련중소, 중견, 벤처기업및스타트업등과협력하여인공지능관련산업을 육성할계획임 제2 차과학기술전략회의(2016.8) 에서발표한인공지능을비롯한 9대국가전략프로젝트추진계획에서, AI 개발추진로드맵은 AI 요소기술개발(2017) 복합지능 AI 개발 공개(2019) 민간 공공 AI 제품 서비스확산(2022) AI 산업의글로벌경쟁력확보(2026) 를목표로책정 2016년 9 월미래부에범정부차원의 지능정보사회추진단 이조직되어인공지능(AI) 개발을비롯한 4 차산업혁명대응을지원하고있으나규모가매우작고, 이제시작에불과하여향후좀더큰조직으로재구성할필요가있고 AI의핵심기술집중개발을위한역할분담의전문연구센터설립운영이필요함 2016년 12월 15일제4차산업혁명에대응한지능정보사회중장기종합대책이마련되었고여기서지능정보기술은기계가인공지능과 ICBM(IoT, Cloud, Big Data, Mobile) 등 ICT 인프라를통해데이터를스스로학습하고인간의고차원적인인지 학습 추론능력을구현하는기술을의미함 외국과비교했을때한국은음성인식분야후발에해당하고정부의지원은미비하며정부가지원하는인공지능소프트웨어(SW) 개발사업도아직초기단계이며, 정부차원의주도적인개발추진계획의구체화와관련지원예산을늘리는등의체계적인지원대책의마련이필요함
중소기업시장대응전략 강점 (Strength) 응용서비스기술및산업환경등잘구축된인프라 언어및음성인식 SW분야의기업차원대규모투자 기회 (Opportunity) 클라우드컴퓨팅및스마트모바일기기확산에따른 정보통신패러다임의변화 복잡한기능의디지털화된기기의제어를위한음성 인식인터페이스의수요증가 약점 (Weakness) 다국어음성데이터확보및원천기술력부족에따른 기술장벽극복 세계시장대비한글음성인식수요미미 위협 (Threat) 원천기술보유외국기업이국내기업과기술제휴를 통한국내시장잠식 자체적인기술개발력을가진대기업의첨단투자집 중및시장지배력증가 중소기업의시장대응전략 주변기술에대한인프라구축등비용절감전략수립 기관에서무료나유료로제공되는대규모데이터와오픈 응용환경을고려한독자적인핵심기술과고급개발인력확보 API를적극적으로활용한기술개발 핵심기술로드맵
전략제품 현황분석 1. 개요 가. 정의 및 필요성 음성인식 SW란 외부에서 발생된 음성을 텍스트와 같은 정보로 변환하고 변환된 정보를 이해 하며, 반대로 정보를 합성음성으로 변환해주는 등 일련의 기술을 통해 제품이 사용자의 요구에 따라 적합한 서비스를 제공하고, 응용분야에서 서비스 목적에 부합할 수 있도록 하는 시스템 소프트웨어나 응용 프로그램 음성인식 SW를 음성인식기능과 음성합성기능을 포함하는 음성인식기술과, 문서나 음성인식된 결 과를 입력으로 받아 이해하고 추론하는 언어처리기술, 사용자와 소통하고 편의성을 제공해주는 언 어 및 음성 인터페이스기술로 분류함 음성인식 SW는 관점에 따라 다양하게 분류할 수 있음, 발화자에 따라 화자종속방식(Speaker Dependent System), 화자독립방식(Speaker Independent System), 화자적응방식(Speaker Adaptive System)으로 구분할 수 있고, 발음에 따라 고립단어인식, 핵심어인식, 연결단어인식, 연 속음성인식, 대화음성인식으로 분류할 수 있고 인식대상어휘 수에 따라 소용량, 중용량, 대용량 인 식기술로 나눌 수 있으며, 또 단어단위로 인식 하는 단어인식기술, 음소단위로 인식하는 가변어 인식기술로도 나눌 수 있음 음성인식 언어처리 언어 및 음성 인터페이스 [ 음성인식 SW ] 음성인식기술이란 미리 저장된 특정음성신호의 패턴들과 새롭게 입력된 음성과 비교하고 패턴 들 중 어느 것과 가장 유사한지 판단하는 일종의 패턴인식이며, 제품의 음성인식기는 응용 환 경에 따라 여러 모듈이나 단계로 구분되어 개발되어야 함 음석인식은 전처리 과정, 특징추출과정(음향모델구축), 언어모델적용의 과정을 거치며, 음향 모델은 음소나 단어 단위로 기준 패턴을 만드는 것으로, 그 방법으로 통계적 방법인 은닉 마르코프 모델 (HMM; Hidden Markov Model)이 고립 단어 인식부터 대화체 음성 인식까지 폭넓게 사용되고 있고, 그 외에 인간의 신경망을 모델링한 신경회로망(NN: Neural network), 패턴 정합방식인 DTW(Dynamic Time Warping)방법 등이 있음 149
데이터인텔리전스 - 음성인식 SW 기술의응용범위가넓지만제품의응용환경, 사용자, 언어등을고려해상이한장비와알고리즘 의사용이필요하고사용자에따른인식률차이, 주변잡음에따른인식률저하, 인식대상어휘의 제한으로인한인식오류와같은문제해결을위한지속적인기술투자가요구됨 음향모델의데이터를많이확보하는것이음성인식성능을좌우하기때문에대용량음성데이터를 저장하고실시간으로처리하기위한데이터베이스자원과모바일기술및클라우드시스템등의 주변기술인프라에대한물색이필요 음성인식기술에는음성으로정보를출력하는음성합성기술과등록된화자들중에서가장유사한 화자를찾아내는화자식별기술까지포함하고, 현재음성합성엔진기술과관련해서원천기술을가 진업체는매우드묾 * 출처 : 한국전자통신연구원 [ 음성인식- 언어처리과정 ] 언어처리기술은일상언어를형태분석, 구문분석, 의미분석등을통하여컴퓨터가처리할 수있도록변환시키는작업과처리한결과물을다시일상언어형태로변환시키는작업과관련 한기술이며현재의자연언어처리(NLP: Nature Language Processing) 방식은독자적인프로 그램을이해하기위한패턴을사용하는기회적학습에근거함 음성인식기술과비교해서언어처리기술의범위는보통타이핑된문장의이해와생성으로한정되 며, 형태소분석기술 - 구문분석기술 - 의미분석기술 - 문장생성기술로이루어져있으며, 산업분야 에서는이것을확률적알고리즘과구문적알고리즘의혼용으로구현하는추세 자동번역, HCL(Human Computer Interface), 텍스트이해, 질의응답시스템의구현등폭넓은 제품에적용가능한기술로서알고리즘의성능개선이지속적으로요구되고있고이를위해서는언 어모델을위한다량의데이터의확보와음향학, 언어학과같은인접학문의체계화가필요함 언어처리기술은앱/ 하드웨어개발자들이자체적으로개발하는데어렵고비효율적인분야이기때문 에음성인식 API 를이용할수있음, 예를들어 Wit.AI같은음성인식 API 는자동차회사, TV 채 널, 가정자동화(Home Automation) 관련기업들에게유료로제공되고있음 150
전략제품 현황분석 * 출처 : 삼성경제연구소 [ 언어처리 과정 ] 언어 및 음성 인터페이스 기술은 음성을 통해 기기 및 서비스의 이용을 제어할 수 있는 기술 이며 언어 및 음성인식 소프트웨어는 음성합성이 포함된 음성인식기술과 언어처리기술 노이즈 처리, 언어 DB, 음성DB 등 많은 분야의 기술들이 융 복합된 기술 분야를 의미함 사용자 친화형 음성언어 인터페이스 기술은 스마트 디바이스, 가전 전자 및 로봇산업 등 제조업과 인터넷 서비스 등 다양한 산업에 응용서비스로 적용이 가능한 분야이고, 개인 비서서비스 시스템, 자동번역 시스템, 대화처리 시스템, 엔터테인먼트 제어 시스템 등이 있음 Apple의 Siri와 Google의 Now 등은 음성인식 검색 분야의 대표적인 글로벌 서비스이나 국내에 서는 한국어 인식률 문제가 제기되고 있듯이 상이한 언어사용 환경을 극복한 독자적인 친화형 음 성언어 인터페이스 개발이 요구됨 언어 및 음성 인터페이스 기술의 개발은 클라이언트 측인 엠베디드기반 소어휘 내장형 음성인식 엔진 기능 개발과 서버 측의 클라우드 기반 대어휘 내장형 음성인식 엔진 기능 개발이 구분되어 이루어지고 있고, 제품의 인식할 어휘량, 인식환경, 실행속도, 구축비용 등을 고려해 임베디드 음 성인식과 클라우드 음성인식 중 하나를 제품의 기반으로 채택할 수 있음 * 출처 : 한국전자통신연구원 [ 스마트tv 환경 음성인식 인터페이스 기술의 개념도 ] 151
데이터인텔리전스 - 음성인식 SW 나. 범위 (1) 제품분류관점 음성인식 SW 는크게음성인식기술, 언어처리기술, 음성인터페이스기술로구분되고각기 술은음성과음성데이터의변환과정과변환목적에따라다양한기술로분류 음성인식기술에는전처리부분의기술, 특징추출기술, 발음변환기술, 운율제어기술, 화자식별 기술, 화자검증기술등이포함됨 언어처리기술에는형태소분석기술, 구문분석기술, 의미해석기술, 문장생성기술등이포함됨 언어및음성인터페이스기술에는자동번역기술, 음성인식학습기술, 대화형질의응답시스템기 술등이등이포함됨 [ 제품분류관점기술범위 ] 전략제품제품분류관점세부기술 음성인식기술 음성전처리, 음성분석, 음향모델링, 탐색기술, 음성이해, 음성분석, 음향모델, 패턴매칭, 대화체음성인식, 대어휘연속어인식, 고속탐색기술, 언어모델링, 다국어음성인식등 음성인식기술 음성합성기술 문서전처리기술, 문자, 발음변환기술, 운율제어기술, 음색변환기술등 화자인식기술 화자식별기술, 화자검증기술등 음성인식 SW 언어처리기술 언어분석기술 대화처리기술 형태소분석기술, 구문분석기술, 의미해석기술등 대화모델링기술, 대화이해기술, 대화생성기술등 언어및음성인터페이스기술 자동번역기술 음성인식학습기술 대화형질의응답시스템기술 입력문에대한형태소분석과구문적변환, 통계적자동번역, 딥러닝기술등 어학등대화형태로학습할수있는음성인식기반의대화형학습기술 사용자의도를이해하여복잡한의도를가진정보검색을할수있는기술 152
전략제품현황분석 (2) 공급망관점 음성인식 SW 의개발은제품분류관점에서분류외에성능향상을위한사전, 문법, 음성빅데 이터와같은데이터베이스-서버자원기술등이포함되고응용환경에따른적용기술이포함됨 음성인식기술에는전처리부분의기술, 특징추출기술, 발음변환기술, 운율제어기술, 화자식별기 술, 화자검증기술등이포함되며성능향상을위한음향모델, 잡음처리음성합성등을위한자원 저장기술이포함됨 언어처리기술에는형태소분석기술, 구문분석기술, 의미해석기술, 문장생성기술등이포함되며 성능향상을위한다양한언어모델, 사전, 문법등을위한자원저장기술이포함됨 언어및음성인터페이스기술에는음성인식기술과언어처리기술의하위기술을포함되고자동번역 기술, 음성인식학습기술, 대화형질의응답시스템기술등이포함됨 [ 공급망관점기술범위 ] 전략제품공급망관점세부기술 자원저장기술 언어모델을위한사전, 문법, 말뭉치등대규모텍스트데이터 음향모델을위한다양한환경에서발성한대규모음성데이터 잡음처리, 음성합성을위한빅데이터 음성인식기술 전처리부분의기술, 특징추출기술, 발음변환기술, 운율제어기술, 화자식별기술, 화자검증기술등 음성인식 SW 개발 언어처리기술 형태소분석기술, 구문분석기술, 의미해석기술, 문장생성기술등 언어및음성인터페이스기술 자동번역기술, 음성인식학습기술, 대화형질의응답시스템기술등 응용HW/SW 기술 스마트카, 스마트TV, 사물인터넷제품(IoT), 인터넷서비스, 개인서비스시스템, 번역프로그램등 153
데이터인텔리전스 - 음성인식 SW 2. 가. 산업환경분석 산업특징및구조 (1) 산업의특징 음성인식 SW 관련산업은소프트웨어를통해부가가치를창출하는네이버, 다음과같은인터 넷에서의응용서비스산업뿐만아니라금융전산, 제조전산과같은비즈니스의기반산업까지 포함하고있음 전문적이고원천적인기술산업이고전방산업의 SW 제품의핵심역량기술, 기반산업에서의하나의 부품, 인터넷서비스의콘텐츠로서많은수요가예상되고그점을고려한전문통계지표를수립하 고전략을세워야함 급격하게변하고있는세계 IT 환경으로인한품질경쟁구도이기때문에선진국의사례를모방하 기가힘들고, 안정적인전략보다더적극적인실험정신이요구됨 기술노하우에대한폐쇄성이강하기때문에신기술에대해단기간에기술모방이어려워개방 형혁신보다독자적연구개발을통한기술혁신이주로일어나는분야 완성품의품질향상에필요한음성인식 SW 기술과더불어전방산업에적용시최고수준의품질 을얻음과동시에그파급효과는부가가치로창출되므로원천기술확보가중요 기술의임계성능향상, 첨단화, 융복합화를통해신성장동력산업이탄생하는특징이있으므로전방 산업의고도화, 첨단화및다양화를가능하게하는산업 복잡한생산과정을패키징하여제품생산의인프라로사용될때사용자들의쉽게접근가능하고, IT 를이용해생산되는부가가치는높아짐 음성인식 SW는전문기술영역에속하기때문에다른 IT 분야와달리기업간의원가경쟁으로부터 자유롭지만고급기술인력의유출을방지하고자생력과혁신능력을상실하지않도록주의 음성인식 SW는적용되는형태에따라별도의산업으로정의할수있으나규모가작은기업의 경우주로기술납품형태의사업으로수익모델을구현하게됨 기술을응용하는사업형태에따라부가가치가다르기때문에적용되는형태에따라상이한관점 에서기술의조달과관리, 발전, 융합이다루어져야함 기술개발기간이필요하므로초기비용이많이들며전문기술인력의확보가요구되어초기팀빌딩의어려움이있기때문에사업수익성악화에민감한반면, 비콘텐츠형성과물은거래되지못하고콘텐츠가치를인정받지못하며, 기술납품위주의수익모델의경우결과물의소유권을인정받지못하는경향이있음 중소업체의독자생존을위해서는기술패키징을통한제품판매나서비스판매형태의수익모델을구현하는방향으로전환하는것과가능한능동적인제품개발전략을취하는것을고려해볼필요가있음 154
전략제품 현황분석 (2) 산업의 구조 전방산업으로서 음성인식 SW의 주요 시장은 서버 자원, 데이터베이스 자원, 인력외주 등의 핵 심역량 외의 기술시장으로 구성 전문적이고 원천적인 기술 산업으로서 장기적인 연구를 할 수 있는 고급 기술인력의 확보가 필요 하지만 전방산업에 대한 수요보다 전방선업의 공급이 적을 수 있음 음성인식 SW의 성능을 향상시키기 위해 자체적으로 대용량 데이터베이스를 구축하는 것은 어렵기 때문에 음성인식 관련 데이터를 제공해줄 기관을 잘 물색해야함, 응용환경에 적합한 대용량 데이 터베이스를 확보하지 못하면 기술개발이 어려울 수 있음 * 자료: 김수보, 대디하우스 [ IT산업 아웃소싱 구조 ] 제품개발에 있어서 업체가 전문기술업체의 위치에 있고 기술납품의 수익모델을 가지고 있다면 후방산업은 SW제품, 비즈니스 인프라, 인터넷 서비스 등 제품개발 산업과 완성된 제품을 판매 하는 유통산업으로 이루어져 있음 음성인식 SW기술은 집약산업으로 후방산업의 영향력도 매우 높은 산업으로 기술개발을 뒷받침해 줄 수 있는 예산과 소재 등의 확보가 필요 [ 음성인식 분야 산업구조 ] 전방산업 음성인식 전방산업 인력외주 핵심역량 외 기술 음성인식 자원(DB) 음성인식 기술 언어처리 기술 음성 및 언어 인터페이스 기술 SW완제품 및 it신제품 금융, 통신, 유통, 국방, 제조 등 비즈니스 인프라 인터넷서비스 155
데이터인텔리전스 - 음성인식 SW 나. 경쟁환경 세계시장에서는강력한대규모데이터처리기술을바탕으로독자적기술개발에성공한구글 과 2005년 Scansoft와합병이후 2010년 Persay( 음성인증), 2011년 Vlingo, SVOX( 자동차, 가전분야음성제어) 등경쟁기업들을차례로계열사로인수하면서 2011년연매출 14억달 러달성, 전체세계시장의약 70% 를차지하고있는미국의 Nuance가절대적인강세를보 이고있고 MS, 애플, 야후, 아마존등경쟁기업들도음성인식기업의인수 합병 구글은 2012년 6 월자체개발한음성인식서비스 ' 구글나우(Google Now)' 를공개, ' 구글나 우' 는단말이용자의음성을인식해명령을수행하는개인비서서비스의일종 2013년 8 월구글은자체개발한스마트폰 ' 모토 X(Moto X)' 를공개하면서단말기와전혀접 촉하지않고음성만으로다양한작업을실행시킬수있는 UI2)' 개념을제시 ' 터치리스컨트롤(Touchless Control) 2013년 9 월구글은 ' 터치리스컨트롤' 에이어음성검색에최적화된새로운검색엔진알고리즘 ' 허밍버드(hummingbird)' 도공개 ' 허밍버드' 검색알고리즘은복잡하고긴문장형식의질문 에보다정확한검색결과를보여주는점이특징 애플이 2011년아이폰 4S와함께선보인대화형음성인식인터페이스 Siri 가있으며, 삼성갤 럭시 S3의 S-voice와다국어음성제어지원스마트 TV, Nuance의차량용음성인식시스템인 드래곤드라이브등이최근에출시된바있음 애플은 ' 시리' 의성능을강화하기위해음성인식기술을적극적으로개발. 中미국특허청(U.S. Patent and Trademark Office, USPTO) 의자료를통해 2013년 9 월확인된 ' 지역별언어모 델링기반의음성인식 (Automatic input signalrecognition using location based language modeling)' 특허가그중하나 뉘앙스는 2012년 8 월모바일음성인식서비스플랫폼 ' 니나(Nina)' 를출시해업계의이목을 집중 ' 니나' 는뉘앙스의음성인식기술을온라인뱅킹서비스나전자상거래서비스를제공하는 사업자들의모바일애플리케이션에적용할수있도록지원 뉘앙스는자사음성인식서비스확산을위해모바일단말제조진영과의협력관계도적극적으 로구축, 뉘앙스는애플의 ' 시리', 삼성전자의음성인식서비스 'S 보이스(S Voice)' 등의기술 제휴사로참여하면서매년 10억달러이상의매출을달성 156
전략제품현황분석 앱개발사쿨텍(KulTek) 은뉘앙스의기술을이용해사용자의음성입력에항시대기하는 ' 올웨 이즈리스닝(always listening)' 기능이포함된모바일앱 ' 보쿨(Vokul)' 을개발 스페인의음성인식기술업체셰르파는모바일결제서비스사업자페이팔(PayPal) 이자사기술을이용해음성명령을통한결제기능을수행하고있으며, 자체개발한개인비서서비스앱역시메타언어데이터베이스가적용되고있다고설명 국내음성검색서비스는다음과네이버가, 한글음성인식기술은 Voiceware, HCI Lab, ETRI 가주도하고있음 국내음성검색시장은 2010년 6월다음이스마트폰용모바일음성검색서비스를최초로선보 인이후곧바로구글이인식률높은한국어버전음성검색서비스를출시하였으며, NHN도자 체개발을통해인식률을개선한검색서비스를발표하여경쟁을펼치고있음 음성인식솔루션시장은인수 합병등을통한조정기를거쳐원천기술을보유하고있는 Voiceware와 HCI Lab 그리고 ETRI가강세를보이고있음 Voiceware는 Microsoft에음성합성기를제공한데이어미국및호주등지에영어 TTS(Text To Speech) 제품을공급하는등시장을주도하고있음 HCI Lab 역시다음에음성검색솔루션을제공한데이어콜센터, 금융, 교육, 텔레매틱스분야 에서경쟁하고있음 ETRI는 IPTV 및내비게이션단말기제조사등과제휴하여연구개발한원천기술의상용화를활발히추진해왔으며현재파인디지털과제휴하여음성자동통역기를개발중임 최근에는원천기술및다국어데이터를무기로 Nuance, Vlingo, SVox 등이국내시장에진출하여국내기업솔루션및단말기제조사와제휴를추진해치열한경쟁이진행되고있음 원천기술및다국어데이터를무기로 Nuance, Vlingo, SVox 등이국내시장에진출한상황에 서브리지택및미디어젠과같은국내고객응대기업솔루션및단말기제조사들은 Nuance 나 Svox와라이센스제휴를통해음성인식기반솔루션과제품을출시하고있음 157
데이터인텔리전스 - 음성인식 SW [ 제품분류별경쟁자 ] 구분 경쟁환경 기술분류음성인식기술언어처리기술 음성및언어인터페이스기술 주요품목및 기술 음성인식 SW 음성합성 SW 언어분석 SW 대화처리 SW 자동번역 SW 대어휘자연어음성인식시스템한/ 영자동통번역시스템이슈탐지및예측시스템 해외기업 Google, Microsoft, IBM, Nuance, Apple, Systran Google, Microsoft, IBM, Nuance, Apple, Systran Google, Microsoft, IBM, Nuance, Apple, Systran 국내기업 LNI 소프트시리우스소프트솔트룩스보이스웨어디오텍 LNI 소프트시리우스소프트솔트룩스보이스웨어디오텍 LNI 소프트시리우스소프트솔트룩스미디어젠디오텍 CSLI 158
전략제품현황분석 다. 전후방산업환경 전방산업은서버자원, 데이터베이스자원, 인력외주등의핵심역량외의기술시장으로구성 음성인식 SW의성능개선을위한대규모데이터를제공할때기술적한계로인해상대적으로후 방에있는산업의연구개발이더디고, 응용환경에따라다른 DB를구축해야하는번거로움을감 수한다면데이터의재사용성에의해수익이보장됨 음성인식 SW와같은전문기술분야는인력품귀현상이일어날수밖에없고전방산업중인력조달 관련분야에서는소규모의수익구조밖에생길수없음 [ SW 노임단가(2016) ] 구분 2016 년 조사인원 평균임금 (M/D) 2015년 2016년 평균임금 (M/M) 평균임금 (M/H) 기술사 328 411,642 437,227 9,181,767 54,653 특급기술자 17,983 373,593 381,502 8,011,542 47,688 고급기술자 10,285 276,160 284,440 5,973,240 35,555 중급기술자 10,871 221,375 226,537 4,757,277 28,317 초급기술자 13,270 190,787 190,790 4,006,590 23,849 고급기능사 162 177,337 187,093 3,928,953 23,387 중급기능사 311 141,168 147,483 3,097,143 18,435 초급기능사 232 118,732 119,232 2,503,872 14,904 자료입력원 148 112,570 117,078 2,458,638 14,635 * 출처 : 2016 한국소프트웨어산업협회 후방산업은 SW 제품, 비즈니스인프라, 인터넷서비스등제품개발산업과완성된제품을판매 하는유통산업으로이루어져있음 후방산업은기술의개발과성능개선에영향을많이받고기술개발의한계에의해수요에비해공 급이부족한상황임 임베디드기반음성인식 SW제품의경우제품개발은시스템개발 - 모듈개발 공급과같이인프 라화된과정을거치면서이루어지고대부분의비용지출은 [ 임베디드 SW 외부비용 2010 ] SW개발의뢰및구매비용임 ( 단위: 개, %) 구분 사례수 임베디드 SW 임베디드 SW 라이센스구매개발용역발주단품구매 합계 125 54.2 29.5 16.3 유무선통신 56 55.8 30.6 13.5 정보/ 가전기기 20 50.0 14.4 35.6 자동차 12 60.0 40.0 0.0 산업자동화 19 43.6 39.5 16.8 사무자동화 6 45.0 25.0 30.0 국방/ 항공/ 우주 6 48.0 42.0 10.0 의료장비 3 86.7 6.7 6.7 건설 2 - - - 조선/ 해양 1 100.0 0.0 0.0 * 출처 : 임베디드 SW산업협의회 159
데이터인텔리전스 - 음성인식 SW 3. 가. 시장환경분석 세계시장 음성인식기술이응용되는대표적인시장으로는크게 Enterprise 시장(Health care, Telematics, Call Center, Smart Homes, Assistive Technology 등의제품) Telecommunication시장 (Google Voice 등의보이스다이얼제품및음성명령제품), Voice Portal 시장(Google Voice Search, Nuance Search 등의음성검색제품) 을들수있음. 시장규모는 Enterprise시 장이압도적으로높으나, 제품군으로는 Telematics, Smart Homes, Telecommunication, Voice Portal 제품과같이직접재가가장높음 최근음성인식기술시장의급성장은클라우드컴퓨팅환경과모바일산업의확산을배경으로함. 미래에예상되는시장의성장은음성인식기술과빅데이터의결합에근거할것으로추정됨 음성인식기술전분야에서 Nuance사의세계시장점유율은약 70% 로파악되나클라우드컴 퓨팅기반으로변화하는흐름에대응이늦었다는점과그에따라 Google과 Apple 등경쟁사 의 OS환경에적합한자체적인 SW 개발의적용을허용함으로, 현재는주요기업의치열한경쟁 구도가만들어짐 160
전략제품현황분석 Google의안드로이드OS 를통한모바일데이터, 검색서비스를통한웹데이터, 구글플러스를 통한웹이용자패턴분석등방대한데이터기반은음성인식에필요한데이터기반에서절대 적우위를차지하고있음을의미함 MS는 PC의 OS 에서의우위성을바탕으로데이터를수집, 분석하여개선된음성인식기술을 쉽게보급할수있음. 이를위해링크드인(Linked in) 을인수하였고수집된데이터를코타나에 적용하고추후윈도10에적용할계획임 직접재시장에서의점유는상이한데이터환경에서개발되는다른음성인식 SW간에데이터 교환이불가능하다는점을고려한다면, 음성인식기술이적용되는시장에서의우위가연관된시 장에서의우위를동반할것으로보임 [ 음성인식 SW 의세계시장규모및전망 ] ( 단위 : 백만달러, %) 구분 15 16 17 18 19 20 CAGR ('13~'15) 세계시장 83,800 97,400 113,200 127,684 147,542 170,489 16.3% * 자료: Global virtualization Security Management Solutions (2010-2014. Technavio), SW 산업연간보고서 (2014), 음성인식시장보고서등의자료를참고하여전망치추정 161
데이터인텔리전스 - 음성인식 SW 나. 국내시장 국내시장의경우세계시장보다더욱빠른증가세를보이며, 추후에도세계시장의평균성장률을웃돌것으로예상. 이는기존의음성인식기술이빠르게보급될수있는기반산업의발달과그에따른비교적비탄력적수요에서기인한것으로보임 높은부가가치와다양한활용분야, 광범위한파급효과로이동통신사, 가전제품제조사, 건설사 등의기업을중심으로개발, 제공이이루어지고있음. 삼성전자의스마트냉장고, LG전자의스 마트홈서비스허브등 [ 음성인식 SW 의국내시장규모및전망 ] 구분 15 16 17 18 19 20 ( 단위 : 억원, %) CAGR ('13~'15) 국내시장 6,274 6,967 7,737 8,593 8,813 9,039 9.8% * 자료: Global virtualization Security Management Solutions (2010-2014. Technavio), SW 산업연간보고서 (2014), 음성인식시장보고서등의자료를참고하여전망치추정 국내대기업들의음성인식원천기술비용으로 Nuance사에지불하는비용은 1,000억원이상이 라는점, 해당기술도한국어인식에는일부부적합하다는점, 사생활침해가능성에대한제 도적인미비등은음성인식서비스의질적향상에장애요인임 스마트홈서비스대중화를위해서는기본적인고객유치및인프라확보외에도특수소비자 집단맞춤형킬러서비스제공이필수적으로요구됨 기존의음성인식시장에서의우위를점하고있는세계기업의기술이한국어에적용되기에쉽지않다는점에서한국어에맞는데이터분석과적용된음성인식의개발은국내시장에서독점성을가질수있을것으로예상됨 162
전략제품 현황분석 4. 기술환경분석 가. 기술개발 트렌드 깊은신경망(DNN : Deep Neural Natwork) 음성인식기술 분야에서는 전체 Network 최적화를 통해 속도, 성능을 향상시킨 WFST(weighted Finite State Transducer) 기술과 컴퓨팅 파워의 향상에 기반한 DNN 기술이 가장 주목받고 있음 최근의 깊은 신경망(이하 DNN)을 이용한 기법들이 몇몇 음성 인식 성능 측정에서 기존의 GMM-HMM 기반 기법에 비해서 향상된 성능이 보고되어, 많은 연구가 이루어지고 있는 추세임 DNN은 알고리즘, 데이터, 하드웨어 인프라로 구성되며 관련 알고리즘은 오픈소스로 많이 공개 되 었고 데이터의 양이 많을수록 성능이 증가함 대규모 데이터, 전문개발 인력, 비용충당이 뒷받침되어야하기 때문에 작은 규모의 기업이 시도하기 어려운 분야이고 핵심역량이 아닌 부분은 다른 기업과의 협업이 요구됨 * 자료: Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups." Hinton, Geoffrey, et al. Signal Processing Magazine, IEEE 29.6 (2012): 82-97 [ DNN기반 Architecture ] 163
데이터인텔리전스 - 음성인식 SW 빅데이터처리 & 클라우드기반서비스 H/W 의발전과더불어대용량의데이터를처리하는외부기술의발전으로대용량의데이터를 빠르게처리할수있는능력이기술발전속도를더함 방대한양의음성데이터수집은음향학적정보뿐만아니라이데이터의전사로부터다양한분야의텍스트자료수집을가능하게하며, 음성인식성능을개선하는데활용될수있음 클라우드서비스를통해사용자가지정한다양한 IT 자원( 소프트웨어, 스토리지, 서버, 네트워 크등) 을가상화기술을통해사용할수있는환경을제공함 사용자에따라일관적이지않은인식률차이, 주변잡음에따른인식률저하와같은문제해결을 위해많은사용자의로그데이터를확보하거나빅데이터의활용을통한음향학적지식및언어학 적지식의체계화에대한기술투자가요구됨 클라우드서비스는개인정보의유출, 무선인터넷의불안정화로인한서비스이용불안정등이많 은문제점으로나타나는단점이있고, 코어알고리즘에 보안이나견고성이문제가되는응용환경에서는음성인식 GPU를합성시킨임베디드음성인식기술개발이대안이될수있음 * 자료: 한국전자통신연구원 [ 클라우드환경의홈네트워크구조 ] 고객친화적인서비스 음성인식기술은과거 Command/Action 중심의기술에서향후대화/ 의미분석등의지능형정보 처리기술과융합하여고객친화적인서비스를제공하는방향으로발전했으며, 대표적인예로자 유발화형음성대화처리기술과자동통역기술이있음 자동통역기술은어떤언어 A 로된사람의발화를음성인식, 자동번역등의과정을거쳐서다른언 어 B 로변환해텍스트나음성으로출려해주는기술이고, 이를자막으로출력하거나혹은음성합성 후스피커를통해들려주는과정및기술을의미함 164
전략제품 현황분석 자동 자유발화형 음성대화처리 기술이란 인간과 컴퓨터 간의 단순한 패턴이나 시나리오 형태의 고 정된 대화를 벗어나, 사용자의 자연스러운 자유발화를 듣고 의도를 파악하여 주제와 문맥에 맞는 자연스러운 대화를 가능하게 하는 음성대화처리 원천기술임 * 자료: 한국전자통신연구원 [ 자유발화형 음성대화처리 핵심기술 개념도 ] 다국어 처리 및 실시간 통역 기술 경쟁 치열 Google, 시스트란인터내셔널, Nuance, MS 등 글로벌 기업, 일본의 NTT를 중심으로 규칙 기 반 또는 통계 기반 방식의 자동번역 기술을 적용한 다국어 솔루션 확보 경쟁이 치열함 Google은 통계기반 자동번역 기술에 기반하여 다양한 다국어 자동번역 기술을 보유하고 있으며, 한국어를 포함한 90개 국어 이상의 다국어에 대한 자동통번역 서비스를 실시함 Google translator API를 이용하여 채팅 자동번역, OCR 자동번역 등의 다양한 스마트폰 앱 출현 Systran International은 규칙 기반 자동번역 기술을 기반으로 한중일영 자동통번역 및 130여 언 어의 다국어 문서 자동번역 솔루션을 확보함 한컴에서는 시스트란의 다국어 자동번역 기술을 자사의 한컴오피스에 도입하여 오피스 제품군의 글로벌화를 추진하고 있음 최근 자동통역 전화, 국제회의 강연 통역 등 연속 자유발화에 대한 실시간 동시통역 서비스 필요성 이 커지면서 MS, Google 등 글로벌 기업을 중심으로 언어 장벽을 허무는 실시간 동시통역 원천 기술 개발 경쟁이 시작됨 MS는 중국에서 영중 강연 통역 파일럿시스템을 선보였으며, Skype를 인수하고 2015년 영어와 스페인어, 이탈리아어, 중국어 실시간 화상 자동통역 시범서비스를 시작함 165
데이터인텔리전스 - 음성인식 SW 나. 주요업체별기술개발동향 (1) 해외업체동향 2013년기준 EuroMatrix는모든유럽언어에대한고성능자동번역을목표로하는다국적프 로젝트로서, 현재까지각언어별평균약 3 천~4천단어로이루어진총4억단어규모의방대한 병렬말뭉치를구축하고있음, EuroMatrix는기본적으로통계및규칙기반자동번역방법을 결합한하이브리드방식(hybrid method) 을채택하고있으며, 아직까지규모면에서구글에미 치지는못하지만병렬말뭉치의규모화를통해지속적으로번역성능을높여가고있는중임 Apple의 Siri 이후에, 스마트폰환경에서의대화형개인비서가기업기술력을나타내는필수적 인요소가되어, Google Now, Microsoft의 Cortana, 삼성의 S 보이스등이출시되었음. 이 들대화형개인비서시스템은태스크기반음성대화시스템과챗봇시스템, 질의응답시스템, 웹검색시스템등이교묘하게결합하여각시스템기술의한계및서비스범위를상호보완하는 형태로구성되어있음, Apple, Microsoft, Nuance 등에서개발된음성대화인터페이스기술은 Ford, Benz, Honda, BMW 등차량에적용하여눈과손이차량운전으로자유롭지못한상태 에서의경로탐색등의다양한서비스를제공함 2014년 5월에마이크로소프트가무료인터넷화상전화서비스인 Skype의통화를동시통역하 여제공하는 Skype Translator 를발표, CEO인 SatyaNadella 는음성인식, 자동번역, 음성합 성이통합된자동통역시스템에 DNN 기술을적용하였다고밝힘. 페이스북은 2013년에모바 일자동통역앱인지비고(Jibbigo) 의개발사인 Mobile Technologies를인수하였고페이스북은 DeepMind 를인수하기위해구글과경쟁하기도함 정보검색 / 질의응답 구글과 NHN 등의정보검색서비스기업은기존의웹기반검색과광고기반수익모델의한계를 극복하기위해모바일검색과구글 NOW와같은추천서비스를강화하고있음 모바일검색은네이버와같이전통적인웹기반검색을모바일로확장하는형태와구글, 페이스북, 다음카카오와같이모바일특화된검색서비스신규출시하는형태로발전중 구글의시리와나우서비스에이어마이크로소프트의코타나출시를기점으로가상비서서비스 시장의경쟁이가속되고있으며음성인식, 이미지인식의성능이크게향상되며서비스만족도가 크게향상됨 질의응답시스템은금융, 보험, 의료산업쪽에서활용되기시작했으며, 향후의사결정지원시스템 과같은형태로발전될것으로예상됨 AT&T는 2014 년콜센터에음성인식기술을적용하여실시간속기록 고객감정파악 KT DS는 2016년콜센터음성인식솔루션시장진출함 166
전략제품현황분석 언어분석/ 변환 언어분석및변환기술은음성인식, 문자인식, 웨어러블인터페이스기술과결합하여스마트폰기 반의음성통역, 화상실시간통역, 문자인식/ 증강현실번역, 웨어러블통역등다양한제품이시 장에출시되고있음 자동통번역적용분야가국방, 의료, 법률등특수목적에서이제는기업및일상생활까지확산추세 에있으며관련시장도크게성장할것으로전망 음성통역을포함한자동통번역시장은단말형통역기및자동통역 B2B 솔루션등에서신규창출 될것으로전망됨 언어분석, 자동번역등을사용할수있는자연어처리오픈 API 가공개되고있으며, 기존의자동통 번역외에다국어지원빅데이터분석, 다국어지원, 위치기반서비스, 디지털사이니지, 지능형 개인비서서비스등다양한서비스에서활용되고있음 대화처리 대화처리기술은언어이해를기반으로하는언어및음성인식소프트웨어와실감형인터랙션의대 화처리분야에도활용이되며또한지능형로봇의대화처리분야에도활용이가능함 실감형인터랙션분야의세계시장은연 9.4% 로증가할것으로예상되고국내시장은연 10% 로 증가할것으로예상이됨. 실감인터랙션분야는언어및음성인식 SW 분야의약 33% 정도를 차지함 미국에서 ' 구글보이스' 의음성인식기능은이미광범위하게활용되고있음. 이지역소비자들은 여전히음성사서함(Voice Mail) 을활발히사용하고있는데, 여기에음성인식기능이적용되고있 으며 ' 구글보이스' 의음성- 문자전환(Voice to Text) 기능을활용해음성사서함을직접확인하기보 다문자로변환된내용을간편하게확인함 아마존의에코(Echo) 와알렉사(Alexa) 아마존의 ' 에코' 는음성인식기술과스피커를결합해스포티파이(Spotify), 판도라(Pandora) 등을 통해음악을들려주고, 오디오북을들려줄뿐만아니라, 뉴스나교통상황이나날씨, 스포츠뉴스 등을사용자에게알려주며위모(WeMo), 필립스휴(Philips Hue), 삼성스마트씽즈(Samsung SmartThings), 네스트(Nest) 등과연계된서비스를제공함 ' 에코' 는아직완성도높은가상비서수준에도달하지는못했지만, 최소한라디오의대체재로는충 분한것으로보임. 현재아마존에서는 ' 아마존에코(Amazon Echo)' 와 ' 아마존탭(Amazon Tap)', ' 에코닷(Echo Dot)' 의세가지제품을판매하고있음 167
데이터인텔리전스 - 음성인식 SW * 자료: Amazon.com [ 아마존의 Alexa ] 구글, 안드로이드+ 검색파워앞세워맹추격 구글, 애플, 마이크로소프트(MS) 같은글로벌기업들은경쟁적으로이시장을추적하고있음 구글은아마존이갖지못한두가지장점을보유, 바로검색과안드로이드임 제로 UI 시대가되면 잘찾아주는기술 이더중요해것으로구글이 20년가까이축적한검색 기술은엄청난장점으로작용할수있음 * 자료: Google [ 구글 Assistant ] 168
전략제품현황분석 (2) 국내업체동향 국내의음성대화처리기술연구는 ETRI, 포항공대, 서강대, KT 등을중심으로활발히연구가 진행중이고 ETRI 는자연어음성인식기술, 기계학습및패턴기반의하이브리드대화이해기 술, 다양한태스크처리에적합한계층적태스크기반대화관리모델을개발함 파인디지털에서 ETRI의음성대화처리기술을차량용정보서비스에적용하여 2014년부터국내 최초의대화형음성인식내비게이션 Fine Voice를상용화함 또한, ETRI에서는음성대화처리기술을영어교육에적용하여고정형대화상황에서의문법오 류교정과학습자대답적합성을가르쳐주는음성대화형영어학습서비스인지니튜터를개발하 였고, 2015 년에청담러닝, imbc, 동아출판등 6개수요업체에서시범서비스를진행했음 한글과컴퓨터와한국전자통신연구원이합작한한컴인터프리가서비스하는지니톡은 2012년 10 월에대국민한/ 영자동통역시범서비스가실시되었고 2013년 5 월에는한/ 일자동통역시 범서비스를한국과일본에동시에실시함, 또한 2013년 12 월에한/ 중자동통역을추가함. 지 니톡의다운로드수는최초서비스실시후 7일만에 72 만을넘었고, 2012년 12월에 100만 을기록했고 2014년 5월현재 180 만건의다운로드를기록함. 하루평균 15만건의데이터 가누적되고있고, 하루 3만명이상사용하는것으로추정됨 국내의자동번역분야글로벌기업인시스트란인터내셔널에서는제품출시행사를통해다국어 자동번역오픈 API 를공개함(2015.11) 국내업체인아카스터디가개발한 ' 뮤지오(Musio)' 는인공지능엔진 ' 뮤즈(Muse)' 를통해기존 의대화내용을반영한새로운커뮤니케이션을시도하고있음. 이를통해특히영어교육에특 화된기능을제공할계획임 169
데이터인텔리전스 - 음성인식 SW 국내업체인아카스터디가개발한 ' 뮤지오(Musio)' 는인공지능엔진 ' 뮤즈(Muse)' 를통해기존 의대화내용을반영한새로운커뮤니케이션을시도하고있음. 이를통해특히영어교육에특 화된기능을제공할계획임 SK 텔레콤음성인식기반인공지능서비스 누구(NUGU) 와전용기기를공개하고, 고객 외부개 발자와인공지능플랫폼서비스를함께만들어가겠다는진화계획을발표함 최근글로벌 ICT 기업들은미래성장을위해인공지능기술개발과상용화에주력하고있음. SK 텔레콤역시인공지능기술기반의서비스융합시대에대비해 누구 를출시하게됐다는것 누구(NUGU) 는이용자의대화맥락을이해하는인공지능플랫폼과음성입출력이가능한전용스 마트기기로구성됨 이용자가원하는바를파악한후음악스트리밍서비스 스마트홈등과연동 조명, 제습기, 플러 그, TV 등가전기기제어 음악추천및자동재생 날씨, 일정등정보안내 스마트폰위치 찾기등다양한정보와편의를제공 클라우드기반소프트웨어와인공지능플랫폼의업그레이드만으로새로운기능을추가할수있어, 빠르고다양하게변하는이용자의요구사항을단시간내반영할수있는확장성에서도강점을지니고있음 170
전략제품현황분석 다. 기술인프라현황 (1) 국내사례 정부지원정책 2016년 3월 17일청와대에서열린지능보건사회간담회에서인공지능기술을연구하는지능정보 기술연구소(AIRI, AI Research Institute) 를올상반기안에설립하고, 관계기술및전문인력양 성, 인프라구축등에향후 5년간 1조원을투자하겠다고밝힘 엑소브레인은언어처리를위한 AI 원천기술확보를목표로지난 2013년 5월부터개발된언어처 리SW이고 ETRI 가연구주관을담당하고있음. 현재단계인 1 단계기간(2013.5 ~2017.2) 의정부 지원금은 301억원에달함 2017년정부가설립할예정인 AIRI 는주식회사형태로운영되며, 참여하는각기업이 30억원씩 출자해총 180억원의자본금으로운영될예정임설립이후약 50명가량의규모를갖출것으로 예상되고미래부는 300 억원가량을연구개발지로지원할계획, AIRI에서는인공지능관련연구 개발을수행하고, 관련중소, 중견, 벤처기업및스타트업등과협력하여인공지능관련산업을육 성할계획임 제2 차과학기술전략회의(2016.8) 에서발표한인공지능을비롯한 9대국가전략프로젝트추진계획 에서, AI 개발추진로드맵은 AI 요소기술개발(2017) 복합지능 AI 개발 공개(2019) 민간 공 공 AI 제품 서비스확산(2022) AI 산업의글로벌경쟁력확보(2026) 를목표로책정 2016년 9 월미래부에범정부차원의 지능정보사회추진단 이조직되어인공지능(AI) 개발을비롯 한 4 차산업혁명대응을지원하고있으나규모가매우작고, 이제시작에불과하여향후좀더큰 조직으로재구성할필요가있고 운영이필요함 AI의핵심기술집중개발을위한역할분담의전문연구센터설립 2016년 12월 15일제4차산업혁명에대응한지능정보사회중장기종합대책이마련되었고여기 서지능정보기술은기계가인공지능과 ICBM(IoT, Cloud, Big Data, Mobile) 등 ICT 인프라를 통해데이터를스스로학습하고인간의고차원적인인지 학습 추론능력을구현하는기술을의미함 외국과비교했을때한국은음성인식분야후발에해당하고정부의지원은미비하며정부가지원하 는인공지능소프트웨어(SW) 개발사업도아직초기단계임, 정부차원의주도적인개발추진계획 의구체화와관련지원예산을늘리는등의체계적인지원대책의마련이필요함 ETRI 의음성/ 언어정보연구센터와원광대학교의음성정보기술산업지원센터에서음성데이터베 이스를구축해서학계및산업계등에배포하고있음 음성기술의기반이되는음성데이터베이스는지식정보화사업의일환으로실제서비스환경을고 려하여추가구축이진행되어왔기때문에그동안국내의음성학계및업계에서누적되어온음 성데이터베이스의수요가어느정도해소될것으로예상 이번 DB 배포는지난 2011년부터 2016년까지미래창조과학부가 NIA( 한국정보화진흥원) 을통해 추진하는국가DB 사업중하나인 스마트모바일용다국어언어음성DB 구축사업의일환으로진행 2016년기준 ETRI가배포하는 DB 는 독일어, 러시아어, 아랍어, 베트남어대화체음성DB 한 국어- 독일어, 한국어- 러시아어, 한국어- 아랍어, 한국어-베트남어대화체대역문장DB 등 8종의언어 음성 DB 171
데이터인텔리전스 - 음성인식 SW * 자료: 한국전자통신연구원 [ 배포용 DB 홍보 ] 배포용 DB 구성 구어체문장의영역 : 여행, 관광, 어학등 한/ 독일어병렬말뭉치용구어체 5만문장 한/ 러시아어병렬말뭉치용구어체 5만문장 한/ 아랍어병렬말뭉치용구어체 5만문장 한/ 베트남어병렬말뭉치용구어체 5만문장 독일어대화체음성 DB 600 명분 (2 개로나누어각각배포) 러시아어대화체음성 DB 600 명분 (2 개로나누어각각배포) 아랍어대화체음성 DB 600 명분 (2 개로나누어각각배포) 베트남어대화체음성 DB 600 명분 (2 개로나누어각각배포) [ 배포용 DB 구성] 구축년도원시자료명원시자료주요내용 자료형태 파일형식 수량 2004 개체명사전 DB 정보검색을위한개체명사전텍스트 ASCII 250만엔트리 2005 질문대화말뭉치질의응답용질문대화말뭉치텍스트 ASCII 100만엔트리 5,000 대화셋 2005 구문구조부착말뭉치 품사및구문정보를포함한말뭉치텍스트 ASCII 10만문장 2004~ 2005 연어대역패턴 DB 한영자동번역용연어대역패턴텍스트 ASCII 280만패턴 172
전략제품현황분석 2004 특허문서전문용어 DB 한영특허문서자동번역용전문용어 DB 텍스트 ASCII 220만엔트리 2004~ 2005 원거리/ 다채널음성인식단어/ 문장 DB 지능형로봇용음성인터페이스개발용원거리/ 다채널음성인식단어/ 문장 DB 음성 binary 200시간 2005 Lombard 모델용음성인식단어/ 문장 DB 지능형로봇용음성인터페이스개발용 Lombard 효과음성인식단어/ 문장 DB 음성 binary 80시간 2005 핵심어검출용음성인식문장 DB 지능형로봇용음성인터페이스개발용핵심어검출용음성인식문장 DB 음성 binary 120시간 2004~ 2005 자동차환경에서의음성명령어및정보검색용대화체문장 DB 텔레매틱스음성인터페이스개발용자동차환경에서의음성명령어및정보검색용대화체문장 DB 음성 binary 200시간 2005 양태가풍부한대화체음성합성 DB 지능형로봇, 텔레매틱스음성인터페이스개발용양태가풍부한대화체음성합성 DB 음성 binary 60시간 2005 멀티모달환경에서의음성명령어및정보검색용대화체문장 DB 지능형로봇음성인터페이스개발용멀티모달환경에서의음성명령어및정보검색용대화체문장 DB 음성/ 영상 binary 80시간 2006 다국어대역사전중한대역사전텍스트 ASCII 22만엔트리 2006 특허전문용어사전영한전문용어사전확장텍스트 ASCII 165만엔트리 2006 영어( 미국)/ 중국어/ 일본어다채널및자동차환경음성인식용단어/ 문장음성 DB 지능형로봇, 텔레매틱스음성인터페이스개발용영어/ 중국어/ 일본어다채널및자동차환경음성인식용단어/ 문장음성 DB 음성 binary 27만발화 2006 한국어감정표현음성합성용대화체문장음성 DB 한국어감정표현음성합성용대화체문장음성 DB 음성 binary 60 시간 2006 한국어대화체텍스트 DB 한국어대화체텍스트 DB 텍스트 ASCII 100만문장 영어 / 일본어/ 2007 중국어다채널및자동차환경음성인식용단어/ 문장음성 DB 텔레매틱스음성인터페이스개발용자동차환경영어/ 중국어/ 일본어다채널단어/ 문장음성인식용 DB 음성 binary 15만발화 173
데이터인텔리전스 - 음성인식 SW 2007 대화음성및태깅코퍼스 대화체음성및대화정보태깅코퍼스 DB 음성/ 텍스트 binary/a SCII 2 만발화/2천대화 2007 영/ 한한/ 영과학기술분야전문용어사전 과학기술분야전문용어사전확장텍스트 ASCII 96만엔트리 2011 2011 2011 2011 구어체한국어말뭉치 구어체한/ 영병렬말뭉치 구어체한/ 중병렬말뭉치 구어체한/ 일병렬말뭉치 일반인작성구어체한국어대화말뭉치텍스트 XML A4 3,500면 일반인작성구어체한/ 영대화병렬말뭉치텍스트 XML A4 3,500면 일반인작성구어체한/ 중대화병렬말뭉치텍스트 XML A4 3,500면 일반인작성구어체한/ 일대화병렬말뭉치텍스트 XML A4 3,500면 2011 한국어대화체음성 DB 표준어사용자대상한국어음성 DB 음성 binary 5,810분 2011 영어대화체음성 DB 미국현지구축영어대화체음성 DB 음성 binary 5,810분 2011 중국어대화체음성 DB 중국어북경표준어사용자대상대화체음성 DB 음성 binary 5,810분 2011 일본어대화체음성 DB 일본표준어사용자대상현지구축음성 binary 5,810분 2013 2013 일본어대화체음성 DB 중국어대화체음성 DB 일본표준어사용자대상현지구축음성 binary 5,810분 중국어북경표준어사용자대상현지구축음성 binary 6,640분 2013 스페인어대화체음성 DB - 1 스페인표준어사용자대상현지구축음성 binary 5,810분 2013 2013 스페인어대화체음성 DB - 2 구어체한/ 스병렬말뭉치 - 1 스페인표준어사용자대상현지구축음성 binary 5,810분 구어체한/ 스대화병렬말뭉치텍스트 excel A4 3,500면 2013 2014 2014 2014 구어체한/ 스병렬말뭉치 - 2 남미스페인어대화체음성 DB 프랑스어대화체음성 DB - 1 프랑스어대화체음성 DB - 2 구어체한/ 프랑스 2014 병렬말뭉치 * 자료: 한국전자통신연구원 구어체한/ 스대화병렬말뭉치텍스트 excel A4 3,500면 남미스페인표준어사용자대상현지구축음성 binary 6,640분 프랑스표준어사용자대상현지구축음성 binary 6,640분 프랑스표준어사용자대상현지구축음성 binary 6,640분 구어체한/ 프랑스병렬말뭉치텍스트 excel A4 3,500면 174
전략제품 현황분석 라. 특허동향 분석 (1) 연도별 출원동향 음성인식 SW 기술의 지난 7년( 10~ 16)간 출원동향15)을 살펴보면 연도별 출원경향이 전체적 으로 2010년도를 시작하여 꾸준히 증가되는 경향을 보이다가 2013년도 이후 조금씩 감소되 는 경향을 보이고 있음 각 국가별로 살펴보면 한국의 출원경향은 2011년도까지 증가하다가 이후 조금씩 감소되는 경향을 나타내고 있음, 미국은 2012년도까지 급증하다가 이후 조금씩 감소되는 경향을 보이고 있음, 일 본은 소폭 큰 증금폭 없이 점차로 줄어드는 경향을 보이고 있음 국가별 출원비중을 살펴보면 미국이 전체의 41.4%로 최대 출원국으로 언어 및 음성인식 소프 트웨어 기술을 리드하고 있는 것으로 나타났으며, 일본이 29.7%, 한국은 22.6%, 유럽은 6.3% 순으로 나타남 [ 음성인식 SW 기술 연도별 출원동향 ] 15) 특허출원 후 1년 6개월이 경과하여야 공개되는 특허제도의 특성상 실제 출원이 이루어졌으나 아직 공개되지 않은 미공개데이터가 존재하여 2015, 2016년 데이터가 적게 나타나는 것에 대하여 유의해야 함 175
데이터인텔리전스 - 음성인식 SW (2) 국가별출원현황 한국의출원현황을살펴보면 12까지증가하다가이후조금씩감소되는추세로나타나고있음 한국은 2010~2013년도에는외국인비중이 10% 미만수준에서점차로비중이줄어드는것으로 주로국내출원인이대다수비중으로나타나고있음 미국의출원현황은출원건수가꾸준히출원건수가증가하다가 유지하고있는점이특징임 2014년부터조금씩감소추세로 2010년도이후미국의외국인출원이 30~40% 정도로최근까지이러한추세가나타나고있어, 타국가에비해내국인출원이다수이루어지고있는것이특징으로나타남 일본의출원현황은 10년도이후부터소폭증감추세를나타내면서유지되는경향을보이고있 음, 내외국인비중은외국인이 20% 미만으로내국인출원이높은경향을보이고있는점이 특징임, 유럽의경우에는소폭증가추세를보이고있으며, 외국인비중이전체 70% 로외국인 비중이타국가보다높은것으로나타남 [ 국가별출원현황 ] 176
전략제품현황분석 (3) 투입기술및융합성분석 음성인식 SW 기술 분야의투입기술을확인하기위하여특허분류코드인 IPC Code 16) 를통하여 살펴본결과가장많은비중을차지하고있는 IPC는 G10L 분야가가장많은 1,271건으로나 타났으며, G06F이 115 건, H04M이 34건으로 G10L분야가대다수를차지하고있음 이외에 G06Q 29 건, H04R 29 건, H04N 24 건, G09B 17 건, G06K 16 건, H04B 14 건, G10K 8건등의기술이투입되어있어언어및음성인식소프트웨어기술분야에다양한기술이존재 하지만, 음성분석, 합성, 인식기술분야에집중되고있음 더불어해당 IPC의특허인용수명을살펴보면 H04R로서기술분야의수명이 9년으로가장긴것으 로나타났으며, G06Q 기술분야는 4년으로가장짧은것으로분석 [ 음성인식 SW 기술분야상위투입기술 ] IPC 기술내용특허인용수명 (TCT) 17) G10L 음성분석또는합성; 음성인식; 음성또는음성처리; 음성또는오디오부 호화또는복호화 7 년 G06F 전기에의한디지털데이터처리 6년 H04M 전화통신 7년 G06Q H04R 관리용, 상업용, 금융용, 경영용, 감독용또는예측용으로특히적합한데이터처리시스템또는방법 ; 확성기, 마이크로폰, 축음기픽업또는유사한음향전기기계변환기; 보청기; 방성장치 4 년 9 년 H04N 화상통신 7년 G09B 교육용또는교시용의기구; 맹인또는농아자와의의사를소통하기위한교습용기구; 모형; 유성의; 지구의; 지도; 도표 8 년 G06K 데이터의인식; 데이터의표시; 기록매체; 기록매체의취급 7년 H04B 전송 6년 G10K 음을발생하는장치; 소음또는기타음향파를방호하거나감쇠시키는방법또는장치일반; 달리분류되지않는음향 6 년 16) 전세계적으로통용되고있는국제특허분류(IPC: International Patent Classification) 를통해특허정보기술분야에서공지기술을조사할수있으며, 기술및권리정보에용이하게접근가능 17) 특허인용수명지수는후방인용(Backward Citation) 에기반한특허인용수명의평균, Q1, Q2( 중앙값), Q3 에대한통계값을제시함. 특히이와같이산출된 Q2는 TCT(Technology Cycle Time, 기술순환주기또는기술수명주기) 라고부름 177
데이터인텔리전스 - 음성인식 SW 투입기술이가장많은 G10L 분야와융합이높게이루어진기술은 G06F 분야로나타났으며, H04R, H04N 분야와도나타융합된기술의건수가높은것으로분석 이외에 G06F 분야와융합된기술은 G01C, G06N, G06Q 분야와융합된기술이많은것으로나 타났으며, H04M 분야와융합된기술은 G10L, G01C, G06Q 기술로분석됨 [ 음성인식 SW 기술분야 IPC 기술및융합성 ] (4) 주요출원인분석 앞서국가별특허건수에서미국이가장많은특허를출원하고있는것으로나타났으며, 출원인에서도한국, 미국, 일본출원인이다수를차지하고있는것으로나타남 상위 주요상위출원인을살펴보면한국의삼성전자, 한국전자통신연구원, 미국의 Google, Nuance Communication, AT&T, Microsoft, 등이상위그룹에포함되었음 일본의 NTT, Nippon Hoso Kyokai, Fujitsu, Mitsubishi Electric 한국출원인인삼성전자는한국, 미국, 유럽등다양한국가에해외출원을하고있는점이특징 이고, 한국전자통신연구원은한국출원이외에미국출원도활발하게하고있는것으로나타남, 미국의 Goole, Nuance Communication 은미국위주의출원을하고있는점이특징임, 일본출원 178
전략제품현황분석 인들은대부분일본자국출원에집중하고있으며해외출원은활발하지않은것으로나타남 피인용지수에대한통계에서는 Google, Microsoft사가상위그룹출원인중에서높은것으로 나타났으며, 나머지기업들은큰편차를보이지않은수준으로나타나고있음 주력기술분야는음성인식, 문맥인식, 음성모델링, 문맥인식기술등을주요연구개발대상으 로하고있는것으로나타남 [ 주요출원인의출원현황 ] 주요출원인 국가 주요 IP 시장국 ( 건수 %) 3극패밀 IP시리수 한국미국일본유럽 장국 종합 ( 건) 피인 용지 수 주력기술분야 삼성전자 한국 43 27 6 11 49% 31% 7% 13% 한국 13 1.36 모바일기반음성인식기술 Google 미국 66 11 0% 86% 0% 14% 미국 4 5.75 화자문맥인식기술 한국전자통신연구원 한국 57 16 78% 22% 0% 0% 한국 0 0 음성단어변환, 번역기술 Nuance Communications 미국 56 2 10 0% 82% 3% 15% 미국 7 3.54 화자문맥오류해결기술 NTT 일본 1 66 0% 1% 99% 0% 일본 0 0 음성인식오류정정기술 AT&T 미국 55 1 0% 98% 2% 0% 미국 2 3.8 음성모델링구조화기술 Microsoft 미국 37 7 0% 84% 0% 16% 미국 1 5.65 복수음성감지기술 NIPPON HOSO KYOKAI 일본 39 0% 0% 100% 0% 일본 0 0 언어모델링, 구조화기술 Fujitsu 일본 5 27 0% 16% 84% 0% 일본 5 0 음성답변처리정밀도향상기술 Mitsubishi Electric 일본 9 21 1 0% 29% 68% 3% 일본 5 1.67 각종시설물활용음성인식응용기술 179
데이터인텔리전스 - 음성인식 SW (5) 국내출원인동향 국내출원인동향을살펴보면대기업은삼성전자, 현대자동차, 현대모비스, 에스케이텔레콤등 모바일, 자동차전문기업이상위그룹에포함되었으며, 중소기업으로는얄리, 유니온앤이씨, 디 오텍, 미디어젠등음성인식응용분야기업이참여하고있는것으로나타남 기업이외의주요출원인에서연구소는전자통신연구원이외에는적게참여하고있으며, 출원이많은참여를하고있는것으로나타남 대학의 [ 국내주요출원인의출원현황 ] 180
전략제품현황분석 5. 가. 중소기업환경 중소기업경쟁력 음성인식 SW 분야의중소기업경쟁력은기술분류별로차이가있으나음성인식기술은중소기업 이다수참여하여시장에서의역할이점차커지는분야로나타났으나, 인터페이스기술은높은기 술력을요구하는분야로중소기업의경쟁력이낮은것으로분석됨 [ 음성인식 SW 분야중소기업현황 ] 기술분류주요기술대기업중소기업중소기업참여영역중소기업참여정도 음성인식기술 음성인식기술음성합성기술화자인식기술 파인디지털 SK 텔테콤 LNI 소프트시리우스소프트솔트룩스보이스웨어디오텍 음성인식기술합성기술 언어처리기술 언어분석기술대화처리기술자동번역기술 한글과컴퓨터 SK 텔테콤 LNI 소프트시리우스소프트솔트룩스보이스웨어디오텍시스트란인터내셔날 언어분석, 언어처리기술 음성& 언어인터페이스기술 음성인식학습기술인공지능기술대화형질의응답기술 SK 텔테콤 LNI 소프트시리우스소프트솔트룩스미디어젠디오텍 CSLI 뮤지오 인공지능기술음성, 언어학습기술 * 중소기업참여정도와점유율은주요제품시장에참여하는중소기업의참여규모와정도( 업체수, 비율등) 를고려하여 5단계로구분 ( 낮은단계:, 중간단계(,, ) 높은단계: ) 181
데이터인텔리전스 - 음성인식 SW 나. 중소기업기술수요 음성인식 SW 분야의중소기업의기술수요를파악하기위하여중소기업기술수요조사및중소기 업청 R&D 신청과제(2013~2015 년) 를분석한결과아래표의내용과같은수요들이다수있는것 으로분석 음성인식 SW 분야중소기업은최근에데이터분석기술과관련된기술개발에다수수요가있는것으로나타났으며, 이는인공지능기반을통한개발기술에대한관심이높아지고있는추세를반영한것으로분석됨 [ 음성인식 SW 분야과제신청현황및수요조사결과 ] 전략제품기술분류관심기술 음성인식기술음성인식기술, 인공지능기술, 사용자분석기술, 개인감정파악기술 음성인식 SW 언어처리기술자동번역, 필체분석, 언어처리기술, 방언, 언어분석 음성& 언어인터페이스기술 대화형추천시스템, 어시스턴트기술, 음성파악, 언어분석, 자동화기술, 인공지능플랫폼기술자동안내, 182
전략제품현황분석 다. 중소기업핵심기술 (1) 데이터기반요소기술발굴 음성인식 SW 기술의특허및논문데이터검색을통해도출된유효데이터를대상으로데이터마이닝기법(Scientometrics 기법) 을통해클러스터링된키워드의연관성을바탕으로요소기술후보군을도출 음성인식 SW 기술의특허및논문유효데이터를기반으로키워드클러스터링을통하여 11개의 요소기술후보군을도출 제품별 dataset 구축 : 음성인식 SW 기술관련특허/ 논문데이터를추출하여노이즈제거후제 품별 dataset 구축 1 차클러스터링 : 키워드맵을통한고빈도키워드확인- 빈도수(tf-idf) 18) 가상위 30% 에해당하 는키워드를대상으로 1차추출 2 차클러스터링 : 1차클러스터링에서추출된고빈도키워드사이에서고연관도키워드를 2차추 출 ( 고연관도기준은연관도수치19) 가 2 이상인클러스터로제한) 다음그림은키워드간연관네트워크를시각화한것으로, 간의연관도를나타내는직선으로구성 각키워드를나타내는원과키워드 각키워드가특허와논문중어느데이터에서도출되었는지원의색으로구분하였으며, 도출된클러스터는황색음영으로표시 키워드로 키워드를나타내는원은고빈도의키워드일수록원의크기가크게표현되며, 선은키워드사이의연관도수치가높을수록굵게표현 연관도를나타내는 음성인식 SW 기술전략제품의특허논문유효데이터에대하여키워드클러스터링결과를기반으로요소기술도출 데이터기반의요소기술도출은키워드클러스터링을통해도출된요소기술에대하여전문가의 검증및조정을통하여요소기술을도출 18) 빈도수(tf-idf) : 각키워드가출현되는특허또는논문수를의미 19) 연관도수치: 두개이상의키워드사이의특허또는논문수를의미 183
데이터인텔리전스 - 음성인식 SW [ 음성인식 SW 분야키워드클러스터링 ] [ 음성인식 SW 분야주요키워드및관련문헌 ] No 주요키워드연관도수치관련특허/ 논문제목 클러스터 01 speaker verification, audio signal 4~6 1. System and method for dynamic facial features for speaker recognition 2. Method and apparatus for detecting synthesized speech 3. The Effect of Voice over IP Transmission Degradations on MAP-EM-GMM Speaker Verification Performance 클러스터 02 recognition speech 4~6 1. Method and apparatus for passive data acquisition in speech recognition and natural language understanding 2. METHOD AND APPARATUS FOR EXPLOITING LANGUAGE SKILL INFORMATION IN AUTOMATIC SPEECH RECOGNITION 3. The closed runway operation prevention device: Applying automatic speech recognition technology for aviation safety 클러스터 03 acoustic environment, feature 4 1. SPEECH RECOGNITION SYSTEM AND SPEECH RECOGNITION METHOD 2. VOICE ACTIVITY DETECTION TECHNOLOGIES, SYSTEMS AND METHODS EMPLOYING THE SAME 3. Speaker verification in sensor and acoustic environment mismatch 184
전략제품현황분석 No 주요키워드연관도수치관련특허/ 논문제목 conditions 클러스터 04 voice conversion, command 6~8 1. SPEECH RECOGNITION ASSISTED EVALUATION ON TEXT-TO-SPEECH PRONUNCIATION ISSUE DETECTION 2. Chinese speech recognition system and method 3. Sub-syllable segment-based voice conversion using spectral block clustering transformation functions 클러스터 05 클러스터 06 클러스터 07 클러스터 08 voice model, readable storage interaction, pronunciatio n portable device, command translation, state machine 6~8 6~8 4 4~6 1. SPEECH DETECTION DEVICE, SPEECH DETECTION METHOD, AND MEDIUM 2. METHOD AND SYSTEMS HAVING IMPROVED SPEECH RECOGNITION 3. Fluent personalized speech synthesis with prosodicword-level spontaneous speech generation 1. SYSTEM AND METHOD OF MULTI MODEL ADAPTATION AND VOICE RECOGNITION 2. Apparatus and method of extending pronunciation dictionary used for speech recognition 3. Spoken language processing by machine 1. System and method for combining geographic metadata in automatic speech recognition language and acoustic models 2. METHOD AND APPARATUS FOR EDITING VOICE RECOGNITION RESULTS IN PORTABLE DEVICE 3. Signal recognition based on Huffman optimal binary Tree SVM for CVR 1. INTERACTIVE SPEECH RECOGNITION 2. Techniques for performing language detection and translation for multi-language content feeds 3. Cache based recurrent neural network language model inference for first pass speech recognition 클러스터 09 speech recognizer, excitation 4 1. Leveraging speech recognizer feedback for voice activity detection 2. Speech recognition including removal of irrelevant information 3. Developing objective measures of foreign-accent conversion 클러스터 10 voice pathology, low power 4~6 1. Speaker recognition via voice sample based on multiple nearest neighbor classifiers 2. DEEP BELIEF NETWORK FOR LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION 3. Spectro-temporal directional derivative based automatic speech recognition for a serious game scenario 클러스터 11 recorded utterance, audio, acoustic 6 1. System and method for improving speech recognition accuracy using textual context 2. SPEECH RECOGNITION SYSTEM AND METHOD USING INCREMENTAL DEVICE-BASED ACOUSTIC MODEL ADAPTATION 3. Voice activity detection algorithm using perceptual wavelet entropy neighbor slope 185
데이터인텔리전스 - 음성인식 SW [ 음성인식 SW 분야데이터기반요소기술 ] No 요소기술명키워드 요소기술 01 음성인식기술 voice, recognization 요소기술 02 음성합성기술 voice pathology, low power, speaker 요소기술 03 화자인식기술 voice conversion, command 요소기술 04 언어분석기술 language analysis 요소기술 05 대화처리기술 communication processing 요소기술 06 자동번역기술 translation, state machine 요소기술 07 음성인식학습기술 recorded utterance, audio, acoustic 186
전략제품현황분석 (2) 요소기술도출 산업시장분석, 기술( 특허) 분석, 전문가의견, 타부처로드맵, 중소기업기술수요를바탕으로로드맵기획을위하여요소기술도출 요소기술을대상으로전문가를통해기술의범위, 요소기술명확정 요소기술간중복성등을조정검토하여최종 [ 음성인식 SW 분야요소기술도출 ] 분류요소기술출처 음성인식기술 특허/ 논문클러스터링, 전문가추천, 기술/ 시장분석 음성인식기술 음성합성기술 특허/ 논문클러스터링, 전문가추천 화자인식기술 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 언어처리기술 언어분석기술 대화처리기술 기술/ 시장분석, 기술수요, 전문가추천, 특허/ 논문클러스터링 특허/ 논문클러스터링, 전문가추천 자동번역기술 기술수요, 특허/ 논문클러스터링, 전문가추천 음성및언어인터페이스기술 음성인식학습기술 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 대화형질의응답시스템기술 전문가추천, 기술/ 시장분석, 특허/ 논문클러스터링 187
데이터인텔리전스 - 음성인식 SW (3) 핵심기술선정 확정된요소기술을대상으로산학연전문가로구성된핵심기술선정위원회를통하여중소기업 에적합한핵심기술선정 핵심기술선정은기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업적합 성(10) 을고려하여평가 [ 음성인식 SW 분야핵심기술 ] 분류핵심기술개요 음성인식기술 사용자가발성한음성을분석하고인식하는기술음성전처리, 음성분석, 음향모델링, 탐색기술등 ( 음성인식, 음성이해, 음성분석, 음향모델, 패턴매칭, 대화체음성인식, 대어휘연속어인식, 고속탐색기술, 언어모델링, 다국어음성인식) 음성인식기술 화자인식기술 발성된음성으로부터그회사에대한정보를추출하는기술화자식별, 화자검증등으로크게구분됨임의의화자로부터입력된음성을사용하여등록된화자들중에서발성화자를찾는기술 언어처리기술 대화처리기술 사용자의대화문장을이해하고자연스러운대화를유도하는기술 ( 대화모델링기술, 대화이해기술, 대화생성기술) 음성및언어인터페이스기술 자동번역기술 입력문에대한형태소분석과구문적변환, 통계적자동번역, 딥러닝기술등다양한기술을기반으로통번역하는기술 대화형질의응답시스템기술 사용자의도를이해하여복잡한의도를가진정보검색을할수있는기술 188
전략제품 현황분석 6. 기술로드맵 기획 가. 음성인식 SW 기술로드맵 최종 중소 중견기업 기술로드맵은 기술/시장 니즈, 연차별 개발계획, 최종목표 등을 제시함으로 써 중소기업의 기술개발 방향성을 제시 189
데이터인텔리전스 - 음성인식 SW 나. 연구개발목표설정 로드맵기획절차는산학연전문가로구성된로드맵기획위원회를통해선정된핵심기술을대 상으로기술요구사항, 연차별개발목표, 최종목표를도출 [ 음성인식 SW 분야핵심기술연구목표 ] 분류핵심기술기술요구사항 연차별개발목표 1차년도 2차년도 3차년도 최종목표 음성인식기술 자연스러운발화음성을인식 대화체 DB 구축및분석 대화체모델링기술개발 중규모(1000 단어이하) 대화체인식 대규모 ( 백만단어이하 ) 대화체인식 음성인식기술 화자인식기술 화자를구별하여인식 키워드비고정화자인식 - - 화자인식 언어처리기술 대화처리기술 언어의형태소, 구문구조등을분석, 이해하고생성함 구조문법기반구문분석기술 의존문법기반구문분석기술 문서주제인식을위한문장구조분석기술 문서주제인식 자동번역 기술 특정언어를타언어로자동으로변환함 통계기반자동번역기술 1 만단어급자동번역기술 특정영역자동번역최적화기술 다중영역, 다중언어자동번역 음성및언어인터페이스기술 대화형질의응답시스템기술 컴퓨터가언어를이해하여응답함 고정시나리오대화처리기술 정보서비스용시스템주도형대화처리기술 스마트폰용정보서비스를위한대화처리기술 정보서비스및채팅을위한대화처리기술 190
전략제품현황분석 데이터보안및 비식별화
데이터보안및비식별화 정의및범위 빅데이터내에존재하는프라이버시문제해결을위한기술로개인정보를일부또는전부를삭제 대체하거나다른정보와쉽게결합하지못하도록하여특정개인을알아볼수없도록하는소프 트웨어를의미 관련소프트웨어는크게개인정보보안, 보안인텔리전스, 데이터보안으로분류 정부지원정책 정부에서는빅데이터산업활성화및개인정보보호를위해 개인정보비식별화조치가이드라 인 ( 16.6.30) 발표및신기술의도입에따른법제도개선계획수립 신기술도입에따라기존규제와충돌되는영역은 정보통신진흥및융합활성화등에관한특별 법( 일명 ICT 특별법 이라함)에따른정보통신전략위원회를중심으로법제도를개선하겠다는계획 을수립하고, 신제품서비스의경우신속처리및임시허가제를활용하여신융합서비스의신속한 시장출시를지원하겠다는입장 중소기업시장대응전략 강점 (Strength) 개인정보결합으로빅데이터활용증가 규제가아닌법적인활용보장기회 (Opportunity) 데이터판매및유통분야의개척 활발한기술개발 약점 (Weakness) 빅데이터와개인정보보호의상충 기술및인력의부재위협 (Threat) 비식별화조치후재식별화의위험성 사회적이슈로인한부정적인식 중소기업의시장대응전략 개인정보비식별화로재식별화방지를위한핵심알고리즘및기술개발 데이터보안을위한지능시스템의개발로중소기업의경쟁력강화 개인정보를결합한빅데이터판매및유통사업모델개척과빅데이터활용서비스개발
핵심기술로드맵
전략제품현황분석 1. 개요 가. 정의및필요성 최근정보통신의발전으로데이터가축적되고대용량데이터의신속한검색및분석기술이개 발되면서, 빅데이터는새로운부가가치를창출하는미래성장의원동력및새로운통찰력을제 공하는잠재력이높은자료로주목받고있음 빅데이터란규모가방대하고, 생성주기가짧으며, 정형화된수치형태뿐만아니라문자, 영상 등비정형화된대용량의데이터라고일반적으로말하지만, 단순히용량이큰데이터라기보다는 정보통신의발전으로과거에는활용이어려웠지만이제는분석과활용이가능한자료모두를 의미함. 즉, 금융, 통신, 기업경영, 의료등민간이보유한데이터는물론통계자료, 국세자료 등공공데이터도모두포함됨 국내빅데이터시장규모는연 20% 이상의성장세를보일것으로전망되어, 데이터사이언티스 트등전문인력양성, 데이터분석기술개발, 시스템구축등의빅데이터를관리분석활용분야 에서성장이기대됨 한편빅데이터는대용량의자료자체만을분석하는것뿐만아니라다양한자료간연계융합 을통한새로운정보제공시보다높은가치를가짐. 예를들어, 개인신용평가기관의채무정보 와통계청의인구가구주택모집단정보와의연계를통해가구특성별채무정보를제공하거나, 기업신용평가기관의개별기업의대출정보와국세청, 통계청등의사업체매출정보간연계를 통해소상공인의자금사정및보증위험도등의정보제공이가능하여빅데이터시대에개인정 보의활용가치는증대하고있음 하지만, 빅데이터활용시대량의개인정보유출로인해헌법의개인정보자기결정권을침해할수 있다는우려가높으며, 개인정보보호법등법률에서개인정보에대한활용을엄격히규제하고있 어, 개인정보가포함된자료를타정부기관이나연구소등민간에서영리/ 비영리적목적의활용은 어려운것이현실임 한편미국, 일본등주요선진국에서는개인정보의침해가능성을최소화하면서빅데이터활성화 를위한정책을추진하고있어, 우리나라도빅데이터의이용및활용을촉진하면서개인정보를침 해하지않는방안을마련하는것이필요함. 이를위해, 행정자치부, 금융위원회등정부기관에서 빅데이터활성화를위한개인정보보호법개정등을검토하고있으나, 아직현실화되기에는시간이 걸릴것으로판단됨 빅데이터는산업활성화측면뿐만아니라공공및민간빅데이터를활용한통계적정보를제공하 여정책적으로활용하고, 다양한국민들의요구에맞는시의성높은자료를활용하는것이중요 함. 그리고개인정보보호법에서는통계작성의목적으로비식별화된개인정보를제3자제공및활 용이가능하고, 통계법에따라수집된개인정보는적용예외규정을두고있음. 우리나라와유사하 게 EU, 영국등에서도비식별화된개인정보는통계작성의목적으로동의없이활용할수있어통 계적목적의개인정보가포함된빅데이터의활용은가능함 195
데이터인텔리전스 - 데이터보안및비식별화 따라서, 개인정보보호관련법률을검토하여현재의법체계하에서빅데이터의통계적활용가능성을검토하고, 통계적목적의비식별화방법을제시하여데이터간연계융합을통한빅데이터활성화를도모하여야함 [ 데이터보안및비식별화개념도 ] 우리나라의개인정보보호와관련된법은민간및공공부문에적용되는일반법으로서개인정보보호 법이있으며개인정보보호법은개인정보에대한정의, 개인정보처리담당자가준수해야할개인정보 보호처리원칙, 정보주체의권리, 개인정보의수집이용, 목적외이용및제공시정보주체의사전적 동의등에대해규정하고있어동법제6조에따라다른법률에특별한규정이있는경우를제외하 고는개인정보보호에관하여서는개인정보보호법을따라야함 분야별개별법으로정보통신관련정보통신망이용촉진및정보보호등에관한법률( 이하정보통 신망법), 금융거래관련신용정보의이용및보호에관한법률( 이하신용정보법), 위치정보관련 위치정보의보호및이용등에관한법률( 이하위치정보법), 의료관련의료법등이있음 개별법에서도개인정보보호법과유사하게개인정보의정의, 있음 개인정보의수집이용등을규정하고 196
전략제품 현황분석 * 출처 : 행자부 개인정보 비식별화 가이드 라인 [ 비식별 조치 절차 및 사후관리 ] 개인정보보호법은 개인정보 보호의 중요성이 증가함에 따라 기존의 공공부문의 공공기관의 개 인정보보호에 관한 법률 을 기본으로 민간까지 포괄하는 통합법으로서 2011년 3월 제정되었으 며, 개인정보에 대한 정의, 개인정보의 처리 시 제한 등을 규정하고 있음 개인정보보호법에서의 개인정보는 살아있는 개인에 관한 정보로서 성명, 주민등록번호, 영상 등을 통해 특정 개인을 알아볼 수 있는 정보이며, 다른 정보와 쉽게 결합하여 알아볼 수 있는 정보까지 포함함.(제2조 제1호). 또한, 개인정보보호법은 개인정보의 수집, 이용, 제공 등 개인정보 처리 시 사전동의방식(Opt-in)을 채택하고 있으므로 개인정보처리자의 경우 정보주체의 사전동의를 받아야 수집 이용(제15조 제1항) 및 제3자 제공(제17조 제1항)이 가능함 개인정보의 목적 외 이용 제공은 개인정보보호법에서는 제한하고 있지만, 예외적으로 통계작성 및 학술연구의 목적으로 필요한 경우 특정개인을 알아 볼 수 없는 형태로 개인정보를 제공할 수 있도 록 규정하고 있음(제18조 제2항 제4호). 특히, 통계법 에 따라 수집되는 개인정보는 제3장에서 7 장까지의 적용의 예외를 규정하고 있어 통계작성을 목적으로 공공 및 민간의 개인정보를 수집 처 리 할 수 있음 정보통신망을 이용하는 자의 개인정보를 보호하는 정보통신망법은 1986년 전산망 보급확장과 이용촉진에 관한 법률 로 시작되어 1999년 정보통신망 이용촉진 등에 관한 법률 로 전부 개정 되었음. 2001년 2월 정보통신망 이용촉진 및 정보보호 등에 관한 법률 로 다시 전부 개정되었 으며, 이후 2011년과 2012년에 두 차례 개정되어 오늘에 이르고 있음 정보통신망법에서 개인정보는 생존하는 개인에 관한 정보로서 성명, 주민등록번호 등 특정한 개인 을 알아볼 수 있는 부호, 음성, 영상 등의 정보이며, 다른 정보와 쉽게 결합하여 알아볼 수 있는 정보도 포함함 정보통신서비스 제공자는 개인정보의 수집 이용 및 제3자 제공시 사전동의를 받아야 하지만(제22 조 제1항, 제24조의 2의 제1항), 다른 법률에 규정이 있는 경우는 예외로 하고 있음 197
데이터인텔리전스 - 데이터보안및비식별화 신용정보법에서의신용정보는금융거래등상거래에있어서거래상대방의신용을판단할때 필요한정보로서, 특정신용정보주체를식별할수있는정보, 신용정보주체의거래내용, 신용도 등을판단할수있는정보로정의됨 개인신용정보의제3 자제공활용을위해서는사전적으로동의를받아야하지만( 제32조제1 항), 과 세목적, 법원의제출명령등과다른법률에따라제공하는경우는적용예외조항으로규정하고 있음 또한신용정보회사등은공공기관의경우관계법령이정하는공무상목적으로신용정보의제공을 문서로요청한경우에는신용정보를제공할수있으며( 제23조제7 항), 개인정보의수집이용및 제3자제공을위해서는사전적동의를받아야함을규정하고있음 위치정보법에의한개인위치정보는특정개인의위치정보로서다른정보와용이하게결합하여 특정개인의위치를알수있는것을포함함 개인위치정보의수집이용및제3 자제공을위해서는개인위치정보주체의동의를얻어야하지만( 제 18조및제19 조), 예외조항으로서통계작성, 학술연구또는시장조사를위하여특정개인을알아볼 수없는형태로가공하여제공하는경우를두고있음 * 출처 : 빅데이터활용을위한개인정보비식별화기술활용안내서( 미래창조부, 한국정보화진흥원 ) [ 빅데이터활용단계정의 ] 198
전략제품 현황분석 비식별조치 가이드라인 은 크게 5가지 범주(세부기술 17종)의 비식별화기술 소개 개인정보가 충분히 비식별화가 되었는지에 대한 적정성 평가방법, 전문기관을 통한 기업 간 정보 집합물(dataset) 결합 지원, 비식별정보 제공 및 위탁계약 시 준수사항 등 개인정보의 비식별조치 기준과 비식별정보의 활용범위 등을 좀 더 명확히 제시함 * 자료: 한국인터넷진흥원 [ 비식별화 주요 기술 17종 ] 개인정보보호법의 해외 사례로는 아래와 같은 내용들이 있음 OECD의 1980년 프라이버시 보호와 개인데이터의 국제유통에 대한 가이드라인 (Guidelines on the Protection of Privacy and Transborder Flows of Personal Data)은 수집제한의 원칙, 정 보품질의 원칙 등 8대 기본원칙을 제시하여 개인정보보호와 관련하여 해외 각 국의 법률에 큰 영향. 이후 2013년 7월 개정되어, 기본 원칙을 유지하되 프라이버시 집행기관 신설, 데이터 보안 관련 침해 시 집행기관 및 정보주체에게 통지 의무화 등 높아진 개인정보 침해 가능성에 대비함 - 유럽연합(EU)위원회는 2012년 1월에 회원국간의 단일법으로서 일반정보보호규정(GDPR: General Data Protection Regulation)을 제안하였고 2015년 12월에 EU 위원회, 의회 및 이사 회는 승인. 이는 2005년 10월에 제정된 데이터보호지침을 개정한 것으로, 일관되고 강화된 개인 정보보호 체계를 구축하고 디지털 경제 발전을 도모하기 위한 목적으로 2018년 초부터 각 회원 국에 직접 적용될 예정이며 GDPR에서는 빅데이터 활용을 위해 특정인을 식별할 수 없는 개인정 보인 가명화된(pseudonymized) 정보를 활용 가능하도록 하여 빅데이터 활용의 근거를 마련하였 는데, 특히, 공익, 과학적 연구, 역사연구 및 통계작성의 목적으로는 정보주체의 동의없이 가명화 된 정보를 사용가능함을 명시하였음 - 이와 함께 정보주체의 권리도 강화하여 프로파일링(profiling) 거부권과 온라인상의 개인정보에 대한 삭제할 수 있는 잊혀질 권리(right to be forgotten)를 규정하였으며, EU내 개인정보의 제3 국으로의 역외이전은 EU에 상응하는 수준의 정보보호체계를 가진 경우 또는 기업규칙(BCR: Binding Corporate Rule) 등의 경우 이전될 수 있도록 함 199
데이터인텔리전스 - 데이터보안및비식별화 일본은 2003년 5월제정된개인정보보호법을 2015년 9월개정하여개인정보를보호하면서빅데 이터활용을촉진하는제도적기반을마련. 이번법률개정에서는특히개인이특정되지않도록 하는 익명가공정보화 를도입하여익명가공정보화시본인의동의없이제3자에게제공할수있도록 하여빅데이터활용을도모함 - 익명가공정보화 를위하여개인정보에대한정의를명확히함. 기존의개인정보는성명, 생일등 개인을식별할수있는살아있는개인의정보라고정의되었는데, 이번개정에서는지문, 안면인 식자료등특정개인의신체정보와여권번호, 운전면허번호등개인이상품과서비스를받거나 구매시부여받는번호를포함하는개인식별부호가담긴것을개인정보라고명확히정의함 - 적정한규율하에서개인정보등의유용성을확보하였으며빅데이터관련산업활성화를위해, 특정개인을식별할수없도록개인정보를가공하고복원할수없도록만든정보인익명가공정보 (anonymized information) 조항을신설하여사업자가본인의동의없이제공이가능하도록함 - 내각부( 內閣府 ) 의외국( 外局 ) 으로개인정보보호위원회를신설하여개인정보보호취급에대한감시, 감독권한을강화하였으며, 일본내의개인정보를취득한외국기관에대해서도개인정보보호법을 적용하고, 외국의제3자제공시제한하는조항을신설함 미국의경우일반화된개인정보보호법은없으며, 공공, 통신, 온라인, 의료등각영역별법및 제도가있음. 공공부문에서는예산관리실(OMB: the Office of Management and budget) 에서 프라이버시법(Privacy Act) 을관장하고있으며, 민간부문은연방거래위원회(FTC: the Federal Trade Commission) 에서소비자보호관점에서개별프라이버시권관련관할을하고있지만기본적 으로개인정보처리는민간의자율규제에맡기고있음 - 의료관련법중건강보험이전과책임에관한법(HIPAA: Health Insurance Portability and Accountability Act) 에따른 HIPAA 프라이버시규칙(HIPAA Privacy Rule) 에서비식별화된정보 는제한없이사용가능하도록하였으며, 전문가결정방식(expert determination) 과식별자를제 거하는세이프하버(safe harbor) 두가지방식의비식별화방법을제시하고있음 - 가족의교육적권리및프라이버시법(FERPA: Family Educational Rights and Privacy Act) 에 서는비식별조치된학생기록에대해별도의동의없이배포가가능하고, 경제적 임상적보건에 대한건강정보기술법 (HITECHA: Health Information Technology for Economic and Clinical Health Act) 에서는비식별조치된건강정보에대해프라이버시관련규제를적용하지않고있음 200
전략제품현황분석 나. 범위 (1) 비식별화기술분류관점 가명처리(pseudonymization) 기법은개인식별이가능한데이터에대하여직접적으로식별할 수없는다른값으로대체하는기법임. 성명, 기타고유특징( 출신학교, 근무처등) 등이가명 처리대상이되고그자체로는완전비식별화가가능하며데이터의변형, 변질수준이적은장 점이있으나일반화된대체값으로가명처리함으로써성명을기준으로한분석에는한계가존 재 개인정보중주요식별요소를다른값으로대체하여개인식별을곤란하게함 ( 예) 홍길동, 35 세, 서울거주, 한국대재학 임꺽정, 30 대서울거주, 국제대재학 다른값으로대체하는일정한규칙이노출되어역으로개인을쉽게식별할수있어서는안됨 총계처리(Aggregation) 기법은개인정보에대하여통계값( 전체혹은부분) 을적용하여특정 개인을판단할수없도록하며개인과직접관련된날짜정보( 생일, 자격취득일), 기타고유 특징( 수입지출, 신체정보, 진료기록, 병력정보, 특정소비기록등의개인민감정보) 등을대상으 로하고민감한정보에대하여비식별화가가능하며다양한통계분석( 전체, 부분) 용데이터셋 작성에유리하나집계처리된데이터를기준으로정밀한분석이어려우며집계수량이적을경 우데이터결합과정에서개인정보추출또는예측이가능함 데이터의총합값을보임으로서개별데이터의값을보이지않도록함 ( 예) 임꺽정 180cm, 홍길동 170cm, 이콩쥐 160cm, 김팥쥐 150cm 물리학과학생키합 : 660cm, 평균키 165cm 단, 특정속성을지닌개인으로구성된단체의속성정보를공개하는것은그집단에속한개인의 정보를공개하는것과마찬가지결과가나타나므로그러한정보는비식별화처리로볼수없음 ( 예> 에이즈환자집단임을공개하면서특정인물 갑 이그집단에속함을알수있도록표시하는 것은 갑 이에이즈환자임을공개하는것과마찬가지임) 데이터값삭제(data reduction) 기법은개인정보식별이가능한특정데이터값삭제처리하 여식별이불가능하도록하는방법으로쉽게개인을식별할수있는정보( 이름, 전화번호, 주 소, 생년월일, 사진등), 고유식별정보( 주민등록번호, 운전면허정보등), 생체정보( 지문, 홍채, DNA 정보등), 기관, 단체등의이용자계정( 등록번호, 계좌번호, 이메일주소등) 등을대상으 로민감한개인식별정보에대해서는완전한삭제처리. 데이터삭제로인한분석의다양성, 분석결과의유효성, 분석정보의신뢰성은떨어지는단점이있음 201
데이터인텔리전스 - 데이터보안및비식별화 데이터공유 개방목적에따라데이터세트에구성된값중에필요없는값또는개인식별에중요 한값을삭제 ( 예) 홍길동, 35 세, 서울거주, 한국대졸업 35 세, 서울거주 ( 예) 주민등록번호 901206-1234567 90 년대생, 남자 ( 예) 개인과관련된날짜정보( 자격취득일자, 합격일등) 는연단위로처리 ( 예) 연예인 정치인등의가족정보( 관계정보), 판례및보도등에따라공개되어있는사건과관련되어 있음을알수있는정보 범주화(data suppression) 기법은단일식별정보를해당그룹의대표값으로변환( 범주화) 하거 나구간값으로변환( 범위화) 하여고유정보추적및식별방지하는방법임. 쉽게개인을식별 할수있는정보( 주소, 생년월일등), 고유식별정보( 주민등록번호, 운전면허번호등), 기관, 단 체등의이용자계정( 등록번호, 계좌번호) 등을대상으로범주나범위는통계형데이터형식이 므로다양한분석및가공이가능하나범주, 범위로표현됨에따라정확한수치값에따른분 석, 특정한분석결과도출이어려우며, 데이터범위구간이좁혀질경우추적, 예측이가능함 데이터의값을범주의값으로변환하여명확한값을감춤 ( 예) 홍길동, 35 세 홍씨, 30-40세 데이터마스킹(data masking) 기법은개인식별정보에대하여전체또는부분적으로대체값 ( 공백, *, 노이즈등) 으로변환하는방법임. 쉽게개인을식별할수있는정보 ( 이름, 전화번 호, 주소, 생년월일, 사진등), 고유식별정보( 주민등록번호, 운전면허번호등), 기관, 단체등의 이용자계정 ( 등록번호, 계좌번호, 이메일주소등) 등을대상으로완전비식별화가가능하며 원시데이터의구조에대한변형이적으나과도한마스킹적용시필요한정보로활용하기어 려우며, 마스킹의수준이낮을경우특정한값의추적예측가능함 공개된정보등과결합하여개인을식별하는데기여할확률이높은주요개인식별자가보이지않 도록처리하여개인을식별하지못하도록함 ( 예) 홍길동, 35 세, 서울거주, 한국대재학 홍**, 35 세, 서울거주, ** 대학재학 남아있는정보그자체로개인을식별할수없어야하며인터넷등에공개되어있는정보등과결 합하였을경우에도개인을식별할수없어야함 202
전략제품현황분석 [ 제품분류관점기술범위 ] 전략제품제품분류관점세부기술 휴리스틱익명화 (Heuristic Pseudonymization) 식별자에해당하는값들을몇가지정해진규칙으로개 인정보를숨기는방법 혹은사람의판단에따라가공하여자세한개인정보를 숨기는방법이기도함 가명처리 (Pseudonymiza tion) K- 익명화 (K-anonymity) 암호화 (Encryption) 동일한속성값을가지는데이터를 K 지하여데이터를공개하는방법 지정된속성이가질수있는값을 하여프라이버시누출을방지 개이상으로유 K개이상으로유지 정보의가공에있어서일정규칙의알고리즘을적용하 여암호화함으로써개인정보를대체하는방법임 통상적으로다시유용하게사용하기위해서복호가가 능하도록암호화/ 복호화값(key) 를가지고있어서 key에 대한보안방안도함께필요함 데이터보안및비식별화 교환방법 (Swapping) 총계처리 (Aggregation) 추출된표본레코드에대하여이루어짐 미리정해진변수( 항목) 들의집합에대하여데이터베이 스의레코드와연계하여교환함 수집된정보에민감한개인정보가있을경우데이터집 단또는부분으로집계( 총합, 평균등) 처리를하여민 감성을 낮춤 부분집계 (Micro Aggregation) 분석목적에따라부분그룹만비식별처리 다른속성값에비하여오차범위가큰항목이나속성값 에대하여통계값( 평균등) 을활용하여값을변환 총계처리 (Aggregation) 라운딩 (Rounding) 집계처리된값에대하여라운딩( 올림, 내림, 사사오입) 기준을적용하여최종집계처리 데이터재배열 (Rearrangement) 기존정보값은유지하면서개인정보와연관이되지않 도록해당데이터를재배열 개인의정보가타인의정보와뒤섞임으로써 전체정보 의손상없이개인의민감정보가해당개인과연결되지 않도록하는방법 203
데이터인텔리전스 - 데이터보안및비식별화 [ 제품분류관점기술범위 ] 전략제품제품분류관점세부기술 속성값삭제 (Reducing Variables) 원시데이터에서민감한속성값등개인식별항목을단순제 거하는방법 데이터값삭제 (Data Reduction) 속성값부분삭제 (Reducing Partial Variables) 데이터행삭제 (Reducing Records) 민감한속성값에대하여전체를삭제하는방식이아닌해당 속성의일부값을삭제함으로써대표성을가진값으로보이도 록하는방법 타정보와비교하여값이나속성의구별이뚜렷하게식별되 는정보전체를삭제 특정하게민감한속성값하나가아닌해당정보를가진개 인의내용전체를제거하는방법 준식별자제거를통한단순익명화 식별자뿐만아니라잠재적으로개인을식별할수있는준식 별자를모두제거함으로써프라이버시침해위험을줄이는방 법 범주화 (Data Suppression) 은폐화방법이라고도하며명확한값을숨기기위하여데이 터의평균또는범주의값으로변환하는방식 데이터보안및비식별화 범주화 (Data Suppression) 랜덤올림방법 (random rounding) 범위방법 (Data Range) 세분정보제한방법 (Subdivide Level Controlling) 개인식별정보에대한수치데이터를임의의수기준으로 올림(round up) 또는절사(round down) 하는기법 개인식별정보에대한수치데이터를임의의수기준의범 위(range) 로설정하는기법 해당값의분포( 범위(range), 구간(interval)) 로표현 개인정보중단일항목으로개인식별이될수있는항목을 민감(sensitive) 항목또는높은시각 (High visibility) 항목이 라함 이와같은민감한항목을상한(top), 하한(bottom) 코딩, 구간재코딩(recording into intervals) 방법을이용하여정보 노출위험을줄일수있는기법 제어올림방법 (controlled rounding) 랜덤올림방법에서행과열의합이일치하지않는단점을해결하기위해행과열이맞지않는것을제어하여일치시키는기법 데이터마스킹 (Data Masking ) 임의잡음추가방법 (Adding Random Noise) 공백(Blank) 과대체 (Impute) 소득과같은민감개인식별항목에대해임의의숫자등의 잡음추가( 더하거나곱) 하여식별정보노출을방지하는기법 빅데이터자료로부터비식별대상데이터를선택 선택된항목을공백으로바꾼후에대체법(impultation) 을 적용하여공백부분을채우는기법 204
전략제품현황분석 (2) 개인정보비식별화동향 13.9 월, 안전행정부는공공정보개방, 공유시개인정보의처리원칙과기준을정한 < 공공정 보개방 공유에따른개인정보보호지침> 을마련 배포함. 최근빅데이터활용을장려하고개인 정보를효과적으로보호하기위한하나의조치로국내를비롯한미국, 영국등각국에서는개 인정보비식별화지침을마련하여업계에보다명확한개인정보보호기준을제시하고있음 주요국지침은빅데이터환경하에정보의공유와개방요구는점차증대되고기술발전이진행됨에따라필연적으로완벽한개인정보보호를보장하긴어렵지만, 개인정보의철저한비식별처리와추후재식별방지를위한지속적인모니터링등사후관리를강조 최근국내외에서정보활용도를높이고효과적으로개인정보를보호하기위한개인정보비식별 화기준이마련되고있음 빅데이터관련정보의개방과활용의요구가증가하면서개인정보보호에대한우려도증가하는상 황임 - 빅데이터환경은이종산업간다양한분야의정보가융합되어분석되기때문에폐쇄적으로정보 를처리하던과거와달리정보의공유범위가확대됨 - 방대하고다양한유형의개인정보(SNS 메시징, 위치, 선호, 관심, 웹검색이력, 성별, 나이등) 를 실시간으로분석하여통찰을제공하는빅데이터특성상분석과정에서개인정보의노출우려도커 지고있음 이에정책당국은빅데이터활용을장려하고효과적으로개인정보를보호하기위한목적으로, 정보비식별화기준발표 개인 - 개인정보보호관련법령에서는개인정보가포함된데이터의공개시비식별화처리를규정하고있지만, 명확하고표준화된비식별화지침은없음 - 국내안전행정부를비롯해외주요국에서빅데이터분석등을위해개인정보가포함된데이터를공개할때보다안전하게개인정보를비식별화할수있도록가이드라인제시 205
데이터인텔리전스 - 데이터보안및비식별화 2. 산업환경분석 가. 산업특징및구조 (1) 산업의특징 최근빅데이터활용이다양한비즈니스분야로확대되면서활용도와정확도를높여주는분석 방안에대한관심이높아지고있음 빅데이터에포함된개인정보유출에대한우려는빅데이터활용확산을저해하는요소로고려되고있음비식별정보를개인신용정보에서제외하도록신용정보법령을개정해금융회사등이비식별정보를활용할수있는근거를마련하고, 금융회사등이적극적으로빅데이터활용에동참할수있도록금융권과개인정보보호전문가등이공동으로비식별지침도마련함 빅데이터활용시개인정보를안전하게보호하면서가치있는분석결과를도출하기위해서는 다양한프라이버시모델제공과최적화된분석알고리즘이적용된빅데이터분석환경이꼭마 련되어야함 데이터유형및특징, 분석목적에따라제공되는데이터도달라져야함 우리는절대로데이터를내다버리지않는다. 제프베조스아마존최고경영자(CEO) 의말로서 아마존은고객의구매이력등빅데이터를십분활용해맞춤형상품을추천하는것으로유명함 국내의개인정보보호법은 ' 성명, 주민등록번호및영상등을통하여살아있는개인을알아볼 수있는정보' 라면모두개인정보에해당한다고보고있음. 또해당정보만으로는특정개인을 알아볼수없다고하더라도, 다른정보와결합해그개인을식별할수있는경우라면개인정보 로서보호함 고객이서비스를이용하는과정에서생성되는구매이력, 검색기록등을다른정보와연계해특정개인을유추할수있다면, 이또한개인정보가될수있음 개인정보보호법이개인정보의범위를넓게규정하면서, 국내기업의빅데이터활용은상당히제한된모습을보임. 이렇다보니정보의융합 분석을통한서비스개선시도역시마찬가지의상황을겪고있음 행정자치부가발표한 ' 개인정보비식별조치가이드라인' 은공유또는공개될가능성이희박한 정보와결합해야만비로소개인정보의주체를인지할수있는경우개인정보에해당하지않는 다고설명하고있음. 개인정보해당여부에대한판단기준을구체화해개인정보의범위가무 한정확대되지않도록선을그은셈이며또이가이드라인은 ' 비식별조치' 에관한구체적기 준을제시하고, 적정한비식별조치를거친정보는개인정보가아니라고추정하고있으므로개 206
전략제품현황분석 인정보보호법에따른고객의동의를얻지않고도데이터를활용할수있는길이열리면서, 후빅데이터산업의활성화도기대할수있게되었음 향 비식별조치를취했더라도개인정보주체의특징을드러내는일부정보는여전히남아있을수밖에 없음. 이에가이드라인은기술의발달과새로운정보의생성등으로비식별조치된정보의개인정 보주체가누구인지알수있게되는경우를 ' 재식별화' 라고보고, 신속히정보처리를중단하고 해당정보를파기하도록규정하고있음 비식별조치된정보라도그본질은개인정보에해당하는만큼, 주체가정보활용에대한통제권을 상실해서는안되기때문에또애초의정보제공목적과달리사용되는경우에대비해이의를제 기할수있는경로를확보, 개인정보보호에만전을기할필요가있을것으로예상됨 지난 2016년 5 월, 규제개혁장관회의를통해개인정보비식별조치지원센터( 한국인터넷진흥 원) 와부처별전문기관을지정하고, 기업들이보유한데이터를안전하게활용할수있도록필 요한조치사항을지원하도록했음 지금까지는중소벤처기업들이보유한데이터를비식별해활용하거나타분야의데이터와결합하기는어려웠으나이제는전문기관(K-ICT 빅데이터센터) 이공모심사한전문가풀( 적정성평가단) 을통해기업이보유한데이터를적정평가해안전하게활용할수있게되었으며특히그동안기업들이보유한데이터를다른기업의데이터와결합하는것이불가능했으나신뢰할수있는전문기관을통해기업간데이터결합이가능하게돼새로운비즈니스모델개발에활용할수있게되었음 비식별조치가이드라인발표이후, 산업계에서는비식별데이터를활용한다수의신규서비스사업 기획이진행되고있으며, 비식별관련컨설팅및서비스, 솔루션시장등이확대되고있음 통신업계와금융업계는보유한데이터를비식별해소비자취양에맞는다양한신서비스를개발제 공준비하고있고, 국립암센터는의료정보를비식별해다른의료데이터와연계하기위한컨설팅 을수행하는등빅데이터분석컨설팅시장이확대될전망 비식별솔루션도등장하고있어이지서티는개인정보비식별조치가이드라인을적용한비식별화 솔루션 `아이덴터티쉴드` 를출시하고스타트업에게무료버전을제공할계획이고, 파수닷컴도비식 별화솔루션 `애널리틱디아이디`를출시해시장을개척하고있음 207
데이터인텔리전스 - 데이터보안및비식별화 (2) 산업의구조 빅데이터가경제에활력을주고새일자리를창출할 21 세기의 ' 원유' 로까지기대를모으지만 산업화까지넘어야할과제가너무나많은상황이며개인정보유출피해는막으면서, 부가가치 를창출할수준의정보량을담는두가지과제를넘어야하므로개인정보의이름표즉개인 식별사항을제거하는비식별조치가핵심임 빅데이터를이용한신규비즈니스나맞춤상품은금융분야에선핀테크, 그밖에 IT 와이동통신, 렌터 카, 호텔및여행숙박서비스, 헬스케어, 항공등거의무한대로활용범위가넓은데현행신용정 보법은개인을식별할수있는정보외에대출등거래내용을판단할수있는정보등을모두개 인신용정보로보고있으므로비식별정보는개인정보일수도, 아닐수도있는상황이며정부가이드 라인도비식별정보를개인정보가아닌것으로 ' 추정' 하고있을뿐이어서빅데이터가공기술을 가진벤처기업도, 이를이용해비즈니스에활용하려는대기업도법정비가시급한상황임 비식별조치를하면안전하게개인정보를빅데이터로가공할수있다고봄. 미래부, 금융위등 주무부처들도같은입장. 핀테크, 빅데이터창조경제등은박근혜정부의중점육성산업임 그러나아무리익명화를시켜도개인 SNS 등의여러정보를교차활용하다보면개인이특정될가 능성은있다는것을넷플릭스사례를통해서알수있으므로시민단체와소비자단체등에서는 ' 소비자보호' 를주장하며정부의가이드라인및개정안에반대하고있으나업계는업계대로재식 별이불가능한정보는빅데이터로서의상품가치가크지않다고보는불만도있음 빅데이터가풀고가야할가장큰문제는사생활침해논란이며개인정보를이용해빅데이터를만 드는과정에서특정개인의내밀한정보가공개될수있다는것이므로이때문에특정개인을알 아볼수없도록이름을지우거나다른변수로대체하는이른바 과정을반드시거쳐야함 ' 비식별화조치' 를통해가공하는 문제는개인정보를어느정도까지비식별화조치를하느냐마느냐로완벽하게개인과연결되 지않은데이터는사생활보호에는유용하지만산업적가치가떨어지는단점이있음 비식별화조치를마친데이터라고해도다른자료와결합해재식별화될가능성도존재하므로현행개인정보보호법상에는다른정보와쉽게결합해식별이가능하게될경우도개인정보로인정, 비식별화기술의적용만으로개인정보보호법위반이아니라고단정할수없는이유임 재식별화가실제발생한 1997년미국매사추세츠주사례가대표적인데매사추세츠주는연구목 적으로비식별화된공무원병원진료기록을공개했지만케임브리지시선거인명부와비교분석을 통해주지사등의개인정보가재식별화되는사고가발생한바있음 208
전략제품현황분석 기술별로보면가명처리기술의경우다른정보와의결합을통해재식별화될가능성이비교적높은반면총계처리나데이터삭제와범주화, 마스킹기술은상대적으로위험이낮은것으로알려짐. 이에따라비식별화시한기술만이용할경우재식별화위험이있는만큼여러비식별화기술을조합해사용할것을전문가들은권고하고있음 신용정보원은신용정보의이용및보호에관한법( 신용정보법) 에의한종합신용정보집중기관 으로서, 신용정보의집중관리를통한신용정보및신용정보주체보호를첫번째목적으로함. 2014 년터진개인정보유출사고로인해여기저기흩어져있는신용정보를한곳으로모아안 전하게관리해야할필요성이생겼기때문임 업계는통합관리의 ' 부산물' 로써신용정보원에집중되는 ' 통합신용정보' 의활용에군침을흘리고 있는데이는신용정보원에는은행연합회 여신금융협회 생명보험협회 손해보험협회 금융투자협회 보 험개발원등 6 개기관이참여하고있으며금융업계의숙원인빅데이터활용에가장큰 ' 이해관계' 가있는이익단체들이모인셈이므로신용정보원내정보분석부에서는금융권과비금융권의빅데 이터활용을위한빅데이터정보를제공기로했기때문에핀테크산업활성화를 꼽는정부와기업의이해관계가맞물려있음 ' 신성장동력' 으로 신용정보원에서는서로다른금융업권의이용자정보를연계분석, 빅데이터로제공할수있어서 예를들면보험가입자의은행대출성향을분석할수있고대출과보험의상관관계를분석해대출 이자율을결정할수있게됨 정부는개인정보비식별화를통해빅데이터를활용할수있도록지난 6월행정자치부와방송통신 위원회, 금융위원회등정보보호와관련된부처를중심으로 ' 비식별정보가이드라인' 을내놓았으며 비식별화한정보는개인정보가아닌것으로추정하고빅데이터분석등상업적으로활용할수있 도록했는데이과정에서기업들은고객의추가동의없이시장조사나신상품개발, 마케팅활용 등에이용할수있고, 유상으로제3자에게제공도가능하므로이같은빅데이터를제공하는신용정 보원이 ' 국민개인정보' 의판매창구가되는게아니냐는지적이제기되는이유임 209
데이터인텔리전스 - 데이터보안및비식별화 [ 데이터보안및비식별화산업구조 ] 구분촉진요인저해요인 수요 - 비식별화개인정보는빅데이터의원천 - 금융업계는은행, 카드, 보험등각분야에분 산된개인신용정보를결합할수있어야빅데이 터활용이가능하다며규제완화를요구 - 과도한규제때문에빅데이터활용에제약이큼 - 개인정보보호와빅데이터에서추출한정보의활용가능성에대한이해가서로상충하고있음 환경 - 정부가비식별화를거친개인정보는당사자의 동의없이도수집과가공, 제3자에대한판매가 가능하다고유권해석을함 - 그동안이종사업자들이보유한데이터는정보 주체의동의없이결합이어려웠으나앞으로신 뢰할수있는제3자인전문기관을통해결합할 수있도록허용함 - 현행법은개인정보의수집과활용에반드시당사자의사전동의를거치도록하지만비식별화와관련된규정은두고있지않음 - 보안이슈대두및빅데이터활용에의한사회적인식부족으로시장활성화장애 기술 - 비식별화란데이터내에개인을식별할수있는정보가있는경우, 이의일부또는전부를삭제, 또는일부를속성정보로대체처리하는등다양한방법을통해개인을식별하기어렵게만드는일련의조치 - 비식별화를위한다양한기술들이시중에소개되고있으며빅데이터시장활성화를위하여다양한기술들이연구개발중 - 미래창조부에서는한국정보화진흥원을개인정보비식별전문기관으로지정하여비식별조치및기업간데이터결합을지원함으로써데이터를안전하게활용할수있는기반을조성중 - 비식별화의실제사례에관하여공개가능 한정보를구하는것에는커다란한계가있 음. 비식별화작업을실제로진행한사례가 있다고하더라도해당당사자가그에관해 공개하여주목을받는것을원하지않는경 우가대부분이기때문 - 비식별화조치의한계는비식별화이후에 나타날수있는재식별의위험성이며아무 리비식별화가되었다고하더라도재식별의위험성이크다면비식별화를통해얻고자했던개인정보의보호를달성하기어려운상황이초래되기때문 210
전략제품현황분석 나. 경쟁환경 정보통신기술의발전으로개인에관련된정보들의수집 활용이용이해지고, 등기업활동에활용하고자하는욕구가증대됨 이를맞춤형광고 이메일, 게임, 게시판등의정보통신서비스는이용자를구분하기위해자연스럽게개인정보를수 집 처리하게되어, 전통적인공공영역외에민간영역에서도방대한개인정보가축적됨 또한인터넷의발전으로이용자들의프로파일과행동양태를수집하거나검색키워드같은컨텍스트 (context) 까지고려하여보다효과적으로광고하는기술이개발되면서개인정보의경제적중요성 이증대됨 인터넷초창기에는광고성이메일은무작위로전송되었으나, 2000 년대초에오버추어(Overture) 는검색키워드를활용한맞춤형광고시스템을개발 확산시킴 오버추어는야후(Yahoo) 에합병되었고, 이후구글(Google) 의애드센스(AdSense) 등다양한검색 광고서비스가존재하고, 국내의네이버와다음도검색광고로수익을내고있음 아마존(Amazon) 과같은전자상거래기업, 페이스북(Facebook) 같은사회적관계망서비스(Social Networking Service) 에서는이용자의 고및추천시스템을운영하고있음 ID를기반으로구매패턴등의행동양태를활용해맞춤형광 이에따라개인정보를불법적으로수집하거나한기업내에축적된개인정보를불법적으로입 수하여광고등에활용하는개인정보침해사례가갈수록빈번하게발생함 정부는공공과민간의정보보호및개인정보관리체계를점검하기위한국제표준을도입하고 이를강화한별도의인증제도를실시해왔음 일반적인정보보호인증제도로는국제표준화기구 ISO의 ISO27001 과, 한국인터넷진흥원이 ISO27001을기반으로보안요건을강화한 가존재함 ISMS (Information Security Management System) 개인정보에특화된인증제도로는민간기업이자율적으로신청할수있는 PIMS(Personal Information Management System), 자영업자를포함한중소규모조직에대한 PIPL(Personal Information Protection Level) 이각각존재했으나, 내용이많이중복된다는지적에따라 2016. 1.1 부터 PIPL을폐지하고 PIMS에통합하여운영하기로함 또한일정기준이상의개인정보파일을운용하는공공기관은정보주체의개인정보침해의위험요 인의분석과개선사항도출을위한개인정보영향평가를의무적으로실시해야하며, 그외의개인 정보처리자에게도권장하고있음 211
데이터인텔리전스 - 데이터보안및비식별화 [ ISO 27001과 ISMS 의비교 ] 항목 ISO/IEC 27001 KISA ISMS 제정시기 2005. 10. BS7799에토대하여 2002년부터시행 토대 1995. 2. 영국 BSI, BS7799-1 1998. 2. 영국 BSI, BS7799-2 ISO/IEC 17799:2000, BS7799-2 ISO/IEC 27001 삼사항목 11 개분야, 133개통제항목 비고 18 개분야, 104개통제항목 (ISO/IEC 27001 항목모두포함) 미래창조과학부관할 2010. 시작되던 G-ISMS를 2014년에통합정보통신망법제47조에근거 2016. 6. 1. 매출/ 세입 1,500억원이상기업을의무대상자로추가지정 * 출처 : 소프트웨어정책연구소 [ PIMS와 PIPL 통합변경사항 ] 항목통합전통합후 인증명 PIPL( 개인정보보호인증) PIMS( 개인정보관리체계인증) PIMS( 개인정보관리체계인증) 인증대상 모든개인정보처리자 ( 정보통신서비스제공자제외) 정보통신서비스제공자 모든개인정보처리자 평가항목 65개 124개 86개 수행기관 NIA( 행정자치부) KISA( 방송통신위원회) KISA( 행자부, 방통위) 근거법률개인정보보호법정보통신망법 개인정보보호법정보통신망법 도입시기 2013. 11 2011. 11 2016. 1 인증현황 (2015. 10.) 13개기관 29개기관 42개기관 * 출처 : LG CNS 212
전략제품현황분석 다. 전후방산업환경 기술정보보안분야의주요전략제품은시스템보안, 네트워크보안, 암호인증, 컴퓨터보안관 리, 하드웨어보안등으로구분이가능함 기술정보보안분야는응용스펙트럼이넓고주변산업으로의파급효과가큰산업으로시스템 보안, 네트워크보안이의료, 에너지, 자동차, 통합관제시스템, 교통, 콘텐츠, 금융, 시설보안 으로의적용이가능함 타산업의인프라의역할을수행하고안전, 헬스케어, 에너지관리등다른산업과의결합을통 해영역이사회전반적으로점차확대되고있음 기술정보보안제품의부품소재시장으로서의후방산업으로는빅데이터, 크통신관련솔루션및 SW, 서비스구현및임베디드 SW 등이있음 클라우드등의네트워 [ 기술정보보안중심의산업구조( 전후방) ] 후방산업기술정보보안전방산업 네트워크 통신솔루션, 빅데이터솔루션, 클라우드기반 SW, 임베디드 SW 등 네트워크보안, 시스템보안, 유출방지, 컴퓨터보안관리, 하드웨어보안, 암호인증, 보안관리, 개인프라이버시보호 의료, 금융, 에너지, 자동차, 치안및재난재해관제시스템, 교통, 스마트지갑, 콘텐츠저작권보호, 통합관제시스템, 각종산업인프라 213
데이터인텔리전스 - 데이터보안및비식별화 3. 시장환경분석 가. 세계시장 KOTRA 의 미국사이버보안시장동향과우리기업진출을위한시사점 보고서에따르면 15년 기준전세계사이버보안시장규모는 754 억달러이며, 16년에는 814억달러로전년대비약 8% 증가할것으로전망 또한, 전세계사이버보안시장은 2021년까지연평균 8.1% 의성장률을지속하여 2021년시 장규모는 1,200억달러규모로성장할것으로전망 가트너에따르면현재정보보안지출이가장큰분야는컨설팅및 IT 아웃소싱분야이며, 2020년 말까지보안테스트, IT 아웃소싱, 데이터손실방지(DLP) 분야의지출이가장높은성장세를보일 것으로전망 [ 세계사이버보안시장규모및성장률전망 ] ( 단위: 백만달러, %) 구분 15 16 17 18 19 20 CAGR ('13~'15) 시장규모 75,429 81,439 88,093 95,283 102,923 111,143 8.0% 전년대비성장률 7.9 8.0 8.2 8.2 8.0 8.0 - 출처 : KOTRA, 미국사이버보안시장동향과우리기업진출을위한시사점 (2016) 지역별로는 2016년기준북미지역의시장규모가 332억달러로전체글로벌시장의 40.8% 로 가장큰비중을차지하고있으며, 다음으로유럽이 24%, 아태지역이 20%, 중동아프리카가 9%, 남미가 6% 를차지함 2016년부터 2021년까지의연평균성장률은남미지역이 11.4% 로가장높을것으로전망되 며, 이어서중동아프리카지역이 10.1% 로 10% 이상의성장률을보일것으로전망 남미, 중동아프리카, 아태지역의연평균성장률이전세계평균 8.0% 보다높을것으로전망되나전체시장에서차지하는비중의큰변화는없을것으로예상 2016년대비 2021 년비중이증가할것으로전망되는지역은아태지역, 중동아프리카, 남미로 각각 20.2% 21.7%, 9.1% 10.1%, 6.1% 7.2% 증가할것으로전망 2021년에도가장큰비중을차지하는지역은북미로전체시장의 38.8% 를차지할것으로전망 214
전략제품 현황분석 KOTRA에 따르면 글로벌 투자은행 Piper Jaffray의 2015 CIO Survey 에서 사이버보안 부문 이 기업의 IT투자의 최우선 과제라고 한 응답자가 전년도 59%보다 크게 증가한 75%로 조사 된 것으로 나타남 또한 사이버 보안 분야에서 네트워크 보안에 가장 많이 투자할 예정이라는 응답이 88%로 가 장 많았으며, 다음으로 엔드포인트보안이 78%, 컴플라이언스 69% 등의 순을 높게 나타남 [ Piper Jaffray, 2015 CIO Survey, 사이버보안분야 투자 전망 응답결과 ] *출처 : KOTRA, 미국 사이버보안시장 동향과 우리기업 진출을 위한 시사점 (2016) 215
데이터인텔리전스 - 데이터보안및비식별화 나. 국내시장 한국정보보호산업협회의 2015 국내정보보호산업실태조사 에따르면 2015년말국내정보보 호기업은총 701 개로, 이중정보보안기업이 299 개, 물리보안기업이 402개로확인 대부분의정보보호기업들은서울, 경기, 인천등의수도권에밀집되어있음 기업형태별로는정보보안분야의경우일반기업이 139 개(46.5%), 벤처기업이 160 개(53.5%) 였 으며, 물리보안분야의경우일반기업이 242 개(60.2%), 벤처기업이 160 개(39.8%) 임 분야별로는정보보안분야의경우정보보안제품이약 를차지하는것으로나타났으며, 정보보안서비스가약 24.3% 를차지함 75.7%, 정보보안서비스가약 24.3% 정보보안기업들이가장많이취급하는제품군은네트워크보안, 콘텐츠정보유출방지, 보안 관리, 시스템보안, 암호인증등의순으로많았으며, 서비스군은보안컨설팅서비스, 유지관리 및개발, 보안관제서비스, 인증서비스, 교육훈련서비스등의순으로많았음 [ 정보보안기업의제품및서비스현황 ] 구분 기업수( 개) 비율 (%) 네트워크보안 132 26.0 시스템( 단말) 보안 54 10.7 정보보안제품 콘텐츠/ 정보유출방지보안 68 13.4 암호/ 인증 37 7.3 보안관리 54 10.7 기타 39 7.7 소계 384 75.7 보안컨설팅 55 10.8 유지관리 40 7.9 정보보안서비스 보안관제 20 4.0 교육/ 훈련 2 0.4 인증서비스 6 1.2 소계 123 24.3 합계 507 100.0 * 출처: 한국정보보호산업협회, 2015 국내정보보호산업실태조사 216
전략제품현황분석 2015년국내정보보호시장규모는 7조 7,476 억원으로추정되며, 이는 2014년 7조 2,553억 원대비 6.8% 증가한수준임 이중정보보안분야매출액은 1조 9,284억원으로전년 1조 7,359억원대비 11.1% 증가하였으 며, 물리보안분야매출액은 5조 8,192억원으로전년 5조 5,195억원대비 5.4% 증가한수준 정보보안기업의매출은정보보안제품분야와서비스분야가각각 77.3% 와 22.7% 를차지하 였으며, 물리보안기업의매출은물리보안제품분야가 60.7%, 서비스분야가 39.3% 를차지 함 [ 물리보안기업의제품및서비스현황 ] ( 단위: 백만원, %) 정보보안 구분 2014년 2015 년(E) 증감률매출비중 제품 1,335,134 1,489,966 11.6 77.3 서비스 400,731 438,442 9.4 22.7 소계 1,735,865 1,928,408 11.1 100.0 제품 3,394,590 3,535,079 4.1 60.7 물리보안 서비스 2,124,862 2,284,091 7.5 39.3 소계 5,519,452 5,819,170 5.4 100.0 합계 7,255,317 7,747,578 6.8 - * 출처: 한국정보보호산업협회, 2015 국내정보보호산업실태조사 2014년기준국내정보보호산업전체매출액은 7,255,317 백만원이었으며, 2020년까지연평 균 8.96% 증가하여 12,139,011백만원규모로성장할것으로전망됨 정보보안의경우 2014년 1,735,865백만원에서 2020년 3,846,931백만원으로연평균 14.18% 증가할것으로전망 물리보안의경우 2014년 5,519,452백만원에서 2020년 8,292,080백만원으로연평균 7.02% 증가할것으로전망 [ 국내정보보호산업매출전망 ] 구분 15 16 17 18 19 20 ( 단위: 백만원, %) CAGR ('13~'15) 정보보안 1,928,408 2,177,637 2,494,622 2,878,500 3,329,269 3,846,931 5.4% 물리보안 5,819,170 6,331,776 6,773,452 7,245,936 7,751,379 8,292,080 2.7% 합계 7,747,578 8,509,413 9,268,074 10,124,436 11,080,648 12,139,011 3.3% * 출처: 한국정보보호산업협회, 2015 국내정보보호산업실태조사 217
데이터인텔리전스 - 데이터보안및비식별화 분야별로는정보보안의경우정보보안제품분야매출이 2014년 1,335,134백만원에서연평균 14.56% 씩성장하여 2020년에는 3,017,847 백만원규모에달할것으로전망되고, 정보보안서 비스분야매출은 2014년 400,731백만원에서 2020년 829,064백만원으로연평균 12.88% 성장할것으로전망됨 물리보안의경우물리보안제품분야매출이 2014년 3,394,550백만원에서 2020년 4,825,062백만원으로연평균 6.04% 의성장률을기록할것으로전망되며, 물리보안서비스분 야매출은 2014년 2,124,862백만원에서 2020년 3,467,018백만원으로연평균 8.5% 증가 할것으로전망됨 [ 국내정보보호산업분야별매출전망 ] ( 단위: 백만원, %) 구분 14 15 16 17 18 19 20 CAGR ('13~'15) 정보보안 제품 1,335,134 1,489,966 1,688,287 1,940,903 2,246,520 2,605,425 3,017,847 5.6% 서비스 400,731 438,442 489,350 553,719 631,980 723,844 829,084 4.6% 합계 1,735,865 1,928,408 2,177,637 2,494,622 2,878,500 3,329,269 3,846,931 5.4% 물리보안 제품 3,394,590 3,535,079 3,830,746 4,048,800 4,281,077 4,541,543 4,825,062 2.0% 서비스 2,124,862 2,284,091 2,501,080 2,729,652 2,964,859 3,209,836 3,467,018 3.7% 합계 5,519,452 5,819,170 6,331,776 6,773,452 7,245,936 7,751,379 8,292,080 2.7% 전체 7,255,317 7,747,578 8,509,413 9,268,074 10,124,436 11,080,648 12,139,011 3.3% * 출처: 한국정보보호산업협회, 2015 국내정보보호산업실태조사 218
전략제품현황분석 4. 기술환경분석 가. 기술개발트렌드 사물인터넷(IoT), 빅데이터등신기술의활성화와관련산업육성을위해서는개인정보의활용을어느수준까지인정할것인가가매우중요한문제임 특히빅데이터, IoT, 클라우드등신기술은데이터수집 이용 제공의패러다임변화로국경없이자 유롭고안전한데이터이동및활용요구가증대되고있는상황으로개인정보의국외이전에대해 엄격하게규정하고있는 정보통신망이용촉진및정보보호등에관한법률 등의개정이요구되는 상황 빅데이터, IoT, 클라우드등모든것이연결된환경에서국가간다양한문화적경제적 법률적다양성등을고려하여개인정보국외이전등에대한연구협력이필요한시점 ( 사물인터넷(IoT) 과개인정보보호) 다양한 IoT 응용분야가발전하고있는상황에서창의적 IoT 제품서비스출현으로기존규제와충돌하거나새로운제도가필요한분야도등장할것으로전 망됨 IoT 센서기기가연결된맞춤형서비스제공시, 해당센서나기기가컴퓨터바이러스나악성코드등에감염되면정보유출이나서비스중단또는신체손상이나생명을위협받게되는상황까지발생가능 IoT 도입후에는사후보안조치가불가능하거나, 高비용이수반되므로이러한신기술도입에대한시장의활성화가지체될수있음 2020년까지약 260 억개의사물이상호연결될것으로전망(Gartner, 14) 특히 IoT 시스템은하나의취약점으로다양한기기에대한공격이가능, 사전에보안위협및취 약점을고려하여서비스설계및구축필요 IoT 시스템을이용하는이용자가언제, 어떻게데이터가공유되는지등을알수없는것이문제가 될수있으므로이를고려한시스템구축이이루어져야하며이용자의개인정보수집최소화는 IoT 이용자를위한가장중요한정보보호원칙임 센서로얻어지는개인정보( 성격, 건강정보등) 가이용자도모르는사이에보험료산정, 고용, 신용및부 동산구매등에영향을미칠수있음 ( 빅데이터와개인정보보호문제) 빅데이터기술의발전으로사적공간의경계가점차모호해지며개인에관한자료들이광범위하게처리되어사생활침해가능성증가 사전동의가어려운개인정보는비식별화조치및수집사실공개등빅데이터처리와관련하여 안전한개인정보활용방안제시필요 정부에서는빅데이터산업활성화및개인정보보호를위해 인 ( 16.6.30) 발표및신기술의도입에따른법제도개선계획수립 개인정보비식별화조치가이드라 219
데이터인텔리전스 - 데이터보안및비식별화 신기술도입에따라기존규제와충돌되는영역은 정보통신진흥및융합활성화등에관한특별법( 일명 ICT 특별법 이라함) 에따른정보통신전략위원회를중심으로법제도를개선하겠다는계획을수립하고, 신제 품 입장 서비스의경우신속처리및임시허가제를활용하여신융합서비스의신속한시장출시를지원하겠다는 나. 주요기술개발및법제개선동향 (1) 해외업체동향 국내에서는규제로인하여활성화되지못했으나해외에서크게성공한사례들이존재함 국내에서는규제로인하여활성화되지못했으나해외에서크게성공한대표적인사례로스마트 폰애플리케이션( 앱) 으로승객과차량을이어주는서비스인우버(Uber) 를들수있음 우버의성공으로우버화(Uberfication) 이라는용어가등장하였는데, 이는소비자와공급자가중개 자없이인터넷플랫폼을통해직접서비스나재화를주고받는것을의미 그러나국외에서의우버의성공과달리한국내에서는불법논란등융합신산업과기존산업과의 충돌로시장진입에실패 우버서비스에대해서는단순한정보제공업이라는우버측의주장과실질적으로택시면허를받지않고택 시영업을하는탈법행위라는정부의입장이대립 또한, 다른유럽국가에서도불법으로판결이나고있는추세( 이탈리아, 스페인, 네덜란드, 프랑스, 독일에서사용금지판결) 이나, 그럼에도불구하고우버는약 680억달러의기업가치를인정받 음 또, 에어비엔비와같이스마트폰등온라인(Online) 으로상품 서비스주문하고오프라인 (Offline) 으로제공해주는서비스형태인 O2O서비스가전세계적으로각광받고있음 자기집의남는방을저렴한가격에단기임대하는서비스로출발한에어비앤비는국내에서도에 어비엔비전용임대업이등장할만큼성장하고있음 국에서 에어비엔비는 2015년 255 억달러의가치로투자를받았는데, 객실하나소유하지않고전세계 193개 220만개이상의객실로숙박서비스를제공 그러나현재숙박공유는 관광진흥법에따라내국인숙박의불법화및 외국인관광도시민박업 으 로등록을해야하는등여러제약이상존 에어비엔비는한국내에서 2 만개이상의객실을확보해서빠르게성장하고있는반면, 2012년 이후 상황 10여개의국내숙박공유기업이등장하였으나에어비엔비와의경쟁을이기지못하고있는 220
전략제품현황분석 한편드론의경우, 현행법상근거리 저고도 취미용목적으로제정되어있어상업적활용이불가능한상황 우리나라는드론에대해 항공법에서규정하고있는데, 자체중량이 12kg 이하이며엔진배 기량 50cc 이하의경우, 스포츠용무선조종모형항공기로간주하여신고없이비행가능. 이기준을초과하는무인비행장치는건설교통부장관에게신고하고, 비행하고자하는경우에는 매비행전에비행계획을수립하여이를승인받도록하고있음 아마존 월마트 알리바바등주요글로벌기업은드론택배상용화를위한테스트를적극추진중 에있으며, 미국 캐나다 일본 호주등주요국은재해예방, 치안관리, 교통관리, 농약살포, 산림 보호등에드론을적극활용 미국개인정보보호정책은연방거래위원회(FTC) 를중심으로함 미국은개인정보보호업무를총괄하는전담부서를정부에두거나민간에두는등의조치즉거버 넌스(Governance) 를명시적으로두고있지않다고평가됨 ( 미국의개인정보보호관련법률의현황) 20 세기에도다양한법률을마련해왔지만, 21세기에는 오바마정부의 Consumer Privacy Bill of Rights ( 소비자프라이버시권리장전) 가두드러짐 오바마(Barack Obama) 정부의개인정보보호관련법제 스마트폰의개인도구로서의이용이확대되는가운데보급의대다수를차지하는 iphone 및 Android 탑재스마트폰메이커는이용자의개인정보보호를위하여다양한대응을진행 오바마정부에서는에드워드스노든(Edward Snowden) 사건등다수의정보유출사건을통해스 마트폰을둘러싼개인정보보호의문제가공론화되고다양한법안이성립 2012 년빅데이터의연구개발을압박하는빅데이터연구개발이니셔티브(Big Data Research and Development Initiative) 와함께소비자의개인정보보호를목적으로한소비자프라이버시권리장 전(Privacy Bill of Rights) 을내세우는등개인정보보호를중시하는정책을취함 오바마정부는디지털경제환경에서미국경제의지속적성장을도모함과동시에미국소비자의 개인정보보호를개선할목적으로온라인프라이버시프레임워크를발표 (12. 2. 23) 221
데이터인텔리전스 - 데이터보안및비식별화 [ 소비자프라이버시권리장전(Consumer Privacy Bill of Rights, CPBR ) 의 7 대원칙 ] 원칙의분류 투명성원칙 (Transparency) 개인정보자기통제권 (Individual Control) 목적외사용등금지 (Respect for context) 취소수집등원칙 (Focused Collection and Responsible Use) 정보보안 (Security) 접근및정확성원칙 (Access and Accuracy) 책임준수 (Accountability) 내용 처리항목, 처리이유, 처리목적, 이용방법, 보존 삭제시기, 제3자제공목적등공개 개인정보수집및이용과정에서정보주체의선택권, 동의철회권등을보장 정보주체가정보제공장시의목적과일치하는범위내에서만기업이개인정보를수집, 이용, 공개할수있다는제한원칙 최소수집 보유원칙, 파기 삭제의무 기술적조치의유지 관리등 열람요구권, 정정요구권등의보장및정확성원칙 프라이버시영향평가(privacy assessments), 프라이버시바이디자인 (privacy by design processes) 의채택, 기업내부의자체평가, 독립적감사, 임직원교육, 수령자에대한감독, 소비자피해구제등 * 출처 : 한국정책연구원 13년 12 월에발생한에드워드스노든사건에서다양한통신을감청한것이폭로되자, 14년 1 월국가안전국(NSA) 의개혁안을발표, 14년 5월에는소비자의프라이버시를중시한빅데이 터정책에관한보고서를공표 15년 1월의일반교서연설전에도오바마대통령은새로운개인정보보호에관하여아래와같은개인정보호정책에관하여발표 [ 2015년 1 월오바마정부개인정보보호정책 ] Personal Data Notification and Protection Act of 2015 ( 개인정보의통지와보호법) 개인정보보호의새로운연방기준을정한법안. 데이터누설의발각후 30 일내에정보가유출한것을고객에게통지할것을기업에게요구 Consumer Privacy Bill of Rights of 2015 ( 소비자프라이버시권리장전) 2012년오바마정부 1 기에제출된법안의부활을목적으로함. 자기의데 이터에관하여무엇을수집하고, 어떻게공유하는가를통제할권리를인터 넷이용자에게부여하는내용 Student Data Privacy Act ( 학생데이터보호법) 교육현장에테크놀러지를투입하는움직임이가속화하는가운데테크놀러지기업이학생에관하여수집한데이터로부터이익을얻는것을금지. 위법안은 2015년 5월에 Edward Markey 상원의원( 민주당, 매세추세츠주) 와 Orrin Hatch 상원의원( 민주당, 유타주) 이제안 * 출처 : 한국정책연구원 222
전략제품현황분석 15년 4 월, 사이버공격에의한개인정보보호를목적으로한사이버시큐리티정보공유법 (Cybersecurity Information Sharing Act : CISA) 안이연방의회의하원을통과하고상원에이송 이법안은 2013년 12 월에발생한에드워드스노든(Edward Snowden) 사건로인하여 2013년에제출 된법안을갱신한것이고, 정부와기업이인터넷의접근상황이나사이버공격의정보공유를목적으로함. 다 만, 동법안에서는사이버공격의정보공유가목적으로되었지만, 기업이정보를제공하는것에대하여소송 등으로부터지킬수있는것이포함되었기때문에, 개인의프라이버시가보호되지않는것은아닌가하는 목소리가높음 프로파일링(Profiling) 의규제 ' 온라인프로파일보고서'(Online Profiling: A Report to Congress(June 2000)) 는열람이력등 의웹등을통하여수집된데이터가통계소비자심리의관점에서지극히상세하게분석된점을지 적(FTC, 00년 6 월) 최근미국에서는 FTC 의주도아래, 온라인상개인행동의추적에기한광고송신에대해서웹상에서 의추적을금지하는 추적금지(Do-Not-Tract) 의틀의도입을장려 2012년 2 월, 오마바대통령은 소비자프라이버시권리장전(Consumer Privacy Bill of Rights, CPBR) 에서명하면서, 추적금지(Do-Not-Tract) 의틀을명기하여이에관련한법안을제출 캘리포니아주( 州 ) 에서는 13년 9 월, 18세미만의미성년자에대한온라인프로파일링을제한하는 규정, 미성년자자신이투고한내용또는정보의인터넷웹사이트로부터의삭제요청에응할의무 를규정한법개정을단행 아동에대한프로파일링에의한마케팅활동이나광고송신을제한하고아동에게일종의 권리 를부여한것으로해석가능 잊혀질 1980년 OECD 는 프라이버시보호와개인정보의국제유통에관한가이드라인에관한이사회 권고 를발표 EU는 1995년개인정보의처리와자유로운이동에관한 EU 개인정보보호지침 (Data Protection Directive, 95/46/EC) 을시작으로본격적으로개인정보에대한통제권강화를위 한노력을경주 유럽연합집행위원회(The European Commission) 는 2012년 1월 25 일, EU 데이터보호규정안 ( 案 )(the EU s Proposed General Data Protection Regulation, GDPR) 을공표 그후유럽연합의회(The European Parliament) 에서심의가이루어지고그수정안에서프로파일링을규제하는조문을추가 2012년 1월 EU 데이터보호규정안은빅데이터의활용과사생활보호를비교적균형있게조화시 키고있다고평가됨 223
데이터인텔리전스 - 데이터보안및비식별화 빅데이터의활용이가능하도록통계처리, 과학연구, 역사기술등의목적을위한개인정보처리에 대하여폭넓은예외를인정하고또한이에대응한사생활보호장치로서 1명시적동의 (opt-in) 원칙의채택즉, 엄격한옵트인제도의도입 2 프라이버시바이디자인(Privacy by design) 즉, 사생활(privacy) 친화적설계 3 설정프라이버시(Privacy by Default), 즉개인정보공개설정제 한 4 프로파일링(profiling) 에대한거부권 5 다이렉트마케팅(direct marketing) 구분고지의무 6잊혀질권리(Right to be forgotten) 7 개인정보보호영향평가(PIA), 8통계목적등을위한개 인정보처리등을규정하고있음 EU 데이터보호규정안( 案 )(GDPR) 제20 조는프로파일링(Profiling) 에대한거부권을규정 이는 1995년제정된 EU 데이터보호지침(the EU's 1995 Data Protection Directive (95/46/EC) 제15조를계승한것 2013년 9월 23일부터 26일에걸쳐폴란드바르샤바에서는약 70개국 500명이참가한프라 이버시에관한최대의회의인 제35 회데이터보호프라이버시커미셔너국제회의 가개최됨 이회의에서는각국의프라이버시커미셔너가출석하여프라이버시의국제적인문제를토의하고 결의를채택하였는데, 프로파일링에대한결의 가만장일치로채택됨 커미셔너들이채택한 프로파일링에대한결의 에의하면프로파일링의실시조건의 6가지에대하 여, 1 프로파일링실시이전에그것에대한필요성과실용성의점검등, 2 합법적목적을위해 필요한한도내에서행해지는데이터의수집과제한등, 3 프로파일링에의해야기된잘못된결과 ( 긍정적이든혹은부정적이든) 의회피내지개선을위한적당한조치의보장등, 4 프로파일링이 실시된것에대한가능한최대한도의정보제공등, 5 특히개인에대한중대한법적효과를가지 거나이익이나지위에영향을미치는그러한결과에관한개인데이터에의액세스권및정정권의 보장등, 6 모든프로파일링이적절한감독을받을것의보장등이열거됨 빅데이터와사물인터넷(IoT, Internet of Things/ mono internet) 을활용한데이터의분석에관해, 데이터로부터생겨나는이익과개인의프라이버시의균형을어떻게취할것인가하는논의가중요 IoT 는사회전체로부터다양한정보를모으고, 빅데이터는모아진광대한범위의데이터를사용하여다양한분석에사용할수있지만, IoT로부터모아진개인정보가빅데이터에의해프라이버시침해위험이높아짐 224 이에, 발라클라바모리셔스(Balaclava, Mauritius) 에서개인정보보호에관한감시기관이나전문 가가모여제36 회데이터보호프라이버시커미셔너국제회의(36th International Conference of Data Protection and Privacy Commissioners) 가개최( 14.10.13~ 14.10.14) 이회의에서는 IoT와빅데이터로인해발생할수있는개인정보보호침해의위험을중심으로논의 되었고, 사물인터넷(IoT) 에서모리셔스선언 (Mauritius Declaration on the Internet of Things) 이공표됨
전략제품현황분석 [ 사물인터넷에서모리셔스선언의주요내용 ] IoT 디바이스로부터모아진정보에의해구성된빅데이터는개인정보로서취급되어야함 IoT 의가치는디바이스뿐만아니라, 데이터를사용하여발생하는서비스에도가치가있음 IoT 는데이터를모으는것이전제이므로, 소비자가 IoT 디바이스를구입하는때에는정보의취급에관하여이해할수있는방법으로전달할필요가있음데이터와개인정보의보호는애초설계단계에서부터고려되어야하고(Privacy by design), 혁신기술의중요한포인트(a key selling point of innovative technologies) 임데이터의처리를디바이스내에처리하는것이시큐리티문제의최소화로이어지지만, 그것이어려운경우에는디바이스간에종단간암호화(end-to-end encryption) 임데이터와개인정보보호에관해서감독하는기관은개별국가의프라이버시관련법의정비를진행하고, 위반이있는경우에는적절한법진행을함다양한과제에대처하기위해서, IoT 에관련된모든관계자( 감독기관및개인등) 는 IoT의도입으로파생하는빅데이터관해서건설적인논의를진행함 * 출처 : 한국정책연구원 2012년 1월 25일공표된 EU 데이터보호규정안( 案 ) 은 2016년 5월 24일 EU 의 일반개인정보 보호규정 (GDPR) 으로서제정되었으며 2018년 5월 25 일적용될예정(GDPR 제99 조) (2016년제정 GDPR 의목적) EU 데이터보호법의범위의확대, 통일성의증대, 기업에대한설명 책임의무의도입, 개인의권리강화, 제재와집행의강화 제재와집행의강화 목적과관련하여주목할만한점은, GDPR을위반한기업에게는기업의전 세계연간매출액의 4% 이하또는 2000 만유로(EURO) 이하의중높은쪽을상한으로하는고액 의제재금이부과될수있다는점임 (2016년제정 GDPR 의주요내용) 영토적관할범위의확대, 정정요청권, 삭제요청권, 자료이동요 구권, 프로파일링등거부권, 사전적설계에의한개인정보보호제도도입, 개인정보영향평가제도 (DPIA) 도입, 원스톱샵제도 (one-stop shop) 도입등 (2016 프라이버시쉴드 협정개요) 2015년 10월무효판결이선고된세이프하버협정에갈음 하여, 2016년 7월 12일유럽위원회와미국상무부는 EU 와미국의 프라이버시쉴드 (EU-US Privacy Shield) 협정을새로체결하고, 2016년 8월 1일부터시행키로함 미국기업이취급하는유럽연합(EU) 것 회원국국민의개인정보의보호에더욱더강한의무를꾀할 미국의정부와공공기관에의한접근에대하여명확한안전성조치와투명성의무규정을마련 유럽연합(EU) 회원국국민을위한효과적인권리구제방안마련 미국기업에대해서는법령준수가이루어지고있는지미국상무부가정기적으로검토내지검증하며, 국가안전보장목적의미국의정부나공적기관의활동에관해서는무차별적이고대규모의개인정보데이터의모니터링이나감시를금지 225
데이터인텔리전스 - 데이터보안및비식별화 ( 프라이버시쉴드미준수시대응방안) EU 회원국국민인경우누구든지이의를제기할수있음 또한기업에직접신청하는방법이외에도, EU 의데이터보호기관(EU Data Protection Authorities : DPA), 미국상무부나연방거래위원회(FTC) 에순차로이의제기가능 이러한방법으로해결되지않으면마지막수단으로조정( 중재) 있음 서비스를이용할수있는제도도 (2016 프라이버시쉴드 협정평가) 본협정이미국정부나기업으로부터 EU 회원국국민들 의개인정보가수집됨으로써초래되는개인정보침해위험으로부터의안전항(safe harbour) 이 될수있는지여부는향후유럽사법재판소와 추이를지켜볼필요가있음 EU회원국의개별사건에대한판결에달려있어그 일본의개인정보보호법개요로는 2003년에제정한개인정보관련 5법에따라아래와같이구분 1 공공부분, 민간부분을통괄하는기본법에의한규율( 개인정보보호법제1 장~ 제3 장), 2 민간분 야를관장하는개인정보보호법( 동법제4 장이하), 3 공공부분에관한규율( 국가에관한행정기관 개인정보보호법, 독립행정법인등개인정보보호법, 지방자치단체에관한각지방공공단체의개인정 보보호조례) 등의형태로확립되어있음 그후 2013년 5 월성립한번호이용법( 番號利用法 ) 이이들개인정보보호법제의특별법으로서 지위를가지면서제정됨 2015년 9월개인정보보호법및독립행정법인등개인정보보호법이개정 신기술등장과일본의개인정보보호관련법제최근동향으로는일본의 2015년개인정보보호 법의개정에서는경제단체나소비자단체를비롯한다수의관련단체가각각다른입장에서말한 주장을조정하면서반영하였으며 2015 년개인정보보호법과번호이용법( 番號利用法 ) 이개정함 2005년 4 월개인정보보호에관한법률(2003.5.23. 제정) 이시행된후 10년이경과되어그간의 신기술의변화와동향을반영 행정절차에서특정개인을식별하기위한번호의이용등에관한법률( 이하 번호이용법 ) 은 2013 년 5월 31 일에공포된이후, 번호제도도입을위한정성령( 政省令 ) 등의정비나시스템의구축, 주 지광범위한홍보등이이루어짐 2015년 10 월에는개인번호( マイナンバー, my number) 가통지되고, 2016년 1월에는개인번호 (my number) 의이용이개시됨 226
전략제품현황분석 일본의 " 행정절차에서특정개인을식별하기위한번호의이용등에관한법률 에따른개인식 별번호로서각시정촌( 各市町 ) 또는특별구에서그주민에게지정된 12 자리의번호로부과금, 사 회보장, 재해대책등을위해사용 일본의 2015년개정개인정보보호법은개인식별부호를개인정보범위에포함하고익명가공정보 를개인정보를개인정보에서제외하는등개인정보의정의를명확히하여사업자의개인정보 이용활성화가가능하도록하는함 익명가공정보( 匿名加 情報 ) 란많은정보를특정개인을식별할수없도록가공하여얻어진개인정보로써해당개인정보를복원할수없도록하여, 빅데이터로활용할수있도록한것 개인정보유통경로를추적할수있도록개인정보수령자가제공자및수령경위를확인하고일정 기간보존하도록하고, 부정한개인정보유출시의벌칙을신설하는한편, 개인정보보호위원회를 신설하는등소비자를위한개인정보보호강화내용을포함 227
데이터인텔리전스 - 데이터보안및비식별화 (2) 국내업체동향 빅데이터, AI, IoT 등의응용분야가발전하고있는상황에서창의적인첨단 IT를활용한비즈니 스가더욱성장할것으로보임 그러나신기술을개발하고그에대한지식재산권을취득하더라도정부의각종규제로인해시장에서활성화되지못하는경우가발생하고있고, 가장큰장애요인으로개인정보보호관련법을꼽을수있음 우리나라현행주요법령상의개인정보정의조항은그범위가광범위하여영업의자유를제한할뿐 아니라빅데이터나클라우드와같이새로운산업의발전의장애요인으로작용 한편, 현실적으로개인정보활용에대한정보주체의사전동의를받기곤란한경우가존재하므로이를개선해달라는신기술산업관련업계의요구가존재하였음 [ 신기술산업활성화장애사례예시및개선방안 ] 기술분야개인정보보호법으로인한애로사항개선방안 빅데이터와 AI, 핀테크 AI를활용하여신용카드거래내역이나증권거래내역을데이터베이스(DB) 화해거래패턴과지출을예측하는분석시스템을개발 이용하기위해서는고객들의개별서면동의가필요 비식별개인정보의경우에는개별고객동의없이자유로운활용이가능하도록개선필요 자율주행자동차 자율주행자동차의운행을위해이웃하는자동차소유자에위치정보제공동의를받아야할필요 위치정보사업자가사물위치정보에한해소유자의사전동의없이도수집가능하도록개선필요 드론 드론이비행할때충돌을예방하기위해상호위치정보를교환할필요가있는데, 이때사물위치정보를처리하기위해소유자동의필요 위치정보사업자가사물위치정보에한해소유자의사전동의없이사물위치정보처리가능하도록개선필요 * 출처 : 한국정책연구원 현재우리나라는글로벌스탠더드에맞게개인정보보호관련법체계개선노력을하고있지만, 개인정보가실질적으로보호되면서도안전하게활용될수있을지는여전히미지수임 우선 개인정보비식별화조치가이드라인 이마련되었지만, 현행법상식별가능성이남아있는정보의사용에는정보주체의사전동의가필요하므로동가이드라인이얼마나효용성이있을지의문임 228
전략제품현황분석 완전히개인식별력이제거된데이터(anonymous data) 는빅데이터산업에서상업적이용가치가 적고, 상업적가치가높은것은빅데이터내에서개인식별가능성이남아있는정보 (pseudonymous data) 임 또 개인정보비식별조치가이드라인 은정보주체를알아볼수없도록비식별조치를수행한비 식별정보는개인정보가아니라보고, 정보주체자의동의없이빅데이터분석등에활용할수있 도록함 그러나철저하게비식별화조치를하더라도업무권역간정보를상호결합하여누구의정보인지 를다시구분해내는재식별화를완전히방지하기어려움 가이드라인에서도 다만, 비식별정보도기술발전, 데이터증가등에따른재식별가능성이있음을 고려해재식별방지를위한기술적 관리적안전조치등을통해안전하게활용되고관리돼야한다" 고명시하고있어비식별정보의재식별가능성을언급 비식별정보에대한기술적관리적안전조치가필요함은물론이며, 안전조치를하였음에도문제가 발생하는경우등을대비하여, 개인정보비식별정보유통에대한법체계의정비가필요 신기술활성화를위한국내법제개선동향으로정부는신기술도입에따라기존규제와충돌되는영역의법제도를개선하고, 신제품서비스의경우신속처리및임시허가제를활용하여신융합서비스의신속한시장출시를지원하겠다는입장 정부는신기술활성화를위해 개인정보비식별화조치가이드라인 을발표하였음 그러나가이드라인은법적효력이없으므로, 필요 추후법적문제가발생한소지가있어법률정비가 현행개인정보보호법제는개인의자기정보결정권의보장을위하여개인정보의수집이용제공 등라이프사이클에맞춘규제일변의규율체계를갖추고있음 개인의기본권보장을위하여이러한규제는어느정도바람직하지만변화하는환경에맞춰조화 를이룰필요가있음 그러나현행정보통신망법의개인정보수집 이용 제공및국외이전규정은시장환경의변화및글 로벌트렌드를반영하지못하고있었음 이러한측면에서현재입법예고되거나국회계류중인개인정보관련개정안은신기술산업활성화를위한개선방안과함께개인정보자기결정권보장도함께꾀하려한다는점에서의미가큼 229
데이터인텔리전스 - 데이터보안및비식별화 다. (1) 기술인프라현황 비식별화기술현황 비식별화된개인정보는상황에따라재식별가능성이존재하기때문에비식별화기술에대한개 별화가능성, 연결가능성, 추론가능성등 3가지위험성을다시검토해야함 ( 개별화가능성, single out) 가능성 데이터셋에서특정레코드의일부혹은전체가한개인에게대응될 ( 연결가능성, linkability) 최소 2개이상의레코드들이동일한데이터주체를가리켜서로연결될 가능성 음 ) ( 모든레코드가동일한데이터베이스에존재할필요는없고특정개인에대응될필요도없 ( 추론가능성, inference) 데이터셋의속성값들로부터특정개인에해당하는임의의속성값을상당히높은확률로유추할가능성 [ 비식별화기술 17 종위험도비교 ] 구분 비식별화기술 개별화 가능성위험 연결 가능성위험 추론 가능성위험 휴리스틱가명화 Yes Yes Yes 암호화 Yes Yes May not 무작위화 일반화 기타 교환방법 Yes Yes May not 재배열 Yes May not May not 임의잡음추가 Yes May not May not 총계처리기본방식 부분총계 라운딩 식별자부분삭제 감추기 랜덤라운딩 범위방법 제어라운딩 공백과대체 일반적으로 No 일반적으로 Yes 일반적으로 Yes 식별자삭제해당없음해당없음해당없음 레코드삭제해당없음해당없음해당없음 식별요소전부삭제해당없음해당없음해당없음 * 출처 : ARTICLE 29 DATA PROTECTION WORKING PARTY, Opinion 05/2014 on Anonymisation Techniques, 2014. 4. 10, 재구성 230
전략제품현황분석 비식별화기술 17 종에대한개별화가능성, 연결가능성, 추론가능성정도는각기술에따라 다름 무작위화방법의경우대부분개별화가능성에대한위험이있으며특히, 위험이매우높기때문에다른비식별화기술과함께사용해야함 가명화방법은재식별 일반화방법의경우개별화가능성은낮지만연결가능성과추론가능성이높음 비식별화시한기술만이용할경우재식별화위험이있기때문에여러비식별화기술을조합하여 사용해야함 비식별화된데이터는이미공개된혹은앞으로추가로공개될데이터와결합하여재식별화될 가능성이있음 미국의매사추세츠주사례로서미국매사추세츠주의단체보험위원회는연구목적으로공무원병 원진료기록을아래와같이공개함 식별자인이름, 주소, 사회보장번호(SSN) 은모두제거 준식별자인우편번호(ZIP), 생년월일, 성별등은공개 하버드대학교의 L.Sweeney가공개된진료기록에서개인재식별성공 매사추세츠주케임브리지시선거인명부구입후비교하여주지사를포함해개인정보재식별 America Online (AOL) 사례( 미국, 2006) 로서학술연구를위해 65만명의 3개월분검색로그 2 천만건을공개 개인을식별할수있는 ID와 IP 주소는비식별화함 단, 유용성확보를위해 ID 를특정번호식별자(AnonID) 로치환 <AnonID, Query, QueryTime, ItemRank, ClickURL> 형태로공개 뉴욕타임즈기자 2명이 AnonID 4417749 사용자재식별성공 해당 AnonID 사용자는조지아주릴번에거주하는 62세미망인 Thelma Arnold 여사였음 질의문에포함된 numb fingers, 60 single men, dog thaturinates on everything, landscapers in Lilburn, GA, homes sold in shadow lake subdivision gwinnett county georgia 등다수의개인정보를통해 Thelma Arnold 여사를식별해냄 검색로그공개일주일만에데이터공개중지및대중에게사과 관련연구자와해당상사는해고되고 AOL의 CTO는사임함 Netflix 사례( 미국, 2006) 로서영화추천알고리즘의정확성을높이기위한경연대회 Netflix Prize 를위해 50만이용자의 6년동안영화평점 1억건을공개 이름등식별자삭제하되, 데이터처리내용을연결하기위해독특한식별자사용 평가점수, 평가일시는공개 231
데이터인텔리전스 - 데이터보안및비식별화 텍사스대학연구팀은온라인영화전문사이트인 IMDb46) 에공개된사용자리뷰와 Netflix가공개 한영화평점데이터를결합하여개인재식별성공 미국 FTC의프라이버시문제지적으로제2회경연은취소됨 (2) 비식별화관련소프트웨어현황 학계를중심으로개인정보비식별화소프트웨어개발 잘알려진프라이버시모델(k- 익명성, l- 다양성, t- 근접성) 뿐만아니라다양한프라이버시모델50) 을기반으로비식별화작업을수행하거나, 재식별화위험도를분석하거나, 사용되는프라이버시 모델에적당한파라미터를추천하는등다양한기능제공 [ 비식별화소프트웨어현황 ] 비식별화소프트웨어 ARX Data Anonymization Tool UDT Anonymization Toolbox Cornell Anonymization Toolkit TIAMAT SECRETA Open Anonymizer ANON tool uargus sdcmicro PARAT 공개여부 공개소프트웨어 상업소프트웨어 출처 : 소프트웨어정책연구소 ARX Data Anonymization Tool : Java 기반의비식별화툴로서최근 ARX3.4.1 버전공개 출처 : 소프트웨어정책연구소 [ ARX Data Anonymization Tool 주요화면 ] 232
전략제품 현황분석 UDT Anonymization Toolbox : UT Dallas의 Data Security and Privacy Lab에서 개발한 비식 별화 툴로 앱과 라이브러리 형태로 공개됨 Cornell Anonymization Toolkit : Cornell 대에서 개발하여 공개한 비식별화 소프트웨어로서 다 양한 공격자 모델을 대응할 수 있게 한 대화형 디자인이 특징 출처 : 소프트웨어 정책 연구소 [ Cornell Anonymization Toolkit 주요 화면 ] TIAMAT : 데이터를 공개하는 기관이 쉽게 파라미터 값을 선택하여 적절한 k-익명화 등을 수행할 수 있도록 도와주는 공개 소프트웨어 출처 : 소프트웨어 정책 연구소 [ TIAMAT 주요 화면 ] 233
데이터인텔리전스 - 데이터보안및비식별화 SECRETA : 공개소프트웨어 관계형데이터베이스데이터에대해비식별화알고리즘간평가와비교를제공하는 출처 : 소프트웨어정책연구소 [ SECRETA 주요화면 ] Open Anonymizer : k- 익명화개념을기반으로데이터레코드를일반화하는비식별화공개소프 트웨어 ANON tool : k- 익명화기반비식별화공개소프트웨어 μargus : 안전한개인정보파일을생성하기위해설계된비식별화공개소프트웨어 출처 : 소프트웨어정책연구소 [ μargus 주요화면 ] 234
전략제품 현황분석 sdcmicro : R 언어 기반의 비식별화 공개 프로그램 PARAT : 비정형화 및 정형화된 데이터 모두에 적용 가능한 상업 소프트웨어 출처 : 소프트웨어 정책 연구소 [ PARAT 주요 화면 ] 235
데이터인텔리전스 - 데이터보안및비식별화 (3) 비식별정보유통관리체계 비식별조치가이드라인 은비식별조치를했더라도불특정다수에게공개될경우재식별가능성 이있다고보아비식별정보의공개는원칙적으로금지하고있음 비식별조치가이드라인 은 1 외부평가단을통한비식별조치의적정성평가, 2 전문기관을 통한기업간결합DB 작업지원의관리체계를제시하되, 3 각산업별비식별조치의구체적 내용(k- 익명성수치등) 은전문기관에위임하고있음 한국인터넷진흥원에개인정보비식별지원센터를설치하고, 각부처별로전문기관을지정 운영하며전문기관실무협의회를운영할예정임 하지만실제개인정보의비식별조치후제3자제공현황또는기업간결합DB 대한관리체계는미흡한상황임 작업현황에 외부평가단의구성은개인정보보유기관의자율에맡겨져있고, 개인정보비식별조치 DB가 유통되면서기관내부에서이뤄지는융합분석에대해서는재식별금지의무위반시제재규정만 존재함 따라서개인정보보호법제18조제2항제4 호에근거한비식별정보의유통현황을조사 감독 관리할체계가필요함 일본에서개인정보보호위원회를새로이강화하고, 최근통과된 EU의 GDPR에서독립적인개인정 보보호감독기관에게실질적인조사권과교정권을부여하는점을참고할필요있음 개인정보보호법개정을통해개인정보보호위원회에법적권한을부여하고, 해관리 감독하는체계가합리적임 한국인터넷진흥원을통 236
전략제품 현황분석 라. 특허동향 분석 (1) 연도별 출원동향 데이터 보안 및 비식별화 기술의 지난 7년( 10~ 16)간 출원동향20)을 살펴보면 연도별 출원경 향이 전체적으로 2010년도를 시작하여 꾸준히 증가되는 경향을 보이다가 2014년도 이후 조 금씩 감소되는 경향을 보이고 있음 각 국가별로 살펴보면 한국의 출원경향은 2014년도까지 꾸준히 증가하는 경향을 나타내고 있음, 미국은 2013년도까지 급증하다가 이후 조금씩 감소되는 경향을 보이고 있음, 일본은 소폭 큰 증 금폭 없이 점차로 증가하는 경향을 보이고 있음 국가별 출원비중을 살펴보면 미국이 전체의 76%로 최대 출원국으로 데이터 보안 및 비식별화 기술을 리드하고 있는 것으로 나타났으며, 한국이 11.3%, 유럽은 7.1%, 일본은 5.6% 순으 로 나타남 [ 데이터 보안 및 비식별화 기술 연도별 출원동향 ] 20) 특허출원 후 1년 6개월이 경과하여야 공개되는 특허제도의 특성상 실제 출원이 이루어졌으나 아직 공개되지 않은 미공개데이터가 존재하여 2015, 2016년 데이터가 적게 나타나는 것에 대하여 유의해야 함 237
데이터인텔리전스 - 데이터보안및비식별화 (2) 국가별출원현황 한국의출원현황을살펴보면미국에비하여출원건이크지않지만, 14까지꾸준히증가하는경향을나타내고있음 한국은 2010~2013년도에는외국인비중이 50% 미만수준에서점차로비중이줄어드는것으로 주로국내출원인의비중이높아지고있는특징이있음 미국의출원현황은출원건수가꾸준히출원건수가증가하다가 유지하고있는점이특징임 2014년부터조금씩감소추세로 2010년도이후미국의외국인출원이 10% 정도로최근까지이러한추세가나타나고있어, 타 국가에비해내국인출원이절대적인다수로이루어지고있는것이특징으로나타남 일본의출원현황은 10년도이후부터소폭증감추세를나타내면서유지되는경향을보이고있 음, 내외국인비중은외국인이 60% 이상으로외국인출원이높은경향을보이고있는점이특 징임, 유럽의경우에는소폭증가추세를보이고있으며, 외국인비중이전체 60% 로외국인 비중이타국가보다높은것으로나타남 [ 국가별출원현황 ] 238
전략제품현황분석 데이터보안및비식별화기술 분야의투입기술을확인하기위하여특허분류코드인 IPC Cod e 21) 를통하여살펴본결과가장많은비중을차지하고있는 IPC는 G06F 분야가가장많은 377 건으로나타났으며, G06Q이 275 건, H04L이 170건으로 G06F분야가대다수를차지하고 있음 이외에 H04W 40 건, H04M 19 건, H04N 19 건, G06K 13 건, G08B 9 건, A63F 5 건, G06N 5 건등의기술이투입되어있어데이터보안및비식별화기술분야에다양한기술이존재하지 만, 디지털데이터처리분야에집중되고있음 더불어해당 IPC의특허인용수명을살펴보면 H04R로서기술분야의수명이 9년으로가장긴것으 로나타났으며, G06Q 기술분야는 4년으로가장짧은것으로분석 [ 데이터보안및비식별화기술분야상위투입기술 ] IPC 기술내용특허인용수명 (TCT) 22) G06F 전기에의한디지털데이터처리 6년 G06Q 관리용, 상업용, 금융용, 경영용, 감독용또는예측용으로특히적합한데이터처리시스템또는방법 ; 4 년 H04L 디지털정보의전송 6년 H04W 무선통신네트워크 4년 H04M 전화통신 7년 H04N 화상통신 7년 G06K 데이터의인식; 데이터의표시; 기록매체; 기록매체의취급 7년 G08B 신호또는호출시스템; 지령발신장치; 경보시스템 7년 A63F 카드게임, 보드게임또는룰렛게임; 작은움직이는물체를사용하는실내용게임; 그밖에분류되지않는게임 8 년 G06N 특정계산모델방식의컴퓨터시스템 4년 21) 전세계적으로통용되고있는국제특허분류(IPC: International Patent Classification) 를통해특허정보기술분야에서공지기술을조사할수있으며, 기술및권리정보에용이하게접근가능 22) 특허인용수명지수는후방인용(Backward Citation) 에기반한특허인용수명의평균, Q1, Q2( 중앙값), Q3 에대한통계값을제시함. 특히이와같이산출된 Q2는 TCT(Technology Cycle Time, 기술순환주기또는기술수명주기) 라고부름 239
데이터인텔리전스 - 데이터보안및비식별화 투입기술이가장많은 G06F 분야와융합이높게이루어진기술은 H04L 분야로나타났으며, G06Q, H04W 분야와도나타융합된기술의건수가높은것으로분석 이외에 G06Q 분야와융합된기술은 H04L, A63F, H04N 분야와융합된기술이많은것으로나 타났으며, H04L 분야와융합된기술은 G06N, H04W, G08B 기술로분석됨 [ 데이터보안및비식별화기술분야 IPC 기술및융합성 ] (4) 주요출원인분석 앞서국가별특허건수에서미국이가장많은특허를출원하고있는것으로나타났으며, 출원인에서도미국출원인이다수를차지하고있으며, 한국, 일본이일부포함된것으로나타 남 상위 주요상위출원인을살펴보면미국의 Facebook, IBM, Google, Microsoft, Intel 등이등장하고있으 며, 한국의중앙대학교가본분야에상위그룹에포함된것이특징임, 일본은 Sony사가상위그룹에포 함됨 미국출원인들은대부분미국위주의출원을하고있으며, 3극출원은 Facebook이여러주요 국가에활발한출원을하고있으며, 나머지기업들은자국위주의출원으로집중하고있는점 이특징임 240
전략제품현황분석 피인용지수에대한통계에서는 Broadcom에서 21.5 로많은수치를기록하고있으며, 5.71로 Zynga 사가있음, 나머지회사는수치가크지않아기술력을비교분석하기에는큰편차를보 이지않은수준으로나타나고있음 주력기술분야는 SNS 상익명, 개인사용공간마련기술, 개인식별정보ㅈ거기술, 정보유출방지 기술등이주요연구개발대상으로하고있는것으로나타남 [ 주요출원인의출원현황 ] 주요출원인 국가 주요 IP 시장국 ( 건수 %) 3극패밀 IP시리수 한국미국일본유럽 장국 종합 ( 건) 피인 용지 수 주력기술분야 Facebook 미국 59 9 6 0% 80% 12% 8% 미국 32 3.56 SNS상익명, 개인활용공간마련기술 IBM 미국 36 1 1 0% 95% 3% 3% 미국 0 2.21 위해성평가지표관리, 활용 Google 미국 36 0% 100% 0% 0% 미국 4 2.44 개인보안검색기술 Microsoft 미국 3 14 1 4 14% 64% 5% 18% 미국 2 2.72 개인식별정보제거기술 Intel 미국 6 3 2 0% 55% 27% 18% 미국 5 7 개인정보암호화기술 Zynga 미국 10 1 0% 91% 0% 9% 미국 0 5.71 SNS 상개인보안식별정보기술 Sony 일본 8 1 1 0% 80% 10% 10% 미국 2 1.33 개인콘텐츠보안기능부여기술 중앙대학교 한국 9 100% 0% 0% 0% 한국 0 0 SNS 상정보유출방지기술 Qualcomm 미국 1 5 2 0% 13% 63% 25% 일본 8 1.33 개인식별정보제거기술 Broadcom 미국 5 2 0% 71% 0% 29% 미국 0 21.5 SNS 상개인식별정보분리기술 241
데이터인텔리전스 - 데이터보안및비식별화 (5) 국내출원인동향 국내출원인동향을살펴보면대기업은케이티, 엘지전자, 엘지텔레콤등통신사가포함되었으 나, 특허건수의수치는낮음, 다수의중소기업이등장하고있으나, 특허가적어활발한연구개 발을하고있지않은것으로나타남 기업이외의주요출원인에서연구소는전자통신연구원이외에는적게참여하고있으며, 출원도수소의대학이참여하고있는것으로나타남 대학의 [ 국내주요출원인의출원현황 ] 242
전략제품현황분석 5. 가. 중소기업환경 중소기업경쟁력 데이터보안및비식별화분야의중소기업경쟁력은시장에서의역할이점차커지는분야로나타났으나, 정부의규제및비식별화부분은기술력을요구하는분야로중소기업의경쟁력이낮은것으로분석됨 [ 데이터보안및비식별화분야중소기업현황 ] 기술분류주요기술대기업중소기업중소기업참여영역중소기업 참여정도 개인정보보안 익명처리기술, 총계처리, 범주화기술, 데이터값삭제기술, 데이터마스킹기술, 교환방법기술, 휴리스틱기술 LG CNS SK 텔레콤 KT 소만사 익명기술휴리스틱데이터마스킹기술 보안인텔리전스 보안정보및이벤트관리기술, 실시간데이터보안기술 LG CNS SK 텔레콤 KT 펜타시큐리티퓨처시스템 실시간데이터보안기술 데이터보안 데이터분석기반이상접근탐지, 데이터베이스액티비티모니터링, 데이터암호화엔진기술, 머신러닝기술 LG CNS SK 텔레콤 KT 펜타시큐리티퓨처시스템 데이터분석기반이상접근탐지, 데이터암호화엔진기술 * 중소기업참여정도와점유율은주요제품시장에참여하는중소기업의참여규모와정도( 업체수, 비율등) 를고려하여 5단계로구분 ( 낮은단계:, 중간단계(,, ) 높은단계: ) 243
데이터인텔리전스 - 데이터보안및비식별화 나. 중소기업기술수요 데이터보안및비식별화 분야의중소기업의기술수요를파악하기위하여중소기업기술수요조사 및중소기업청 R&D 신청과제(2013~2015 년) 를분석한결과아래표의내용과같은수요들이다 수있는것으로분석 데이터보안및비식별화분야중소기업은최근에보안기술과관련된기술개발에다수수요가있는것으로나타났으며, 이는빅데이터기술에대한관심이높아지고있는추세를반영한것으로분석됨 [ 데이터보안및비식별화분야과제신청현황및수요조사결과 ] 전략제품기술분류관심기술 개인정보보안 익명처리기술, 총계처리, 범주화기술, 데이터값삭제기술, 데이터마스킹기술, 교환방법기술, 휴리스틱기술 데이터보안및비식별화 보안인텔리전스보안정보및이벤트관리기술, 실시간데이터보안기술 데이터보안 데이터분석기반이상접근탐지, 데이터베이스액티비티모니터링, 데이터암호화엔진기술, 머신러닝기술 244
전략제품현황분석 다. 중소기업핵심기술 (1) 데이터기반요소기술발굴 데이터보안및비식별화기술의특허및논문데이터검색을통해도출된유효데이터를대상으로데이터마이닝기법(Scientometrics 기법) 을통해클러스터링된키워드의연관성을바탕으로요소기술후보군을도출 데이터보안및비식별화기술의특허및논문유효데이터를기반으로키워드클러스터링을통하 여 10개의요소기술후보군을도출 제품별 dataset 구축 : 데이터보안및비식별화기술관련특허/ 논문데이터를추출하여노이즈 제거후제품별 dataset 구축 1 차클러스터링 : 키워드맵을통한고빈도키워드확인- 빈도수(tf-idf) 23) 가상위 30% 에해당하 는키워드를대상으로 1차추출 2 차클러스터링 : 1차클러스터링에서추출된고빈도키워드사이에서고연관도키워드를 2차추 출 ( 고연관도기준은연관도수치24) 가 2 이상인클러스터로제한) 다음그림은키워드간연관네트워크를시각화한것으로, 간의연관도를나타내는직선으로구성 각키워드를나타내는원과키워드 각키워드가특허와논문중어느데이터에서도출되었는지원의색으로구분하였으며, 도출된클러스터는황색음영으로표시 키워드로 키워드를나타내는원은고빈도의키워드일수록원의크기가크게표현되며, 선은키워드사이의연관도수치가높을수록굵게표현 연관도를나타내는 데이터보안및비식별화기술전략제품의특허논문유효데이터에대하여키워드클러스터링 결과를기반으로요소기술도출 데이터기반의요소기술도출은키워드클러스터링을통해도출된요소기술에대하여전문가의 검증및조정을통하여요소기술을도출 23) 빈도수(tf-idf) : 각키워드가출현되는특허또는논문수를의미 24) 연관도수치: 두개이상의키워드사이의특허또는논문수를의미 245
데이터인텔리전스 - 데이터보안및비식별화 [ 데이터보안및비식별화분야키워드클러스터링 ] [ 데이터보안및비식별화분야주요키워드및관련문헌 ] No 주요키워드연관도수치관련특허/ 논문제목 클러스터 01 social network, context 6~8 1. Finding people using social networks 2. Method and apparatus to enhance security and/or surveillance information in a communication network 3. Security and privacy issues of big data 클러스터 02 privacy control, level 4~6 1.USER-GENERATED CONTENT PERMISSIONS STATUS ANALYSIS SYSTEM AND METHOD 2. PRIVACY CONTROLLED NETWORK MEDIA SHARING 3. Special issue on Security, Privacy and Trust in network-based Big Data 클러스터 03 security, account 6 1. SYSTEM AND METHOD FOR LOCATING AND ACCESSING ACCOUNT DATA 2. Computer apparatus and method for illustrating, issuing, and managing disability coverage for retirement plans with individual 246
전략제품현황분석 No 주요키워드연관도수치관련특허/ 논문제목 accounts 3. Efficiently managing the security and costs of big data storage using visual analytics 클러스터 04 big data, machine 4~6 1. Systems and methods for management of secure data in cloud-based network 2. Autonomous data machines and systems 3. Real time BIG data analytic: Security concern and challenges with Machine Learning algorithm 클러스터 05 클러스터 06 클러스터 07 protection, search engine user identifier, trust level social context, managemen t 6~8 8 4 1. Techniques for providing protection against unsafe links on a social networking website 2. METHOD AND SYSTEM OF PRIVACY PROTECTION IN ANTAGONISTIC SOCIAL MILIEU/DARK PRIVACY SPOTS 3. Real time BIG data analytic: Security concern and challenges with Machine Learning algorithm 1. Network application security utilizing network-provided identities 2. METHOD AND APPARATUS FOR PROVIDING SOCIAL NETWORK BASED ADVERTISING WITH USER CONTROL AND PRIVACY 3. Security problems and challenges in a machine learning-based hybrid big data processing network systems 1. Method for using market-based social networking website to create new funding and referral fees 2. Method and system for alphanumeric indexing for advertising with cloud computing 3. Privacy and security of Big Data: Current challenges and future research perspectives 클러스터 08 security model, managemen t 6 1. Secure social web orchestration via a security model 2. Automatic social graph calculation 3. Big security for big data: Addressing security challenges for the big data infrastructure 클러스터 09 identify theft, individual 4~6 1. Determining Identity Of Individuals Using Authenticators 2. SYSTEMS AND METHODS FOR GENERATING, MANAGING, AND SHARING DIGITAL SCRIPTS 3. Research advances on big data security and privacy preserving 클러스터 10 mobile lock, question 4 1. Mobile lock with retractable cable 2. PRESERVING IMAGE PRIVACY WHEN MANIPULATED BY CLOUD SERVICES 3. A study on the big data log analysis for security 247
데이터인텔리전스 - 데이터보안및비식별화 [ 데이터보안및비식별화분야데이터기반요소기술 ] No 요소기술명키워드 요소기술 01 익명처리 Pseudonymisation 요소기술 02 총계처리 Aggregation 요소기술 03 데이터값삭제 Data Reduction 요소기술 04 범주화 Data Suppression 요소기술 05 데이터마스킹 Data Masking 요소기술 06 보안정보및이벤트관리 Security information and event management 요소기술 07 데이터분석기반이상접근탐지 Abnormal Access Detection based on Analytics 요소기술 08 데이터베이스액티비티모니터링 Database activity monitoring 248
전략제품현황분석 (2) 요소기술도출 산업시장분석, 기술( 특허) 분석, 전문가의견, 타부처로드맵, 중소기업기술수요를바탕으로로드맵기획을위하여요소기술도출 요소기술을대상으로전문가를통해기술의범위, 요소기술명확정 요소기술간중복성등을조정검토하여최종 [ 데이터보안및비식별화분야요소기술도출 ] 분류요소기술출처 익명처리 기술/ 시장분석, 특허/ 논문클러스터링, 전문가추천. 총계처리 기술/ 시장분석, 특허/ 논문클러스터링, 전문가추천 개인정보보안 데이터값삭제 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 범주화 기술/ 시장분석, 기술수요, 전문가추천, 특허/ 논문클러스터링 데이터마스킹 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 보안인텔리전스 보안정보및이벤트관리 데이터분석기반이상접근탐지 기술/ 시장분석, 기술수요, 전문가추천, 특허/ 논문클러스터링 특허/ 논문클러스터링, 전문가추천 데이터보안 데이터베이스액티비티모니터링 데이터암호화엔진 기술수요, 특허/ 논문클러스터링, 전문가추천기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 249
데이터인텔리전스 - 데이터보안및비식별화 (3) 핵심기술선정 확정된요소기술을대상으로산학연전문가로구성된핵심기술선정위원회를통하여중소기업 에적합한핵심기술선정 핵심기술선정은기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업적합 성(10) 을고려하여평가 [ 데이터보안및비식별화분야핵심기술 ] 분류핵심기술개요 개인정보보안 익명처리 총계처리 범주화 성명등개인의고유특징으로식별이가능한데이터에대하여직접적으로식별할수없는다른값으로대체하는기법으로서그자체로는완전비식별화가가능하면서데이터의변형, 변질수준이낮아야하며일반화된대체값으로익명처리를하는기술개인정보에대하여통계값( 전체혹은부분) 을적용하여특정개인을판단할수없도록하기위한기법으로개인과직접관련된날짜정보( 생일, 자격취득일), 기타고유특징등을대상으로하며민감한정보에대하여비식별화가가능하며다양한통계분석( 전체혹은부분) 용데이터셋작성에유리한기술 단일식별정보를해당그룹의대표값으로변환( 범주화) 하거나구간값으로변환( 범위화) 하여고유정보추적및식별방지하기위한기법으로서쉽게개인을식별할수있는정보( 주소, 생년월일등), 고유식별정보등을대상으로하며범주나범위는통계형데이터형식이므로다양한분석및가공이가능한기술 보안인텔리전스 데이터보안 보안정보및이벤트관리데이터분석기반이상접근탐지데이터베이스액티비티모니터링데이터암호화엔진 보안및네트워크데이터에대해실시간, 이력성누적이상패턴탐지, 개인정보, 이메일, 소셜미디어, 업무데이터, 기기데이터등다양하고방대한데이터에대한분석을통하여특정조직이나기관의네트워크를타겟으로하는사이버테러위협에대하여능동적으로감사하는기술 대형텔레커뮤니케이션회사를대상으로고객이사용하는디바이스유형과동일한다른디바이스가동시에사용되거나하나의디바이스에서두개의고객접속현황이탐지되거나동일번호가동일시간대에두개의지역에서감지되는등의이상접속을탐지하고데이터사용이나음성통화등이임계치를초과하거나특정위험지역군에서송수신되는이벤트를탐지하는기술 애플리케이션성능저하없이개인정보모니터링및감사환경을구축하여사용자활동이나내부특권자활동, DB 별권한제어내역에대한실시간모니터링을제공하며사용자의기간계, DW 정보계등전사환경에대한통합관제플랫폼으로서법적규제준수, 자동감사리포트를제공하기위한기술 빅데이터내민감한정보의안전한저장및관리를제공하기위하여정형/ 비정형데이터에대한암호화를제공하며개인정보에대한법적규제를준수하고애플리케이션의성능과인프라의변경을최소화하면서이기종의다양한데이터유형에대한유연한확장을제공하기위한기술 250
전략제품 현황분석 6. 기술로드맵 기획 가. 데이터 보안 및 비식별화 기술로드맵 최종 중소 중견기업 기술로드맵은 기술/시장 니즈, 연차별 개발계획, 최종목표 등을 제시함으로 써 중소기업의 기술개발 방향성을 제시 251
데이터인텔리전스 - 데이터보안및비식별화 나. 연구개발목표설정 로드맵기획절차는산학연전문가로구성된로드맵기획위원회를통해선정된핵심기술을대 상으로기술요구사항, 연차별개발목표, 최종목표를도출 [ 데이터보안및비식별화분야핵심기술연구목표 ] 분류핵심기술기술요구사항 연차별개발목표 1차년도 2차년도 3차년도 최종목표 익명처리 대표데이터대체교환기반암호화기술 데이터대체교환기반기술개발 k- 익명성기술개발 개인정보보안 총계처리 개인정보통계기법적용기술 통계기법개발 다양성기술활용서비스개발 비식별화핵심기술개발 범주화 대푯값활용범주화기술개발 대표값내지구간값활용범주화기술개발 차분프라이버시기술활용서비스개발 보안인텔리전스 보안정보및이벤트관리 데이터분석기반이상접근탐지 보안정보및이벤트수집기술 빅데이터활용분석탐지기술 보안정보이벤트수집/ 분석기술개발 분석된보안정보관리/ 제어기술개발 이상금융거래분석알고리즘개발 이상금융거래대응기술개발 데이터보안을위한지능시스템구축 데이터보안 데이터베이스액티비티모니터링 데이터암호화엔진 지능시스템개발 암호화알고리즘기술개발 데이터베이스이벤트분석기술개발 암호화원천기술개발 데이터베이스이벤트관리및모니터링기술개발 원천암호화기술기반엔진개발 데이터암호화모니터링및엔진개발 252
영상처리시스템 전략제품현황분석
영상처리시스템 정의및범위 영상처리시스템이란입출력이영상인모든형태의정보처리를가리키며, 사진이나동영상을처리 하는것이대표적인임. 대부분의영상처리기법은화상을 2차원신호로보고여기에표준적인신 호처리기법을적용하는방법을이용, 현재딥러닝기술을이용한다양한영상처리응용기술들이 제안되고있고, 딥러닝기술의특징인고수준특징학습능력으로영상내분석대상의복잡한특 징을추출 소셜네트워크및클라우드이미지분류기술, 객체인식기술, 얼굴인식기술, 모션인식기술, 상황 감지기술, 의료관련영상처리기술등을포함 정부지원정책 국내는기존 ICT 분야경쟁력을유지하고국외기업들과의기술격차를줄이기위해정부주도의장 기간국책사업을진행, 미래창조과학부가제시한정보통신분야의 4세대패러다임은방대한데이터 로부터고수준의지식창출이가능한인공지능기반의지능형플랫폼으로발전될것으로전망 2013년부터 10 년간빅데이터로부터스스로학습하여지식을축적하고, 시스템및기기간의자율 협업방식으로새로운문제를해결하는엑소브레인(ExoBrain) 소프트웨어기술개발과제를진행 정부는제2 차과학기술전략회의(2016.8) 에서인공지능을비롯한 9대국가전략프로젝트추진계획 을발표. 지능정보사회구현과 4차산업혁명을주도할 AI(Artificial Intelligence) 핵심기술개발을 통해, 국가 AI 기술역량을제고하고글로벌 AI시장선점을위한 10개년계획추진 2016년 9 월미래부에범정부차원의지능정보사회추진단조직되어인공지능(AI) 개발을비롯한 4 차산업혁명대응을지원, 제4 차산업혁명에대응한지능정보사회중장기종합대책( 안) 을마련중 에있음. 미래부가중심이되어장기간준비중인종합대책의기본골격은지능정보사회도래에따 른기술, 산업, 사회, 변화및이에대응한중장기정책방향을담고있다고파악 중소기업시장대응전략 강점 (Strength) 영상처리기술의적용분야확대 영상처리기술의수요증가 활발하게이루어지는세계적인인공지능기술개발 기회 (Opportunity) 차세대영상처리분야는다양한기술의접목이필요 지자체등공공기관의영상처리시스템요구증가 범정부적 4차산업혁명대응방안마련진행 약점 (Weakness) 후방산업에대한높은의존도및전방산업에대한 기술력부족 일부후방산업에기술력이집중되어있음 위협 (Threat) 높은기술의존도및관련기술의급격한변화 미국, 일본, 유럽업체의시장선점으로인한치열한 경쟁예상 빠른이미지처리, 중소기업의시장대응전략 높은정확도수요에대응하는영상처리기술개발을통한해외시장진출 정확도와영상대비효율성향상을위한관련기술개발 기존의제시되지않은새로운형태의아이디어및기술제안 선두시장의벤치마킹을통한시장진출방안마련
핵심기술로드맵
전략제품 현황분석 1. 개요 가. 정의 및 필요성 영상처리 기술이란 입출력이 영상인 모든 형태의 정보 처리를 가리키며, 사진이나 동영상을 처 리하는 것이 대표적인 예. 대부분의 영상 처리 기법은 화상을 2차원 신호로 보고 여기에 표준 적인 신호처리 기법을 적용하는 방법을 사용 영상처리 기술은 20세기 중반까지 아날로그로 이루어졌으며, 대부분 광학과 연관된 방법이었음. 이런 영상 처리는 현재까지도 홀로그래피 등에 사용되지만, 컴퓨터 처리 속도의 향상으로 인해 이 런 기법들은 디지털 영상 처리 기법으로 많이 대체됨. 디지털 영상 처리는 다양한 방법으로 쓰일 수 있으면서 정확하다는 장점을 가지고 있으며 아날로그 영상보다 구현이 쉬움 디지털 영상 처리 기법은 크게 3가지로 객체인식기술, 상황감지기술 그리고 모션인식기술로 나눠 서 봄 객체인식 기술 상황감지 기술 모션인식 기술 [ 영상처리 기술 ] 최근의 객체인식 기술은 딥러닝으로 미리 학습을 한 지식정보를 바탕으로 물체의 영상을 통해 물체의 종류, 크기, 방향, 위치 등 3차원적 공간정보를 실시간으로 알아내는 기술 얼굴인식 기술이란 양안과 코의 특징 및 그 사이의 기하학적인 관계를 분석하는 기술, 얼굴 전체 영역 기반 기술, 하이브리드기반 기술 등이 있으며, 생체인식기술 분야에서 가장 활발하게 연구가 진행되고 있으며 실제로 보안 및 상업적인 용도로 활용 얼굴인식은 크게 신원인증과 신원확인의 두 가지 문제로 분류할 수 있으며, 신원인증은 두 개의 이미지 사이를 비교, 신원확인은 주어진 이미지와 가장 유사한 얼굴이미지를 찾는 문제 얼굴인식 과정은 다음 [ 얼굴 인식 프로세스 ] 그림 같이 얼굴 검출, 특징 추출의 과정을 거쳐 크 게 3단계의 프로세스를 갖춤 257
데이터인텔리전스 영상처리시스템 * 출처 : 차세대콘텐츠연구소 [ 얼굴인식프로세스 ] 상황감지기술이란센서를통해수집된상황정보를인식, 해석, 추론과같은처리과정을거 친후, 사용자상황에적절한상황인식모델을구성하고관리하여상황정보를추론할수있는 기술 크게환경또는사용자와관련된빛, 온도, 소리, 움직임등의정보를검출하는센서기술 센싱된정보를공유할수있게하는센서네트워크기술 상황정보모델링기술이란센서와장치에대한추상화를제공해야하며, 될수있게표준화된모델링기술이필요 상황정보들이서로교환 상황정보의표현방법은스트랭과린호프-포피엔에의한 6가지방법으로구분 [ 상황정보표현방법 ] 258
전략제품 현황분석 모션인식 기술이란 사용자 신체의 움직임을 인식하여 컴퓨터와 상호작용하는 기술 접촉식과 비접촉식으로 구분 나뉘며 접촉식이란 장치를 이용해 획득한 데이터를 동작인식에 이용 하는 방식이고, 비접촉식은 주로 카메라를 이용해 사용자의 동작 데이터를 획득하여 이를 이용하 는 방식임 현재의 모션 인식 기술은 신체 골격을 인식하고, 각 관절의 정보를 이용해 상호작용함. 이에 따라 원거리 추적에 적합하고 이를 이용한 제스처 인식 기반 상호작용을 제공함 사람의 골격(Skeleton) 정보를 기반으로 제스처 기반 상호작용 제공. 하지만 각 골격 정보를 원거 리에서 추적하므로 정밀한 인식 성능은 제공하지 못함 * 출처 : 차세대콘텐츠연구소 [ 애플의 모션 인식 기술 ] 259
데이터인텔리전스 영상처리시스템 나. 범위 (1) 제품분류관점 영상처리시스템은객체인식기술, 상황감지기술그리고모션인식기술로크게세분야로구분되며각기술은사용영역, 데이터를얻는방법등에따라다양한기술로분류 객체인식기술에는얼굴인식, 색상인식그리고글자, 숫자, 사물인식기술등포함 상황감지기술에는상황정보감지그리고상황인식모델링기술포함 모션인식기술에는거리센서, 전신동작인식그리고손동작인식기술포함 [ 제품분류관점기술범위 ] 전략제품제품분류관점세부기술 얼굴인식 양안( 兩眼 ) 과코의특징및그사이의기하학적인관계를분석기술, 얼굴전체영역기반기술, 하이브리드기반기술 객체인식기술 색상인식 이미지센서를이용하여카메라로색상정보를인식하여가상공간의정보를확인하는기술 글자, 숫자. 사물인식 이미지스캔으로얻은문서를활자로인식하는기술로서, 식하는기술등 특정서체를인 상황정보감지 사용자인터페이스, 센서, 센서네트워크등을통해수집된상황정보를감지하는기술 영상처리기술 상황감지기술 상황인식모델링 적절한상황인식모델을구성하고, 기술 관리하여상황정보를추론할수있는 거리센서삼각측량기반거리센서, 시간지연측정기반거리센서, 모션인식기술 전신동작인식 동작의시간적인변화를동적으로모델링하고이모델을동작인식에활용하는순차적접근법과시공간안에서이루어지는동작을전체적으로파악하고그안에서특징정보를추출하여동작인식에활용하는시공간적접근법으로구분 손동작인식손탐색기술, 손자세추정기술, 손동작분류기술 260
전략제품현황분석 (2) 공급망관점 영상처리시스템의개발은제품분류관점에서분류외에기능적향상을위한이미지빅데이터, 3D 카메라, 자연언어처리와같은데이터베이스-서버자원기술등이포함되고응용환경에따라적용기술이포함됨 객체인식기술에는네트워크객체인식기술, 보안경비객체인식기술, 이미지분류기술, 의료보 조진단기술등이포함됨 상황감지기술에는자율주행인식, 도로교통상황분석기술, 상황정보추론기술등이포함됨 모션인식기술에는헬스케어기술, 재활보조기술, 3D 센서기술, IR 센서기술, 초음파센싱디 바이스기술등이포함됨 [ 공급망관점기술범위 ] 전략제품공급망관점세부기술 빅데이터기술 객체인식을위한이미지, 영상대규모학습데이터 상황감지를위한상황정보, 사용자상황정보, 물리적상황정보데이터 영상처리시스템 개발 객체인식기술 상황감지기술 네트워크객체인식기술, 보안경비객체인식기술, 이미지분류기술, 의료보조진단기술등 자율주행인식기술, 도로교통상황분석기술, 상황정보추론기술등 모션인식기술 헬스케어기술, 재활보조기술, 3D 센서기술, IR 센서기술, 초음파센싱디바이스기술 응용H/W, S/W 기술 소셜네트워크, 클라우드, 사물인터넷제품(IoT), 보안장비제품, 자율주행산업, 헬스케어산업, 의료산업, 게임산업등 261
데이터인텔리전스 영상처리시스템 2. 가. 산업환경분석 산업특징및구조 (1) 산업의특징 영상처리시스템관련산업은소프트웨어뿐만아니라기술발전을통한하드웨어산업에도영 향을미치며개발산업을넘어서까지시장이형성되어영상처리시스템을이용한비즈니스기 반산업도포함됨 빠른속도로발전하는기술개발로인한급격하게변화하는 IT 환경으로시장독점이어려우며 품질경쟁구도로이어지기때문에선진 IT 국가의사례를찾아보기어려워안전보다적극적인신 기술개발에집중이필요 전 후방산업과의연계성이높은산업으로보안경비산업과기계부품, SW 산업의중간지점에위치하며, 발전가능성이높은기술로서현재많은스포트라이트를받으면서성장해가고있는산업 보안경비산업은다양한보안시스템이있으며각보안을강화하기위하여현재주목받고있는얼굴인식기술을더욱개발하고있으며, 전방산업의정책적선택에의해성장해나감 전세계적으로현재딥러닝에주목하는만큼영상처리기술또한딥러닝을접목한기술이기에주요기업들이경쟁하여시장을형성하고성장중임 기술의노하우에대한폐쇄성이강하기때문에신기술에대해단기간에기술모방이어려워독 자적연구개발을통한기술혁신이주로일어나는산업 현재필요한기술을개발하는단계에서창의적이고독단적인형태의방식을개발시그파급효과 는부가가치로창출되므로자체적인아이디어및원천기술확보중요 얼굴인식기술은 2000년대중반까지연구개발및시험적용단계에머물러있었으나최근기술 적환경이뒷받침되면서소프트웨어개발중심으로실용화추세 국내인공지능시장은아직활성화되지않았으며전문양성이부족한형편이며국내고급기술인 력의유출을방지해야하며기술혁신및자생을잃지않도록주의를요망함 262
전략제품현황분석 (2) 산업의구조 선진국과의기술격차를줄이고인공지능시장에조기진입하기위해서전면적인산업기반확 충이필요 개방과공유의패러다임으로정책방향을전환하는한편, 공공부문의선도적투자를확대필요 중앙집중식통제의패러다임은산업의갈라파고스화를초래하기때문에개방과공유의패러다임으 로정책방향의근본적인전환필요 인공지능관련국가연구개발사업및산학연협력연구에대한투자확대및정책적지원필요 민간부문의인공지능산업생태계가형성될수있도록기업의투자를적극유도하는데주력 벤처및스타트업지원을강화함으로써후방산업인자율주행자동차, 지능형로봇, SW 등제조업 부문의인공지능기술융합이활성화되며, 세제및금융지원을확대하고의료, 금융, 교육등서 비스업분야의인공지능활용이촉진필요 인공지능기술경쟁력확보를위한연구개발(R&D) 투자확대및인재육성에주력 초기시장이형성되기이전에기술경쟁력을확보하기위해서는국가연구개발사업등공공부문의 선도적인 R&D 투자가필요하며, 민간기업이적극적인 R&D 투자에나설수있도록세제, 금융 등다양한형태의지원을강화해야함. 또한, 글로벌시장에서기술적주도권을확보하기위해서 는인공지능전문가를양성하는체계적인방안마련도시급 구분 2016 년 조사인원 [ SW 노임단가(2016) ] 평균임금 (M/D) 2015년 2016년 평균임금 (M/M) 평균임금 (M/H) 기술사 328 411,642 437,227 9,181,767 54,653 특급기술자 17,983 373,593 381,502 8,011,542 47,688 고급기술자 10,285 276,160 284,440 5,973,240 35,555 중급기술자 10,871 221,375 226,537 4,757,277 28,317 초급기술자 13,270 190,787 190,790 4,006,590 23,849 고급기능사 162 177,337 187,093 3,928,953 23,387 중급기능사 311 141,168 147,483 3,097,143 18,435 초급기능사 232 118,732 119,232 2,503,872 14,904 자료입력원 148 112,570 117,078 2,458,638 14,635 * 출처 : 2016 한국소프트웨어산업협회 263
데이터인텔리전스 영상처리시스템 SW기술자평균임금은소프트웨어산업진흥법제22 조( 소프트웨어사업의대가지급) 4 항 소프트웨어 기술자의노임단가를지칭함 월평균임금은일평균* 근무일수(21.0 일), 시간평균임금은일평균 8시간으로각각산정함 SW 기술자평균임금은기본급, 제수당, 상여금, 퇴직급여충당금, 법인부담금을모두포함한결과임 DB구축비대가기준가이드에서활용되는자료입력원평균임금의기본급은 2016년 94,080원으로 조사됨 2016년의월평균근무일수는 21.0일로조사됨 SW기술자평균임금은 2015년대비 3.5% 증가함 264
전략제품현황분석 나. 경쟁환경 평가에따르면한국정부는최근인공지능산업에육성정책을수립하나착수시점및투자규모 측면에서주요국대비미흡 미국은이미 2008 년부터시냅스인지컴퓨팅프로젝트 SyNAPS(Systems of Neuromorphic Adaptive Plastic Scalable Eletronics) 를추진하는등인공지능연구개발선두 주요선진국대비한국정부가주도적으로추진하고있는인공지능관련프로젝트의투자규모미 흡 미국은향후 10년간총 30억달러규모가투입되는브레인이니셔티브를포함해인공지능연구개 발에연간 30 억달러(3조 2,800 억원) 를투입할계획 유럽연합(EU) 은 2013년부터 10년간 10 억유로(1조 3,700 억원) 를투입해 25개국 135개기관 이참여해인간뇌를연구하는휴먼브레인프로젝트를진행 일본은 AI 연구를위해 2016년부터 10년간 1,000 억엔(1조 180 억원) 을지원 그에비해한국정부는향후 10년간 1,070 억원이투자되는 엑소브레인(ExoBrain) 프로젝트를 비롯하여인공지능관련분야에연간총 380억원정도만을투자할계획 민간부문의인공지능산업기반역시기업수및투자규모측면에서부족한수준 2013년기준국내인공지능시장규모는 3.6 조원으로전세계인공지능시장규모( 약 240 조원) 의 1.5% 로추정되고, 2015년기준국내인공지능관련기업은약 24~64 개로추정되며, 이는 세계인공지능관련스타트업수와비교할때약 2.5~6.7% 수준 한국 ICT산업의세계 ICT산업대비비중 10.7%(2015 년기준), ICT수출시장점유율 6.7%(2013 년기준) 등에비해낮은수준 국내기업의인공지능관련투자도글로벌기업대비낮은수준으로, 2014년이후삼성전자가 AI 부문에투자한금액은지보, 바이카이우스( 각각 2,000 만달러, 480 억원) 등으로알려져있으며 네이버는 2013년 5년간인공지능연구개발에 1,000억원을투자할계획 구글은 2001년부터 2015년까지 14년간인공지능관련기업인수에 280 억달러( 약 33조 7,000 억원, 연평균 20 억달러) 를투자하고있으며, 중국의인터넷기업바이두는 3 억달러( 약 3,600억 원) 를투자하여실리콘밸리에딥러닝연구소를설립 인공지능확산에따른부작용을극복하고효용을극대화하기위한사회적논의와준비가부족 새로운과학기술의부정적영향을최소화하고긍정적영향을극대화하기위해서는사회적논의와 합의가중요 과학기술의발전은경제적부가가치창출등긍정적인효과도가져오지만, 환경 윤리문제등국민 의일상생활에예기치못한부작용도유발 265
데이터인텔리전스 영상처리시스템 미래창조과학부는 2003 년부터기술영향평가를수행하고있으며, 2015년에는인공지능기술과유 전자가위기술을대상으로기술영향평가를수행 인공지능발전에따른일자리감소, 오작동피해, 인권침해, 윤리적문제등부작용을최소화하기 위한사회적합의는아직미흡한실정 WEF(World Economic Forum), 일자리가대규모감소할것으로예측 옥스퍼드대학등의연구결과에서는인공지능과로봇으로인해 최근국내에서일반인을대상으로실시된설문조사에서도인공지능확산에따라일자리가감소할 것이라는전망이총 74% 로다수를차지 [ 제품분류별경쟁자 ] 구분 경쟁환경 기술분류객체인식기술상황감지기술모션인식기술 주요품목및 기술 얼굴인식기술사물인식기술이미지인식진단기술 머신비전기술 모션인식기술제스처인식기술초음파동작인식기술 해외기업 페이스북구글 42ARK IBM 마이크로소프트 Capri PrimeSense pointgrab Elliptic Lab Leap Motion Canesta Myo The EyeTribe 국내기업 네이버루닛부노삼성 UVify LG SKT 266
전략제품현황분석 다. 전후방산업환경 후방산업은전자기계부품, 콘텐츠, SW, IT, 네트워크등등으로이루어져있고장비의경우대 부분대기업에서연구및개발하며기술및 SW 등은중소기업에서자체적으로연구및개발 현재세계화가중점인가운데장비및기술등의표준화는세계시장에품질평가에미치는영향력 이높으므로, 다양한분야의융합에의한표준화가중요 후방산업에있어효율적인얼굴인식, 다양한콘텐츠, 편리함에따른선진기술및디자인에대한 요구증대 전방산업으로서영상처리분야의주요시장은 SW(50%), 보안제품(30%), 소셜네트워크 (10%), IT(5%), 전자부품(5%) 등으로구성 영상처리기술은하드웨어의발전에의해실현가능해진기술들이시장에적응하면서소요증가 [ 영상처리시스템분야산업구조 ] 후방산업영상처리시스템분야전방산업 전자기계부품, 콘텐츠, SW, IT, 네트워크 얼굴인식, 색상인식, 글자, 숫자, 사물인식, 상황정보감지, 상황인식모델링, 거리센서, 전신동작인식, 손동작인식 방위, 의료, 실버, 바이오. 정밀기계. 보안경비. 홈네트워크 267
데이터인텔리전스 영상처리시스템 3. 시장환경분석 가. 세계시장 세계시장은글로벌기업들을중심으로적극적으로인공지능개발에노력 인공지능분야의기계학습과이를위해인공신경망을이용하는딥러닝(Deep Learning) 발가속화 기술의개 세계인공지능시장은빠르게성장하고있으며, 인공지능산업에대한투자도급증 인공지능관련스타트업투자규모는 2010년 4,500만달러에서 2015년 3억 1,000 만달러, 투 자건수는 6건에서 54 건으로증가했으며, IDC는세계인공지능시장규모를 2015년약 1,270억 달러에서 2017년약 1,650억달러로연평균 14.0% 성장할것으로전망 한편인공지능기술은다양한분야에접목되어산업확장을도모할것으로전망 그래픽처리장치(GPU) 를통한병렬연산기법을활용하여학습을위한막대한양의데이터계산처리 전세계인공지능기반스마트머신시장은 2014년 62억 2,900만달러에서 2019년 152억 7,900 만달러규모로성장할전망(BCC 리서치) 이며, 영상처리시장은 2015년 765억달러에서 2017년 1,090 억달러, 음성인식시장은같은기간 840억달러에서 1,130억달러수준으로성 장할것으로보임. 또한기업용인공지능시스템시장은 2015년 2억달러에서 2024년 111억 달러로연평균 56.1% 성장전망(Tractica) 이예상되고, 예측분석SW 시장은 2012년 20억달러 에서 2019년 65억달러로성장할것으로확인 [ 세계인공지능투자추이및인공지능기반스마트머신시장전망 ] 268
전략제품현황분석 [ 시장전망 ] 구분 2015 2016 2017 2018 2019 전체 영상인식/ 분석 영상코텍/ 스트리밍 영상제작/ 편집/ 합성 세계( 억불) 1,055 1,177 1,299 1,424 1,549 국내( 억원) 54,053 60,145 66,236 72,288 78,341 세계 90 104 118 137 156 국내 986 1,142 1,297 1,509 1,720 세계 802 867 931 1,051 1,171 국내 44,130 47,668 51,206 57,817 64,428 세계 163 206 250 236 222 국내 8,938 11,335 13,733 12,963 12,193 * 출처 : 한국전자통신연구원기술경제연구본부추정, 2016 [ 영상처리시스템세계시장규모및전망 ] ( 단위 : 억달러, %) 구분 15 16 17 18 19 20 CAGR ('13~'15) 세계시장 90 104 118 137 156 176 8.8% * 출처 : 한국전자통신연구원기술경제연구본부추정, 2016 269
데이터인텔리전스 영상처리시스템 나. 국내시장 국내인공지능산업은아직초기단계 국내일부대기업및 IT기업에서인공지능연구에투자를시작하면서시장형성단계에돌입했으 나국내인공지능산업은아직까지초기단계 인공지능, 영상처리와영상인식, 음성인식및통번역등 3개부문으로구성된국내인공지능산업 은 2013년 3.6조원에서 2017년 6.4조원으로성장할것으로전망 주요기업으로는 IT기업을필두로일부대기업이인공지능산업투자및연구를추진하고있으나 아직까지인터넷과게임등특정사업에한정 [ 영상처리시스템국내시장규모및전망 ] 구분 15 16 17 18 19 20 ( 단위 : 억원, %) CAGR ('13~'15) 국내시장 986 1,142 1,297 1,509 1,720 1,904 4.0% * 출처 : 한국전자통신연구원기술경제연구본부추정, 2016 [ 국내인공지능시장규모및전망 ] 270
전략제품 현황분석 4. 기술환경분석 가. 기술개발 트렌드 회선 신경망(Convolutional Neural Network, CNN)은 최소한의 전처리(Preprocess)를 사용하 도록 설계된 다계층 퍼셉트론(Multilayer Perceptrons)의 한 종류임 CNN은 하나 또는 여러 개의 합성곱 계층과 그 위에 올려진 일반적인 인공 신경망 계층들로 이루 어져 있으며, 가중치와 통합 계층(Pooling Layer)들을 추가로 활용. 이러한 구조 덕분에 CNN은 2차원 구조의 입력 데이터를 충분히 활용할 수 있음 다른 딥러닝 구조들과 비교해서, CNN은 영상, 음성 분야 모두에서 좋은 성능을 보여줌. CNN은 또한 표준 역전달(Back Propagation)을 통해 훈련될 수 있음. CNN은 다른 피드포워드(Feed Forward) 인공신경망 기법들보다 쉽게 훈련되는 편이고 적은 수의 매개변수를 사용한다는 이점이 있음 [ Convolutional Neural Network의 프로세스 ] 디지털 영상처리 알고리즘 분류 화소 점 처리 (Point Processing) - 화소 점의 원래 값이나 화소 점의 위치를 기반으로 화소 값 변경 영역 처리 (Area Processing) - 화소의 원래 값과 이웃하는 화소의 값을 기반으로 화소 값 변경 271
데이터인텔리전스 영상처리시스템 기하학처리 (Geometric Processing) - 화소들의위치나배열을변화시킴 프레임처리 (Frame Processing) - 두개이상의서로다른디지털영상들이연산등의조합을통해서새로운화소값생성 빅데이터는지금까지분석할수없었던방대한양의정보를분석하는기술 기존데이터베이스관리도구의능력을넘어서는대량( 수십테라바이트) 의정형또는심지어데이 터베이스형태가아닌비정형의데이터집합조차포함한데이터로부터가치를추출하고결과를분 석하는기술 최근빅데이터는대용량데이터의수집, 저장, 분석, 체계화를위한도구, 플랫폼, 분석기법등을 포괄하는용어로변화 이같이빅데이터는정치, 사회, 경제, 문화, 과학기술등전영역에걸쳐서사회와인류에게가치 있는정보를제공할수있는가능성을제시하며그중요성이부각되고있음 소셜미디어상호작용, 스마트폰등인터넷연결기기의폭증, 멀티미디어콘텐츠의활용증대로인해 빅데이터의시대가도래 272
전략제품 현황분석 의료용 영상처리 MRI (Magnetic Resonance Image) - 영상기술 중 하나로 핵자기공명 원리를 사용. 자기장을 발생하는 자기공명 촬영 장치에 인체를 넣 고 고주파를 발생시키면 신체의 수소 원자의 전자가 공명하게 됨. 이때 나오는 신호의 차이를 측 정하고 컴퓨터를 통해 재구성하여 영상화시키면 우리가 볼 수 있는 자기 공명 영상이 됨 자기 공명 영상은 X선을 사용해 인체에 유해한 X선 컴퓨터 단층 촬영 (CT)과 달리 신체에 무해하 다는 게 특징이며, 또한 CT가 횡단면 영상이 주가 되는 반면 MRI는 방향에 자유로움 [ MRI 영상 Sample ] 273
데이터인텔리전스 영상처리시스템 나. 주요업체별기술개발동향 (1) 해외업체동향 Facebook 의인공지능기술은사용자가공유하는콘텐츠의의미를이해하는것에중점 사람의얼굴을 97.25% 의정확도로알아내는딥페이스개발및인공지능분석서버빅서공개 사진속의사물과인물을구별하고내용을인식, 뉴스피드내용필터링, 자동텍스트번역, 음성인식 등을수행하는인공지능기술보유 Microsoft 는딥러닝기술을시각적정보로활용하여사물을인식하는아담프로젝트를진행 이종의애완견을현장에서촬영한후 코타나 를통해어떤견종인지음성으로물어보면실시간으 로견종을알아내스마트폰문자로공지하는서비스제공 앞으로카메라로촬영한식품의영양성분을분석하거나숲에서처음본식물의유해성여부를판 단하는서비스, 부상및피부질환이미지를바탕으로진료를돕고, 맹인에게주변풍경을설명해 주는자동 안내서비스로활용될전망 Google 은얼굴인식, 이미지인식, 가상예술기술적용및감성지능기반검색엔진서비스 를개발할계획 2015년 5월에발표된구글포토서비스는모바일단말기에서촬영한사진을구글클라우드에백 업한후자동으로인물, 시간, 위치, 주제사물별로분류할수있고, 사진을스토리로구성하거나 여러장의사진을연결하여파라노마사진을만들어서다른사람들과공유가가능한지능형사진 공유서비스를제공 영상으로부터감성지능기술을접목한사용자감정이해를기반으로한검색엔진을개발중이며 고객요구이해에필요한전자상거래에활용할계획 Clarifai는이미지와비디오의태깅 API 기술을가지고있으며이미지및비디오인식기술을 향상시키기위해연구개발에집중 NVIDIA는딥러닝기반의 Tegra X1 칩이내장된컴퓨터 Driver-PX를개발 자동차에장착된 12개의 HD 카메라(60Hz, 초당 1.3 기가픽셀처리) 영상을인식하여주변상황 을파악하여자율주행이가능하도록지원 274
전략제품현황분석 이시스템의영상처리성능을보자면, 근거리에서머리와다리일부분이촬영된신체일부에대해서자동차에가려진사람을보행자로인식, 야간운전에도속도위반감지카메라나속도제한표시 등인식가능, 전방차량상황알림판인지및정체상황을인지가능함으로다중클래스인식이가능 (2) 국내업체동향 2015년 10월에 ETRI 창의미래연구소에서발간한보고서에따르면, 영상처리응용기술관련된 수준은아래표와같음 아래표에서조사된기술들은모두영상처리기술과접목하여응용할수있는기술들이고현재까 지세계적기술수준과국내개발기술간의격차를먼저살펴봄으로써영상처리응용기술들이어 떻게사용될수있을지고찰해볼수있는의미있는자료 첫번째시각인지기술은객체인식, 컴퓨터비전, 행동및상황이해, 영상지식처리및동영상검 색기술에활용되는기술을의미 두번째공간인지기술은 2차원및 3 차원영상에서의거리및깊이분석, 공간상의사물을이해 하거나인지하는데활용 세번째스토리압축및창작기술은영상으로부터스토리를이해하거나사물객체를구분하거나 영상으로부터의미있는내용을요약하고영상을자동으로편집하는기술 마지막으로기계학습기술은영상내사물에대한통계처리, 사물간클러스터링, 영상처리를위 한기계학습용비지도학습(Unsupervised Learning), 강화학습에활용 [ 영상처리접목기술분야및해당기술수준동향 ] 접목기술 비교항목 기술수준기술수준 Hype cycle( 단계) 기술도달국외국내격차( 년) 국외국내소요시간 시각인지 95.0% 70.9% 3.6 3.1 2.6 2~5년 공간인지 93.1% 66.3% 3.6 2.9 2.3 5~10년 스토리압축/ 창작 90.6% 63.1% 3.8 2.5 1.8 5~10년 감성인지 92.2% 64.7% 3.8 2.4 1.9 5~10년 기계학습 95.3% 68.8% 3.7 3.2 2.4 2~5년 * 출처 : 인공지능기술과산업의가능성, Issue Report 2015-04, ETRI, 2015. 10. 이용해재구성 국내는기존 ICT 분야경쟁력을유지하고국외기업들과의기술격차를줄이기위해정부주도의장기간국책사업진행 미래창조과학부는정보통신분야의 가능한인공지능기반의지능형플랫폼으로발전될것으로전망 4세대패러다임은방대한데이터로부터고수준의지식창출이 275
데이터인텔리전스 영상처리시스템 2013년부터 10 년간빅데이터로부터스스로학습하여지식을축적하고, 시스템및기기간의자 율협업방식으로새로운문제를해결하는엑소브레인(ExoBrain) 소프트웨어기술개발과제를진행 이과제는병렬형과제로구성되어있으며, 지능진화형의질의응답, 빅데이터이해기반의자가학 습형지식베이스, 자가학습지능원천기술및지식협업프레임워크기술이주연구내용 ETRI, GIST 및포함공대를중심으로대규모영상분석을통해영상의의미를이해하는딥뷰W 개 발중 다. 기술인프라현황 정부지원정책 국내는기존 ICT 분야경쟁력을유지하고국외기업들과의기술격차를줄이기위해정부주도의 장기간국책사업진행 미래창조과학부는정보통신분야의 4 세대패러다임은방대한데이터로부터고수준의지식창출이 가능한인공지능기반의지능형플랫폼으로발전될것으로전망 2013년부터 10 년간빅데이터로부터스스로학습하여지식을축적하고, 시스템및기기간의자 율협업방식으로새로운문제를해결하는엑소브레인(ExoBrain) 소프트웨어기술개발과제를진행 정부는제2 차과학기술전략회의(2016.8) 에서인공지능을비롯한 9대국가전략프로젝트추진계 획을발표. 지능정보사회구현과 4차산업혁명을주도할 AI 핵심기술개발을통하여, 국가 AI 기 술역량을제고하고글로벌 AI시장선점을위한 10개년계획추진 [ 엑소브레인(ExoBrain) 개발과제의방향 ] 276
전략제품 현황분석 2016년 9월 미래부에 범정부 차원의 지능정보사회추진단 조직되어 인공지능(AI) 개발을 비롯한 4차 산업혁명 대응을 지원 (AI 전담이 아닌 4차 산업혁명 대응의 일부로서 추진단에 소속) 제4차 산업혁명에 대응한 지능정보사회 중장기 종합대책(안)을 마련 중에 있으며, 미래부가 중심 이 되어 장기간 준비 중인 종합대책의 기본 골격은 지능정보사회 도래에 따른 기술, 산업, 사회, 변화 및 이에 대응한 중장기 정책방향을 담고 있다고 파악 [ 지능정보사회 중장기 정책 방향 ] 세계 주요국과 비교했을 때 한국의 인공지능 관련 기술 수준이 낮고 특허 보유수도 적음 세계 인공지능 관련 기술 연구 및 개발은 미국이 주도하고 있으며, 미국의 기술수준(100)을 기준 으로 한국의 기술 수준을 평가할 때, 한국의 인공지능 SW 기술은 최고기술국 대비 75.0% 수준, 인공지능 응용 SW 기술은 74.0% 수준으로 조사되어 주요 선진국과 상당한 격차를 보임 한편 중국과 비교했을 때 인공지능 SW 기술은 큰 차이가 나지 않고, 인공지능 응용 SW 기술은 오히려 낮은 수준으로 평가 기술 R&D 정책 미래부는 사람과 의사소통이 가능한 몸 바깥의 인공두뇌를 의미하는 엑소브레인 소프트웨어 개발 정책을 발표 미래창조과학부, 2013) 위 정책의 목표는 아래 표에서 보는 바와 같이 기계와 인간과의 의사소통을 뛰어넘어 지식소통이 가능하며, 전문가의 의사결정을 지원하는 인공두뇌 SW 개발로 다양한 산업 환경에서 기계가 인간 의 지적노동을 보조하고 전문가 수준의 지식을 제공 하는 것 277
데이터인텔리전스 영상처리시스템 [ 엑소브레인 SW 기술개발과제명및 4 개세부과제 ] 엑소브레인 SW 기술개발과제명 - 사용자와의사소통을하고스마트기기간자율협업을통한지식공유및 지능진화가가능한엑소브레인 SW 기술개발 - 4 개세부과제의연구결과를통합하여개발목표달성 - 과제1(ETRI) : 지능진화형 WiseQA 플랫폼기술개발 - 과제2( 솔트룩스) : 자가학습형지식베이스구축및추론기술개발 - 과제3(KAIST, 포항공대) : 인간모사형자가학습지능원천기술개발 - 과제4(ETRI) : 자율지능형지식/ 기기협업프레임워크기술개발 * 출처 : 미래창조과학부 (2013, 2015) 정부는엑소브레인연구에연간 80 억( 13~ 23, 10 년) 을투자하며, 1 단계 ( 13.5 ~ 17.4, 4 년) 는 428 억원(320 억원: 정부, 108 억원: 민간), 2 단계( 17.5 ~ 20.4, 3 년), 3 단계(3 년: 20.5~ 23.4, 3 년) 까지총 1,070 억원(800 억원: 정부, 270 억원: 민간) 규모투자계획 ( 미래창 조과학부, 2013) 대규모실시간영상이해기반의시각지능플랫폼개발및재난재해조기감지예측기술개발 ( 딥뷰 : DeepView Project 14~ 24) 을추진( 미래창조과학부 2015) 인공지능기술발전에따른사회적부작용이최소화될수있도록선제적인대응책을마련 인공지능의확산은현행정치 경제 사회내규범및기반에새로운도전과제를제시해야하며, 기술혁신에따른사회전반의생산성향상이일자리감소, 실업률상승과같은부작용으로이어지지않도록사회적논의를활성화할필요 인공지능관련윤리규범마련, 발전을유도해야할것 법제도적정비등을통해인간에게도움이되는방향으로기술 278
전략제품 현황분석 라. 특허동향 분석 (1) 연도별 출원동향 영상처리 시스템 기술의 지난 7년( 10~ 16)간 출원동향25)을 살펴보면 연도별 출원경향이 전체 적으로 2010년도를 시작하여 꾸준히 유지되는 경향을 나타내고 있어, 본 기술에 대한 연구개 발이 활발하게 이루어지고 있음 각 국가별로 살펴보면 한국의 출원경향은 2010년도부터 소폭 증가되는 상태로 지속되고 있는 경 향을 보이고 있음, 미국도 조금씩 증가하는 추세를 보이고 있으며, 일본은 소폭 감소추세로 유지 하고 있는 경향을 보이고 있음 국가별 출원비중을 살펴보면 미국이 전체의 59.5%로 최대 출원국으로 영상처리 시스템 기술 을 리드하고 있는 것으로 나타났으며, 한국이 16.9%, 일본은 11.9%, 유럽은 11.7% 순으로 나타남 [ 영상처리 시스템 기술 연도별 출원동향 ] 25) 특허출원 후 1년 6개월이 경과하여야 공개되는 특허제도의 특성상 실제 출원이 이루어졌으나 아직 공개되지 않은 미공개데이터가 존재하여 2015, 2016년 데이터가 적게 나타나는 것에 대하여 유의해야 함 279
데이터인텔리전스 영상처리시스템 (2) 국가별출원현황 한국의출원현황을살펴보면 10 년부터꾸준히소폭이지만, 증가추세를 2014년도까지유지하 고있는경향을보이고있음 한국은 2010~2013년도에는외국인비중이 10~20% 정도수준에서점차로비중이줄어드는것 으로주로국내출원인이대다수비중으로나타나고있음 미국의출원현황은출원건수가한국과유사하게소폭출원건수가증가하고있는추세를보이고 있는점이특징임 2010년도이후미국의외국인출원이 50% 정도로최근까지이러한추세가나타나고있어, 타 국가에비해외국인출원이다수이루어지고있는것이특징으로나타남 일본의출원현황은 10 년도이후부터소폭감소추세를보이고있으며, 내외국인비중은외국인 이 20% 이상으로내국인출원이높은경향을보이고있는점이특징임, 유럽의경우에는큰 증감폭없이출원이발생되고있으며, 외국인비중이전체 50% 이상으로외국인비중이타 국가보다높은것으로나타남 [ 국가별출원현황 ] 280
전략제품현황분석 (3) 투입기술및융합성분석 영상처리시스템기술 분야의투입기술을확인하기위하여특허분류코드인 IPC Code 26) 를통하 여살펴본결과가장많은비중을차지하고있는 IPC는 G06K 분야가가장많은 809건으로나 타났으며, G06T이 404 건, H04N가 399건으로 G06K분야가대다수를차지하고있음 이외에 G06F 165 건, A61B 86 건, G01S 40 건, G01N 33 건, G02B 28 건, G09G 22 건, G01C 18건등의기술이투입되어있어영상처리시스템기술분야에다양한기술이존재하지만, e 데이터표시, 기록매체분야에집중되고있음 더불어해당 IPC의특허인용수명을살펴보면 A61B로서기술분야의수명이 9년으로가장긴것으 로나타났으며, G06T 기술분야는 6년으로가장짧은것으로분석 [ 영상처리시스템기술분야상위투입기술 ] IPC 기술내용특허인용수명 (TCT) 27) G06K 데이터의인식; 데이터의표시; 기록매체; 기록매체의취급 7년 G06T 이미지데이터처리또는발생일반 6년 H04N 화상통신 7년 G06F 전기에의한디지털데이터처리 6년 A61B 진단; 수술; 개인식별 9년 G01S 무선에의한방위결정; 무선항행; 무선전파의사용에의한거리또는속도의 결정 8 년 G01N 재료의화학적또는물리적성질의검출에의한재료의조사또는분석 9년 G02B 광학요소광학계또는광학장치 6년 G09G G01C 정적수단을사용하여가변정보를표시하는표시장치의제어를위한장치또는회로 자이로스코프; 진동질량을가지는회전- 감응장치; 운동질량이없는회전- 감응장치; 자이로스코프효과를이용한각속도의측정 6 년 7 년 26) 전세계적으로통용되고있는국제특허분류(IPC: International Patent Classification) 를통해특허정보기술분야에서공지기술을조사할수있으며, 기술및권리정보에용이하게접근가능 27) 특허인용수명지수는후방인용(Backward Citation) 에기반한특허인용수명의평균, Q1, Q2( 중앙값), Q3 에대한통계값을제시함. 특히이와같이산출된 Q2는 TCT(Technology Cycle Time, 기술순환주기또는기술수명주기) 라고부름 281
데이터인텔리전스 영상처리시스템 투입기술이가장많은 G06K 분야와융합이높게이루어진기술은 G06T 분야로나타났으며, G06F, H04N 분야와도나타융합된기술의건수가높은것으로분석 이외에 G06T 분야와융합된기술은 H04N, G06F, A61B 분야와융합된기술이많은것으로나 타났으며, H04N 분야와융합된기술은 G06F, G01S, A61B 기술로분석됨 [ 영상처리시스템기술분야 IPC 기술및융합성 ] (4) 주요출원인분석 앞서국가별특허건수에서미국이가장많은특허를출원하고있는것으로나타났으나, 출원인에는미국이외에한국, 일본, 아일랜드등다양한국가출원인이상위그룹에포함되었 음 상위 주요상위출원인을살펴보면한국의삼성전자와, 한국전자통신연구원이포함되었으며, 일본의 Canon, Ricoh, Sony 등이있으며, 미국은 Google, Nant Holdings, IBM 등이상위그룹을차지하고있음 주요한국출원인인삼성전자는한국이외에미국에다수의출원을하고있는점이특징이며, 국전자통신연구원도미국출원도다수출원하고있음 한 282
전략제품현황분석 3극출원은 Nant Holdings, Ricoh 사등이다수출원을하고있으며, 나머지출원인은일부만 출원하고있는것으로나타남 피인용지수에대한통계에서는대부분상위그룹출원인에서 Nant Holdings가 6.67으로가장 높은수치를나타내고있으며, 나머지출원인에는 5 미만으로서큰편차없이수치를기록하고 있음 주력기술분야는동영상내에객체추철, 추적기술, 얼굴인식및이에대한시맨틱속성을분 석하는기술등이연구개발대상으로하고있는것으로나타남 [ 주요출원인의출원현황 ] 주요출원인 국가 주요 IP 시장국 ( 건수 %) 3극패밀 IP시리수 한국미국일본유럽 장국 종합 ( 건) 피인 용지 수 주력기술분야 삼성전자 한국 31 37 2 8 40% 47% 3% 10% 미국 5 0.71 객체추출영상보정기술 Canon 일본 61 10 3 0% 82% 14% 4% 미국 9 1.93 비디오영상객체추적기술 Ricoh 일본 11 29 9 0% 22% 59% 18% 일본 18 4.67 비디오영상객체추적기술 Sony 일본 34 1 4 0% 87% 3% 10% 미국 10 2.48 객체추출, 삭제, 관리기술 한국전자통신연구원 한국 25 14 64% 36% 0% 0% 한국 0 3.86 객체검출, 추적기술 Google 미국 34 1 1 0% 94% 3% 3% 미국 5 1.48 얼굴인식기술 DigitalOptics 아일랜드 35 0% 100% 0% 0% 미국 0 7.8 얼굴인식, 추적인식및장치기술 Nant Holdings 미국 32 0% 100% 0% 0% 미국 32 6.67 카메라영상내, 객체정보추출기술 IBM 미국 1 26 2 3% 90% 7% 0% 미국 0 2.48 휴먼영상시맨틱속성추출기술 Toshiba 일본 2 4 21 1 7% 14% 75% 4% 일본 3 0.5 비디오영상얼굴인식, 추출기술 283
데이터인텔리전스 영상처리시스템 (5) 국내출원인동향 국내출원인동향을살펴보면대기업은삼성전자, 에스케이텔레콤, 엘지전자등이상위그룹에 나타났으며, 중소기업으로는아이리텍, 소프닉스, 브이플랩등다양한기업이참여하고있는것 으로나타남 기업이외의주요출원인에서연구소와, 대학의출원이활발한것으로나타났으며연구소에는 한국전자통신연구원, 전자부품연구원등에서출원이이루어지고있으며, 여러대학에서도다수 참여하고있는것으로나타남 [ 국내주요출원인의출원현황 ] 284
전략제품현황분석 5. 가. 중소기업환경 중소기업경쟁력 영상처리시스템분야의중소기업경쟁력은기술분류별로차이가있으나데이터분석기술은중소기업이다수참여하여시장에서의역할이점차커지는분야로나타났으나, 모션인식기술은높은기술력을요구하는분야로중소기업의경쟁력이낮은것으로분석됨 [ 영상처리시스템분야중소기업현황 ] 기술분류주요기술대기업중소기업중소기업참여영역중소기업 참여정도 객체인식 얼굴인식기술, 색상인식기술, 글자, 숫자사물인식기술, 물리적상황정보기술, 영상대규모학습기술 네이버루닛부노삼성 대규모학습기술상황정보기술 상황감지 상황정보감지, 상황인식모델링, 거리센서기술, 머신러닝기술, 상황정보추론, 자율주행인식기술, 도로교통상황분석기술 Uvify 거리센서기술, 도로교통상황분석기술상황인식기술 모션인식 전신동작, 손동작, 딥러닝기술, 헬스케어기술, 재활보조기술, 초음파센서기술 LG SK 헬스케이기술, 재활보조기술, 센서기술, 딥러닝 * 중소기업참여정도와점유율은주요제품시장에참여하는중소기업의참여규모와정도( 업체수, 비율등) 를고려하여 5단계로구분 ( 낮은단계:, 중간단계(,, ) 높은단계: ) 285
데이터인텔리전스 영상처리시스템 나. 중소기업기술수요 영상처리시스템 분야의중소기업의기술수요를파악하기위하여중소기업기술수요조사및중소 기업청 R&D 신청과제(2013~2015 년) 를분석한결과아래표의내용과같은수요들이다수있는 것으로분석 영상처리시스템분야중소기업은최근에데이터분석/ 처리기술과관련된기술개발에다수수요가 있는것으로나타났으며, 이는인공지능기반을통한개발기술에대한관심이높아지고있는추 세를반영한것으로분석됨 [ 영상처리시스템분야과제신청현황및수요조사결과 ] 전략제품기술분류관심기술 객체인식 얼굴인식기술, 색상인식기술, 글자, 숫자사물인식기술, 물리적상황정보기술, 영상대규모학습기술 영상처리시스템 상황감지 상황정보감지, 상황인식모델링, 거리센서기술, 머신러닝기술, 상황정보추론, 자율주행인식기술, 도로교통상황분석기술 모션인식 전신동작, 손동작, 딥러닝기술, 헬스케어기술, 재활보조기술, 초음파센서기술 286
전략제품현황분석 다. 중소기업핵심기술 (1) 데이터기반요소기술발굴 영상처리시스템기술의특허및논문데이터검색을통해도출된유효데이터를대상으로데이터마이닝기법(Scientometrics 기법) 을통해클러스터링된키워드의연관성을바탕으로요소기술후보군을도출 영상처리시스템기술의특허및논문유효데이터를기반으로키워드클러스터링을통하여 의요소기술후보군을도출 11개 제품별 dataset 구축 : 영상처리시스템기술관련특허/ 논문데이터를추출하여노이즈제거후 제품별 dataset 구축 1 차클러스터링 : 키워드맵을통한고빈도키워드확인- 빈도수(tf-idf) 28) 가상위 30% 에해당하 는키워드를대상으로 1차추출 2 차클러스터링 : 1차클러스터링에서추출된고빈도키워드사이에서고연관도키워드를 2차추 출 ( 고연관도기준은연관도수치29) 가 2 이상인클러스터로제한) 다음그림은키워드간연관네트워크를시각화한것으로, 간의연관도를나타내는직선으로구성 각키워드를나타내는원과키워드 각키워드가특허와논문중어느데이터에서도출되었는지원의색으로구분하였으며, 도출된클러스터는황색음영으로표시 키워드로 키워드를나타내는원은고빈도의키워드일수록원의크기가크게표현되며, 선은키워드사이의연관도수치가높을수록굵게표현 연관도를나타내는 영상처리시스템기술전략제품의특허논문유효데이터에대하여키워드클러스터링결과를 기반으로요소기술도출 데이터기반의요소기술도출은키워드클러스터링을통해도출된요소기술에대하여전문가의 검증및조정을통하여요소기술을도출 28) 빈도수(tf-idf) : 각키워드가출현되는특허또는논문수를의미 29) 연관도수치: 두개이상의키워드사이의특허또는논문수를의미 287
데이터인텔리전스 영상처리시스템 [ 영상처리시스템분야키워드클러스터링 ] [ 영상처리시스템분야주요키워드및관련문헌 ] No 주요키워드연관도수치관련특허/ 논문제목 클러스터 01 object detection, recognition 6~8 1. Template-based target object detection in an image 2. Object detection based on image pixels 3. Human action analysis using K-NN classifier 클러스터 02 augmented reality, image 6 1. Augmented reality method applied to the integration of a pair of spectacles into an image of a face 2. Prepopulating application forms using real-time video analysis of identified objects 3. Object matching using feature aggregation over a frame sequence 클러스터 03 video processing, resolution 4~6 1. EXTRACTION AND ASSOCIATION METHOD AND SYSTEM FOR OBJECTS OF INTEREST IN VIDEO 2. Video processing to detect movement of an object in the scene 3. Concurrent home multimedia conferencing platform using a service component architecture 288
전략제품현황분석 No 주요키워드연관도수치관련특허/ 논문제목 클러스터 04 face recognition, search 6 1. Face recognition in digital images by applying a selected set of coefficients from a decorrelated local binary pattern matrix 2. Video face recognition 3. Data modeling and query processing for distributed surveillance systems 클러스터 05 클러스터 06 클러스터 07 클러스터 08 human face, extraction storage, tracker, color neural network, analysis image sensor, camera 6~8 8 4~6 8 1. Image Recomposition From Face Detection And Facial Features 2. IMAGE PROCESSING METHOD AND IMAGE PROCESSING APPARATUS FOR DETECTING AN OBJECT 3. A SIFT-point distribution-based method for head pose estimation 1. Technique for registering image data of an object 2. Method for tracking multiple image objects based on a penalty graph for avoiding hijacking of a tracker 3. Feature fusion using ranking for object tracking in aerial imagery 1. METHOD AND SYSTEM FOR FACE IMAGE RECOGNITION 2. Systems and methods for image object recognition based on location information and object categories 3. Video segmentation using neural network and distributed genetic algorithm 1. SENSOR SYSTEM AND METHOD FOR IMAGE CAPTURE OF AN OBJECT 2. Object detection and rendering for wide field of view (WFOV) image acquisition systems 3. Sensor agnostic object recognition using a map seeking circuit 클러스터 09 motion detect, movement 6 1. Systems and methods for imaging objects 2. Identification of relative distance of objects in images 3. Design and research on the motion target detection and tracking algorithm 클러스터 10 클러스터 11 feature detection, coordinate system video frame, apparatus 4~6 6 1. ROBUST FEATURE IDENTIFICATION FOR IMAGE-BASED OBJECT RECOGNITION 2. METHOD AND DEVICE FOR DETERMINING AT LEAST ONE OBJECT FEATURE OF AN OBJECT COMPRISED IN AN IMAGE 3. Smart feature detection device for cloud based video recognition system 1. Method and apparatus for feature computation and object detection utilizing temporal redundancy between video frames 2. Changing parameters of sequential video frames to detect different types of objects 3. In-video product annotation with web information mining 289
데이터인텔리전스 영상처리시스템 [ 영상처리시스템분야데이터기반요소기술 ] No 요소기술명키워드 요소기술 01 얼굴인식기술 face recognition, search 요소기술 02 색상인식기술 storage, tracker, color 요소기술03 글자, 숫자, 사물인식기술 object detection, recognition 요소기술 04 상황정보감지기술 feature detection, coordinate system 요소기술 05 상황인식모델링기술 status detection, 요소기술 06 거리센서기술 sensor, distance detection 요소기술 07 전신동작인식기술 motion detect, movement 요소기술 08 손동작인식기술 hand motion, recognition 290
전략제품현황분석 (2) 요소기술도출 산업시장분석, 기술( 특허) 분석, 전문가의견, 타부처로드맵, 중소기업기술수요를바탕으로로드맵기획을위하여요소기술도출 요소기술을대상으로전문가를통해기술의범위, 요소기술명확정 요소기술간중복성등을조정검토하여최종 [ 영상처리시스템분야요소기술도출 ] 분류요소기술출처 얼굴인식기술 기술/ 시장분석, 특허/ 논문클러스터링, 전문가추천. 객체인식 색상인식기술 기술/ 시장분석, 특허/ 논문클러스터링, 전문가추천 글자, 숫자, 사물인식기술 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 상황감지 상황정보감지기술 상황인식모델링기술 기술/ 시장분석, 기술수요, 전문가추천, 특허/ 논문클러스터링 기술/ 시장분석, 전문가추천, 특허/ 논문클러스터링 거리센서기술 기술/ 시장분석, 기술수요, 전문가추천, 특허/ 논문클러스터링 모션인식 전신동작인식기술 특허/ 논문클러스터링, 전문가추천 손동작인식기술 기술수요, 특허/ 논문클러스터링, 전문가추천 291
데이터인텔리전스 영상처리시스템 (3) 핵심기술선정 확정된요소기술을대상으로산학연전문가로구성된핵심기술선정위원회를통하여중소기업 에적합한핵심기술선정 핵심기술선정은기술개발시급성(10), 기술개발파급성(10), 단기개발가능성(10), 중소기업적합 성(10) 을고려하여평가 [ 영상처리시스템분야핵심기술 ] 분류핵심기술개요 얼굴인식기술 양안( 兩眼 ) 과코의특징및그사이의기하학적인관계를 분석기술, 얼굴전체영역기반기술, 하이브리드기반기술 등 객체인식 글자, 숫자, 사물인식기술 이미지스캔으로얻은문서를활자로인식하는기술로서, 특정서체를인식하는기술등 상황감지 상황정보감지기술 사용자인터페이스, 센서, 센서네트워크등을통해수집된상황정로를감지하는기술 거리센서기술삼각측량기반거리센서, 시간지연측정기반거리센서, 모션인식 전신동작인식기술 동작의시간적인변화를동적으로모델링하고이모델을동작인식에활용하는순차적접근법과시공간안에서이루어지는동작을전체적으로파악하고그안에서특징정보를추출하여동작인식에활용하는시공간적접근법으로구분 손동작인식기술손탐색기술, 손자세추정기술, 손동작분류기술 292
전략제품 현황분석 6. 기술로드맵 기획 가. 영상처리 시스템 기술로드맵 최종 중소 중견기업 기술로드맵은 기술/시장 니즈, 연차별 개발계획, 최종목표 등을 제시함으로 써 중소기업의 기술개발 방향성을 제시 293
데이터인텔리전스 영상처리시스템 나. 연구개발목표설정 로드맵기획절차는산학연전문가로구성된로드맵기획위원회를통해선정된핵심기술을대 상으로기술요구사항, 연차별개발목표, 최종목표를도출 [ 영상처리시스템분야핵심기술연구목표 ] 분류핵심기술기술요구사항 연차별개발목표 1차년도 2차년도 3차년도 최종목표 얼굴인식기술 얼굴인식 얼굴인식률 80% 얼굴인식률 85% 얼굴인식률 95% 얼굴인식 객체인식기술 글자, 숫자, 사물인식기술 인식률 (%)/ 객체검출률 (% 인식률 95%/ 객체검출률 80% 인식률 97%/ 객체검출률 85% 인식률 99%/ 객체검출률 90% 사물인식고도화 / 배경화면을제외한움직이는객체검출 상황감지기술 상황정보감지기술 탐지율 (%) 탐지율 75% 탐지율 80% 탐지율 85% 사건/ 사고이벤트탐지및오탐방지 최대인식 최대인식 거리센서기술 인식거리 (m) 거리 (5~10 m) 거리 (10~15 m) 최대인식거리 (15~20m) 원거리인식기술 모션인식기술 전신동작인식기술 객체추적 객체추적 70% 객체추적 80% 객체추적 90% 센서인식및추적 손동작인식기술 손동작추적 객체추적 70% 객체추적 80% 객체추적 90% 센서인식및추적 294
전략제품현황분석 다. 핵심기술심층분석 얼굴인식기술 기술개발 필요성 양안( 兩眼 ) 과코의특징및그사이의기하학적인관계를분석기술, 얼굴전체영역 기반기술, 하이브리드기반기술등이포함됨 인종, 얼굴의변화에따른인식률을향상시키는기술이필요함 스마트폰등모바일단말기에활용되고있는얼굴인식기술알고리즘을확보 기술개발전략 신경망기술을이용얼굴인식분야에접목 얼굴의변화, 인종, 조명상황등의외부변수에따른인식률향상기술개발 No 명칭 출원인 1 컬러얼굴인식을위한컬러보상장치 중원대학교 2 얼굴인식기반인맥관계형데이터베이스구축방법및이를이용한개방형서비스활용방법및시스템 한국전자통신연구원 관련특허현황 3 얼굴인식장치및얼굴인식방법박준홍 4 5 사진얼굴판별을포함하는얼굴인식기술을이용한이러 닝에서의부정행위방지방법 동적보상퍼지신경네트워크(DCFNN) 를 기반으로 한 얼굴 인식알고리즘 주식회사가온 동명대학교 6 얼굴인식형인터랙티브디지털사이니지장치 ( 주) 디지탈하우스 7 얼굴인식장치및그동작방법엠티콤 8 얼굴인식을이용한광고반응분석시스템및방법 ( 주) 코어셀 9 얼굴인식기술을이용한드라이브스루금융자동화기기모 니터제어시스템및제어방법 노틸러스효성 10 얼굴인식을이용한출입통제및근태관리시스템 ( 주) 글로비트 적용가능분야 출입통제, 감시카메라등영상감시, 인증장치 디지털사이니지, 스마트폰등휴대용단말장치 관련기업 국내 : SKT, KT, 슈프리마, 에스원, KT 텔레캅, 퍼스텍, 알마랜스코리아, 올라웍스 해외 : 애플, 페이스북, 구글, NEC 295
데이터인텔리전스 영상처리시스템 글자, 숫자, 사물인식기술 기술개발 필요성 이미지스캔으로얻은문서를활자로인식하는기술로서, 특정서체를인식하는기술등이있음 다양한서체, 해상도에대한문서인식률을높일수있는알고리즘개발 문서인식을통하여통번역프로그램과연동되는프로그램개발 기술개발전략 서체인식을통하여보안시스템으로연동되는통합보안관리시스템 이미지스캔, 동영상카메라를통하여각종사물인식시스템에적용 No 명칭출원인 1 2 글자인식방법, 글자입력제스쳐를이용한학습시스템및글자획의애니메이션효과를위한마스킹방법유아교육용학습시스템, 학습교재인식장치및그운용방법 덱스트리 ( 주) 영재오 관련특허현황 3 자석블록을이용한글자인식장치및그방법 어나더레인보우 터치스크린을가진전자기기의한글인식장치및한글 4 인식방법 트리즈코퍼레이션 5 영상신호의글자인식을위한전처리장치및방법삼성전자 6 차영상과신경망을이용한자동차번호판인식방법인스프리트 7 터치스크린방식이동통신단말기의한글인식방법엘지전자 적용가능분야 CCTV, 각종카메라를통한보안장치 이미지문서인식, 통번역소프트웨어, 명함인식등모바일단말기관련앱 관련기업 국내 : 삼성전자, 네이버, 코테크시스템, KT, SKT 해외 : Google, Apple, Microsoft, Adobe 296
전략제품현황분석 상황정보감지기술 기술개발 필요성 사용자인터페이스, 센서, 센서네트워크등을통해수집된상황정로를감지하는기 술로서사용자요구에맞는최적의의사결정을분석하고예측하는인공지능개념 위치인식( 매크로, 마이크로) 기술, 시간정보감지, 대화, 문자의인식을통하여상 황을감지하는기술등이필요함 기술개발전략 상황황정보를수집하고교환하기위해서는표준화된모델링기술이필요하며이 표준화를통해서개발자가다양한하드웨어장치와인터페이스할수있도록개발 동일한상황에따른인식정보를최적화하여정확한상황분석이가능하도록개발 No 명칭 출원인 1 다중센서신호기반의상황인식방법및장치 성균관대학교 2 스마트밴드및이를이용한위험상황모니터링방법 엘지전자 3 상황정보기반혈관성질환용사용자맞춤형건강관리방법및이를위한혈관성질환용생체정보측정목걸이 유나이브 4 상황인식기반서비스제공방법및그전자장치 삼성전자 관련특허현황 5 위험상황을인식하는음향감시방법 광주과학기술원 위급상황음성인식기반절전형스마트 LED 조명제어 6 장치 서울과학기술대학교 7 상황인식기반의빌딩에너지관리시스템및그를이용한빌딩에너지관리방법 포스코아이씨티 8 상황인식기반지능형피난안내시스템큐브인 9 상황인식서비스시스템세림소프트 10 상황인지기반의상황정보추론방법및이를위한장치에스케이텔레콤 고객데이터분석을통한인터넷물품구매 적용가능분야 빅데이터기반가상비서 교통상황알림, 네비게이션 환자의질병예측, 건강관리 관련기업 국내 : 삼성전자, LG 전자, 네이버, KT, SKT 해외 : Google, Apple, Microsoft 297
데이터인텔리전스 영상처리시스템 거리센서기술 기술개발 필요성 삼각측량기반거리센서, 시간지연측정기반거리센서로구분되며, 방식으로는초음 파, 레이저, 적외선등으로나누어짐 센서응용시스템의목적과대상, 장소, 상태/ 조건, 시기, 방법등을고려하여선택 기술개발전략 센서가수집한정보중에서필요없는양을제거하고, 유용한정보만을선택하고, 미약한것은증폭하고, 목적에따라연산하고, 필요로하는곳에전송하는것등으 로센서응용시스템개발에중요한항목임 No 명칭출원인 1 2 반사광거리센서를이용한깊이조절의료도구및그의 제어방법 휴대단말과연동하는아두이노기반의거리/ 온도/ 습도센 서를이용한스마트선풍기및이의구동방법 부산대학교 공주대학교 3 영상및거리데이터를이용한위치인식장치및방법 삼성전자 압전소자를이용한주차유무감지센서노드및이를이 4 용한주차관리시스템 아이엔티 관련특허현황 5 카메라렌즈초점거리정보를이용한거리계산방법영남대학교 6 거리센서, 3차원이미지센서및그거리산출방법삼성전자 7 거리측정센서를이용한세그보드및이의구동방법한남대학교 8 9 10 레이저거리센서를이용한도로의연석추출방법및 도로의연석정보를이용한이동로봇의위치측정방법 다중구조의근거리영상감지에의한객체인증장치및방 법 차량주변의초근거리장애물을감지하는기능을갖는차 량용주차보조시스템및그동작방법 고려대학교 키움소프트 현대모비스 자율주행자동차, 속도감시및사물인식카메라 적용가능분야 자동조립장치, 물체포지셔닝크레인, 로봇등자동화장비 진단치료에필요한의료용센서시스템 관련기업 국내 : 여명시스템, 유비트로닉스, I3System, Autonics, 만희기전 해외 : Bosch, Honeywell, Freescale, Analog Device, BEI Tech, Nonasensor, Measurement Specialities, Colibrys, Hitachi 298
전략제품현황분석 전신동작인식기술 기술개발 필요성 입력영상으로부터영상에포함된사람들의동작을인식하는기술로써영상감시, 사람- 컴퓨터상호작용, 지능로봇등다양한적용분야를갖고있음 저비용거리센서를이용하여 적용이가능함 3차원자세추정기술이등장하여다양한산업분야에 기술개발전략 동작의시간적인변화를동적으로모델링하고이모델을동작인식에활용하는순차적접근법과시공간안에서이루어지는동작을전체적으로파악하고그안에서특징정보를추출하여동작인식에활용하는시공간적접근법으로구분됨사용자의인체를검출하고전신관절을추적하여실공간에존재하는사용자의자연스러운상호작용을할수있는기술을개발 No 명칭출원인 1 2 접촉식터치로인식되는비접촉식동작인식사용자인터페이스영상에서동작인식을위한특징점추출방법및골격정보를이용한사용자동작인식방법 박소은 이화여자대학교 3 복수의센서를이용한동작인식방법및장치 SK텔레콤 4 전자기기에서의동작인식시스템및방법전남대학교 관련특허현황 5 골프동작분석장치및방법전자통신연구원 6 동작인식 음성인식을통한터치리스패널스마트조명시스템큐앤웍스 7 자세또는동작을인식하기위한방법, 디바이스, 시스템 및비일시성의컴퓨터판독가능한기록매체 퓨처플레이 8 동작인식을통한태권도품새평가시스템및방법콘텐츠비전 9 제스처인식을이용한차량용음성인식시스템미디어젠 10 동작인식에기반한자동차모의운전제어장치및그방 법 전자부품연구원 적용가능분야 PC, 모바일기반인터랙티브가상현실영상콘텐츠, 게임, 가상체험시스템 골프, 야구등스포츠동작분석시스템 관련기업 국내 : SKT, KT, LGU+ 해외 : 애플, 구글, 마이크로소프트, 프라임센스, 익스트림리얼리티, 닌텐도 299
데이터인텔리전스 영상처리시스템 손동작인식기술 기술개발 필요성 손탐색기술, 손자세추정기술, 손동작분류기술등으로구분되며, 스마트모바 일디바이스의확산과더불어동작인식기술은터치인터페이스를넘어서미래의 새로운인터페이스기술로각광받을전망임 비접촉식의동장인식기술의정확도증가는손과팔, 발, 그리고몸전체의움직 임을동작인식에활용하는형태로확장 크지않은동작을대상으로손동작인식률향상기술개발및성능향상필요 기술개발전략 특정한제스쳐, 행동에대한인식에서복잡하고, 복합적인상호작용이가능한동작 인식수준향상이필요함 동작인식기반의 UI가확대되면서기존스마트디바이스를조정하는인터페이스 방식의변화에대응하는개발전략이필요함 No 명칭출원인 관련특허현황 1 2 3 4 5 손동작화상을이용한컴퓨터보안장치, 손동작화상을이용한컴퓨터보안방법및그기록매체손동작인식을이용한접근제어시스템, 이를위한방법및이방법이기록된컴퓨터판독가능한기록매체손동작기반문자입력장치및이를이용한문자입력방법손동작자동구현용로봇핸드및그를이용한가위바위보게임머신손동작기반의인터페이스장치및이를이용한포인팅방법 엘지이노텍경일대학교전자부품연구원케이엠시스숭실대학교 6 손동작을이용한로봇코칭시스템 ( 한성대학교 7 손동작인식을이용한프리젠테이션실행시스템동진컴퍼니 8 손동작인식장치및그방법계명대학교 9 10 모션트래커시스템및자세방위시스템을통합하여 3차 원가상공간에서손의위치및자세정보를구현하는움 직임감지시스템 사용자의손동작및음성에기초하여사용자가의도한텍 스트를취득하는웨어러블컴퓨터및사용자가의도한텍 스트를취득하는방법 연합정밀주식회사 홍익대학교 적용가능분야 영상기반보안시스템, 노약자모니터링장치, 지능로봇, 자동차제어 손, 팔움직임전자기기작동기기, 착용형스마트기기, 원격치료등의료분야 관련기업 국내 : 삼성전자, 엘지전자, 케이엠시스, 체이시로보틱스 해외 : 구글, 마이크로소프트, 프라임센스, 립모션, 플러터, MYO, PointGrab, Elliptic Lab 300
전략제품현황분석 인공지능기반 SW
인공지능기반 SW 정의및범위 인공지능기반머신러닝소프트웨어는비정형, 정형데이터, 사진, 동영상등다양한멀티콘텐츠에 대한상황정보(Context) 를인지하고, 대용량데이터를학습하고분석하여사용자가원하는정보를 신속하게검색, 추천, 예측하는기술을의미 다양한머신러닝소프트웨어가있으나크게금융분야와, 학습을통한추천/ 예측분야로분류 정부지원정책 한국정부는 2013년부터 10년간지식공유및지능진화가가능한인공지능SW 개발을목표로 엑 소브레인(Exobrain) 프로젝트를추진 인공지능분야에대한정부의관심이최근높아지고있으며, 로봇산업, 컴퓨팅( 감성, 인지등), 빅데 이터, 자율주행자동차등의분야에서인공지능세부기술이 R&D로추진되고있음 미래부는 2017년 5 월까지인공지능연구개발로드맵을수립하고, 핵심기술을확보하는인공지능 국가전략프로젝트를추진하기로함 중소기업시장대응전략 최근급속한기술발전 강점 (Strength) 다양한분야에바로활용되는서비스기술 기회 (Opportunity) 로봇, 자율주행자동차등으로파급효과가큼 정부차원의 R&D 활발 약점 (Weakness) 구굴등글로벌회사로부터의기술종속 연구인력의부족위협 (Threat) 대규모투자자원확보가어려움 통신사및포털과의협력이어려움 중소기업의시장대응전략 로봇, 자율주행자동차, IoT 등에적용할머신러닝알고리즘개발로중소기업경쟁력확보 추천시스템, 의료서비스, 차세대고객관리등인공지능기반서비스모델개발 웹/ 모바일/ 사물인터넷/ 자동차등에인공지능기반의서비스를제공함으로서새로운수익창출
핵심기술로드맵
전략제품현황분석 1. 가. 개요 정의및필요성 인공지능(AI; Artificial Intelligence) 에대한정의를내리는문제는지능이란것이추상적, 복 합적, 상대적이어서정의를내리기어렵기때문에여전히논란의대상이되고있음 넓은의미로생각해본다면어떠한인공물에대해서인간과같은지적인활동을할수있도록지능을부여하는것, 특히인간의지능적인활동을할수있도록컴퓨터를구현하는것을인공지능이라고할수있음 지능적행위는복잡한환경에서의지각, 추론, 학습, 의사전달, 행동을포괄하며, 인공지능의 궁극적인목표는이러한일을사람이상으로잘수행하는기계를개발하는것이며, 지능적행 위의주체로는기계, 사람또는동물, 그무엇이든관계없이그일을이해하고수행하는것이 인공지능의또다른목표 대표적인인공지능의 3 대요소는새로운지식을추가하고, 기존지식을수정하는능력인 학 습, 문제의본질과의미를파악하는능력인 이해, 문제의해결책을탐구하고결정하는능력인 추론 [ 인공지능의 3 대요소 ] 305
데이터인텔리전스 - 인공지능기반 SW [ 주요연구자및기관에서보는인공지능에대한정의 ] 연구자및기관 John MacCarthy (1955) Charniak and McDermott (1990) kurzwil (1990) Rich and Knight (1991) Schalkof (1991) Luger and Stubblefield (1993) Gartner ( 웹페이지) technavio (2014) BCC Research (2014) 인공지능에대한정의 지능적인기계를만드는엔지니어링및과학 여러계산모델을이용하여인간의정신적기능을연구하는것 인간에의해수행되어질때필요한지능에관한기능을제공하는기계를만들어내는작업으로정의 컴퓨터가특정순간에사람보다더효율적으로일을할수있도록하는연구 인간의지능적인행동양식에있어계산적과정을이용해모방하고설명하는것에대한연구분야 지능적인행동의자동화에관한컴퓨터과학의한부문 인공지능은특별한임무수행에인간을대체, 인지능력을제고, 자연스러운인간의의사고통통합, 복잡한콘텐츠의이해, 결론을도출하는과정등인간이수행하는것을모방하는기술 스마트기기는인지컴퓨팅( 인공지능과기계학습알고리즘이적용된) 이임베디드된기기로볼수있음 스마트기기는불확실혹은다양한환경하에서업무를수행할수있도록고안된하드웨어및소프트웨어시스템으로정의 NIA 인공지능은인간의학습능력과추론, 지각, 이해능력등실현하는기술 * 출처 : ETRI, 인공지능기술과산업의가능성, 2015 여러정의를종합하여인공지능을정의하여보면, 스스로사물을이해하고, 주변환경을인식하여 그에대하여유연성있게적응반응하고, 그러한경험에근거하여학습할수있는기계를만드는 학문이라할수있음 지능(Intelligence) 이란삶에서목적을이루기위한능력의일부로다양한종류와정도의지능이인간과많은동물들그리고기계에존재 지능이있을때비로소경험을이용한이해, 생각하고추론하는능력, 새로운상황에신속히 대처하는능력, 새로운지식의습득( 학습) 및응용과같은일들을수행할수있음 인공지능은 공학적관점 과 과학적관점 으로나누어접근할수있음 306 공학적관점 : 사람의지능을필요로하는작업을수행할수있는기계를구현하는것. 일반적으 로언급되는개념의인공지능
전략제품현황분석 과학적관점 : 컴퓨터를하나의도구로보고, 컴퓨터를이용하여인간지능의본질과사고과정을 밝혀내는것 따라서공학적입장에서는전산학, 통계학, 물리학, 수학등의학문이개입하게되고, 과학적입장 에서는심리학, 언어학, 신경과학, 생리학등의학문들과함께연구가되어야만올바른인공지능에 대한연구를수행할수있음 과거의컴퓨터이용기술과인공지능기술의차이로는, 과거의컴퓨터이용기술은주어진절차 (Algorithm) 에따라어떠한작업을수행하는데그쳤으나, 인공지능의목표는어떻게컴퓨터에 게인간과같은지능(Intelligence) 을부여하는가에있음 과거의컴퓨터는주로처리속도와정확성등의특성을활용할수있는분야에이용되어왔고, 독창성, 경험, 직감력등은인간공유의영역으로인식되어왔지만, 이러한면에서인공지능이 란넓은의미의지능, 즉언어를이해하고, 사물을인식하고학습하며, 지식과경험을토대로 추론하고, 문제를해결하는등의특징을소유한인간과유사하게사고하는지적인컴퓨터시스 템을고안하려는것임 인공지능은소프트웨어(software) 이기때문에그자체로존재하는것이아니라컴퓨터과학의다른분야와직 간접적으로많은관련을맺고있으므로, 단독으로발전하는것이아니라직 간접적으로관련을맺고있는다양한분야의학문들과더불어발전해야함 컴퓨터가지능적행위를어느정도하고있느냐를평가하는대표적인방법중하나는튜링검사 (Turing Test) 라고알려진방법으로, 기계가과연지능적인행위를할수있는가를판단하는방법으로컴퓨터의지능적행위의평가방법 검사방법은검사자 P1와피검사자로서컴퓨터 C1와사람 P2 가있고, 검사자와피검사자사이에 는벽이있으며이들은타자시스템을이용하여서로대화를진행 검사자가컴퓨터와사람에게질문하고대답이오가는상황에서검사자가생각했을때, 누가컴퓨터이고누가사람인지모르겠다는판단이든다면이컴퓨터는지능적인행위를수행한다라고판단하는것 307
데이터인텔리전스 - 인공지능기반 SW [ 튜링검사(Turing Test) ] 최근이분야의연구와기술적발전에힘입어전문가시스템, 자연어이해, 컴퓨터시각등의 분야에서연구단계를넘어서실용화, 상업화될수있는가능성을보이고있음 인공지능기술은 21 세기초반에가장기대되는산업으로, 일본의경우에는이른바제 5세대 컴퓨터개발프로젝트라하여 발에박차를가하고있음 1982년부터인공지능기술을지원할하드웨어와소프트웨어의개 현대의인공지능은구글의 알파고(Alpago) 가세계바둑 1 인자인 이세돌 9단을압도하면서 대중들에게본격적으로알려지기시작하였으며의료, 이용하려는시도가이루어지고있음 금융등다양한산업에서도인공지능을 현재의인공지능은약한인공지능으로인간의판단에보조적인역할을하는수준이지만, 그럼에도불구하고이미인공지능의시대가도래하였다하여도과언은아님, 머지않아인공지능의학습능력과진화속도는비약적으로성장하게될것이고, 인공지능컴퓨터의도입은선택이아닌필수가될것임 308
전략제품현황분석 [ 인공지능변천사 ] 연도 내용 1943년 AI 최초연구 인공뉴런 모델제안 1947년사이버네틱스제창 1956 ~ 1960년 AI SW 언어 LISP 탄생 1963년 PS프로젝트개발 1965년전문가시스템기술 DENDRAL 도입 1974년전염성혈액진단시스템 MYCIN 개발 1977년지식공학제창 1980년인공지능제품판매 1987년단어계산, 식기세척기실생활도임 1995년지능적에이전트출현 2011 년 MB 왓슨퀴즈쇼에서인간에승리 애플음성인식 Siri 아이폰4S에공개 2013년구글지식그래프론칭 2016년구글 알파고 세계바둑 1 위 이세돌 에승리 309
데이터인텔리전스 - 인공지능기반 SW 나. 범위 (1) 인공지능의정의와목표에따른분류관점 인공지능에대해의견이분분한이유는 지능 에대한사람들의생각이다르기때문임 크게두부류로나눌수있는데인공지능은인간과똑같은사고체계를가지고문제를분석하 여행동할수있는즉, 인간의마음과정신을지니고있어야한다고주장하는쪽과, 특정목적 을띈인간의여러지능적행동들( 수학이론을증명하고, 글자를읽고쓰면서사람과대화하거 나, 장애물을피해길을걸으며, 시를쓰거나음악을연주하는것등) 을수행하는것도인공지 능이라고생각하는쪽 - - 인간의마음과정신을지니고있어야한다고주장하는 강한인공지능(Strong AI) 사람과같은지능을만들고자함 어떤문제를실제로사고하고해결할수있는인공적인지능 - 인공지능은사람과똑같은사고체계를가지고문제를분석하여행동할수있는사람의마음과 정신을가지고있어야한다고주장 - - - 인간이할수있는모든지적인업무를성공적으로해낼수있는가상적인인공지능 자의식을가진사람과같은형태의스스로사고하고문제를해결하는인공지능 예) 아이언맨 자비스, 터미네이터 스카이넷 등 특정목적을띈여러지능적행동들을수행하는 약한인공지능(Weak AI) 특정문제를해결하는지능적행동을만들고자함 - 단위기능을지능적으로수행 지능을흉내내는프로그램의개발 - 이성적업무의연구, 완수를위한인공지능 - - 인간의인지적능력중일부만수행가능한인공지능 특정문제를해결하기위한도구에가까움 예) 구글 알파고, IBM 왓슨 등 * 출처 : Stuart Russell, Artificial Intelligence: A Modern Approach [ 인공지능의구분 ] 310
전략제품 현황분석 (2) 인공지능의 3대 주요 기술 관점 인공지능의 3대 주요 기술인 학습 을 이해하기 위해서는 먼저 인간의 뇌를 이해하는 것이 중요 함 인간의 뇌를 단순화하여 구현한 것이 신경회로망이며, 이 신경회로망이 업그레이드된 기술 이 최근의 딥 러닝(Deep Leaning) 분야임 신경회로망은 연결성 모델(Connectionist Model), PDP(Parallel Distributed Processing), 또는 뉴로모픽 시스템(Neuromorphic Systems)이라 불리우는 것으로 기본 단위는 뉴런 신경회로망 모델은 모두 단순한 계산소자의 연결을 통해 좋은 성능을 나타낸다는 것을 기본으로 가정함 - Rumelhart와 McClelland는 신경회로망의 기본 구성 요소를 처리기(processing units), 활성화 상태(activation state), 각 처리기에 대한 출력 함수(output function), 각 처리기간의 연결 패턴 (connectivity pattern), 전파 규칙(propagation rule), 활성화 규칙(activation rule), 학습 규칙 (learning rule), 환경(environments) 등 여덟 가지로 제시 - 신경회로망에서 학습개념은 매우 중요한데, 한 처리기의 지식 변화는 인접된 다른 처리기에도 변 형을 주며, 기존 연결의 강도수정으로 이루어지며, 이러한 연결 강도는 경험적으로 변형되며, 연결 강도의 변화를 학습 규칙이라 함 - 신경회로망에서 학습하려면 어떤 기준이 필요하며, 그 평가 기준에 의해 평가한 결과를 피드백하 여 처리 기간의 가중치를 조절 - 평가 방식은 교사 학습과 무교사 학습의 두 가지 방법이 있고, 외부에서 교사 신호(teaching input)로써 입력 신호에 대한 정답 출력을 주는 방식의 학습 방법을 교사 학습(supervised learning)이라 하고, 평가 기준은 있으나 일일이 교사 신호를 주지 않은 학습 방법을 무교사 학습 (unsupervised learning)이라고 함 *출처 : 주간기술동향, 인공지능 기술 동향 및 발전 방향, 16. 2. 17 [ 다층 신경회로망 구조 ] 311
데이터인텔리전스 - 인공지능기반 SW * 출처 : 주간기술동향, 인공지능기술동향및발전방향, 16. 2. 17 [ 딥러닝패턴분류방법 ] - 가장일반적인신경회로망은다층신경회로망으로출력값(output) 은교사신호(target) 값에의해 반복적으로에러( 출력값과교사신호의차) 를교정하면서학습을진행하는알고리즘 - 기존의다층신경회로망에서는빨간색과파란색의두패턴을단일선(decision boundary) 으로 분류하기어려웠으며, 딥러닝에서는데이터공간을구부리고휘고회전시키는방법을사용하기 때문에공간상두개의패턴이단일선으로도충분히분류될수있다는특징을가짐 추론방법이여러가지있지만가장기본적이며많이사용하는것은 Max-Min CRI 방법으로 Mamdani 가제안한최소연산법칙(mini-operation) 을사용하며, 합성기호로 Max. Min 연산을 이용하는방식 Max-Min CRI 방법은직접법(direct method) 또는 Zadeh의추론방법이라고도함 - Max-Min CRI 방법은규칙베이스에규칙이 IF X is A THEN Y is B 형태로있어서규칙베이 스의모든규칙들은 B 를구하기위한추론방법 형태의가능성분포로표현될경우, 입력사실 A 에대한추론결과 - 이식은한규칙에서추론결과 B 를생성하는의미를가진표현이지만동시에퍼지추론방법의 전체적개요를보여주는식이기도함 - R은 Zadeh가제안한행렬형태로나타내기도하며대부분행렬형태가아닌경우로서다음의과 정에의해결정 312
전략제품현황분석 - 이식의 A B 값을산출 연산을위해몇개의단계를거친후비퍼지와과정에의해수치화된비퍼지 - 신경회로망과퍼지이론은융합구조에따라뉴로퍼지시스템으로융합되며, 뉴로퍼지시스템모델의기본구조를신경회로망을기본틀로볼것이냐퍼지이론을기본틀로볼것이냐에따라분류가능 인식은학습을바탕으로새로운자료나불확실한자료가주어졌을때추론을통해알아차리는과 정이며, 기본적으로인식을위한단위를패턴(pattern) 이라고하고, 하나의패턴은하나의유니트 (unit) 나개념을표현 대표적인패턴으로는글자인식, 영상인식, 음성인식의범위에포함시킬수있으며, 학습과추론을 바탕으로불확실한패턴을인식하여표현 인식의한예로구글에서사용자의성향을파악하여서비스의차별화를시도하는것 (3) 인공지능의관련기술분류관점 기술 내용 인지컴퓨팅 (Cognitive computing) 컴퓨터가인간과같이정보를습득하고그정보를이용해의사결정을할수있는모델의과정을시뮬레이션하는기술 인지시스템은데이터들로부터그자신만의추론을통해결론을도출 기계학습 (Machine learning) 프로그램화된논리( 로직) 나정형화된규칙등을바탕으로발생되는데이터를통해학습하는수리/ 수학적알고리즘을의미함 기계학습알고리즘은확률적모델을세우고비슷한데이터셋과관련된내용을토대로가정하고예측하게되는과정을거침 딥러닝 (Deep learning) 기계학습과유사하지만인간신경망을모델화하여새로운데이터셋을예측하는기술임 예를들어특정이미지나음향및동영상데이터를패턴분석을수없이많은학습을통해스스로무엇인지를인지하는기술 응용프로그램인터페이스예측 (Predictive application programming interfaces) API는표준화된입출력방식을통해소프트웨어모듈에접근하도록공식화해줌 이런 API에대한예측화를통해프로그래머가실제적용해야될입출력방식을보다빠르게제안해줄수있음 자연어처리 (Natural language processing) 컴퓨터가인간의언어를알아들을수있게하여인간처럼말하고쓸수있도록하는기술 다양한인간의언어를가지더라도의사소통이가능하게하는것역시자연어처리로볼수있음 이미지인식 (Image recognition) 사람들이보고있는특정피사체의사진의정체를확인하고자시도하는기술 사람이볼수없거나지진계와같은파형등도이미지패턴인식에포함될수있음 313
데이터인텔리전스 - 인공지능기반 SW 음성인식 (Speech recognition) 인간의발성하는음성을이해하여컴퓨터가다룰수있는문자( 코드) 하는기술 정보로변환 패턴인식 (Pattern recognition) 기계에의하여도형 문자 음성등을식별시키는것 현재로서는제한된분야에서실용화되고있고, 본격적인패턴인식은아직연구단계 자연어처리 (Natural language processing) 인간이보통쓰는언어를컴퓨터에인식시켜서처리하는일 정보검색 질의응답시스템 자동번역및통역등이포함 자동제어 (Automatic Control) 제어대상에미리설정한목표값과검출된먹임(feedback) 그오차를자동적으로조정하는제어 신호를비교하여 로봇틱스인지로봇공학 (Robotics) 로봇에관한과학이자기술학으로로봇의설계, 제조, 응용분야를다룸 인지로봇공학은제한된계산자원을사용해복잡한환경의복잡한목표를달성하도록하는인식능력을로봇에게부여하는기술 컴퓨터비전 (Computer vision) 컴퓨터비전은로봇의눈을만드는연구분야로컴퓨터가실세계정보를취득하는모든과정을다룸 가상현실 (Virtual Reality) 어떤특정한환경이나상황을컴퓨터로만들어서, 그것을사용하는사람이마치실제주변상황 환경과상호작용을하고있는것처럼만들어주는인간-컴퓨터사이의인터페이스 양자컴퓨터 (Quantum computer) 양자역학의원리에따라작동되는미래형첨단컴퓨터양자역학의특징을살려병렬처리가가능해지면기존의방식으로해결할수없었던다양한문제를해결가능 자동추론 (Automated Reasoning) 계산기과학의한분야로추론의다양한측면을이해함으로써컴퓨터에의한완전한자동추론을가능하게하는소프트웨어개발을목표로함 인공지능연구의일부로이론계산기과학및철학과도깊은관계가있음 사이버네틱스 (Cybernetics) 생물및기계를포함하는계( 系 ) 에서제어와통신문제를종합적으로연구하는학문 데이터마이닝 (Data mining) 많은데이터가운데숨겨져있는유용한상관관계를발견하여, 정보를추출해내고의사결정에이용하는과정 미래에실행가능한 지능엔진 (Intelligent Agent) 인공지능적기능을가진소프트웨어엔진사용자를보조하고반복된컴퓨터관련업무를인간을대신하여실시하는엔진 시멘틱웹 (Semantic web) 컴퓨터가정보자원의뜻을이해하고, 논리적추론까지할수있는차세대지능형웹 314
전략제품현황분석 (4) 인공지능의연구분야관점 자연어처리분야 인간이컴퓨터와상호작용을하는매개체가대체로언어(language) 이므로일상생활에서사용하는 자연언어를컴퓨터가이해할수있게프로그래밍한다는것은인공지능이당면하고있는연구분 야중가장어려운문제 70년경예일대학교에있는 ROGER SCHANK는인간의행위에관한자연언어를처리할수있는 프로그램을발표 이프로그램은개념적의존성(CONCEPTUAL DEPENDENCY) 의프리미티브(PRIMITIVE) 라고부르 는것에기반 프리미티브는 - MT-RANS ; 말하고, 듣고, 읽고, 쓰는것과같은정신적인정보를전달하는모든행위의집합 - ATRANS ; 사고, 팔고, 주고, 받는것과같은소유의이동을나타내는집합 - ATTEND ; 보기, 듣기, 냄새맡기, 맛보기등과같은감각행위를나타내는집합 - SCHANK 는소수의프리미티브로모든인간의행위를서술할수있다고주장하고있으나, 지가장강력한이이론도아직논란중임 현재까 음성인식분야 이미실용화된기초적인시스템들은제한된사람들에의한아주제한된어휘들만을인식가능하며, 각단어는명확하게발음되어야하고동시에각낱말들은조금씩띄어서말해야함 이들시스템들은오류를발생시키기도하며, 언어처리기술에의해제한을받기도함 음성인식문제가해결되어문장을구성할경우자연 전문가시스템분야 어떤특정한분야의전문가처럼생각하고추론할수있는프로그램으로, 예를들어, 의료진단전 문가시스템은환자의상태를입력받아이를바탕으로질병을판정하는정보를얻기위해데이터 베이스를검색 회로고장수리전문가시스템은회로의고장을진단하고, 법률전문가시스템은사용자에게법률에 관한상담을하고유전학자전문가시스템은유전자를그응용의범주로함 실제로전문가시스템을만드는것은기계에게지능을줄수있는가능성을테스트하며이것은인공지능의가장완벽한응용분야 인공지능연구분야의핵심분야가된전문가시스템개발은한편으로는인간의사고능력과일치하는기계가현재의기술가능성을능가할지도모른다는것을용인한것 315
데이터인텔리전스 - 인공지능기반 SW 초기의인공지능연구자들은어떠한상황에서라도평범한사람과같은기능을갖는일반적인생각 하는기계(GENERAL THINKING MACHINE) 를개발하길원함 GPS(GENERAL PROBLEM SOLVER) 와같은이러한시도는많이상이한상황에서제대로성능을 발휘하지못하는비효율적인방법임이밝혀지며, 점점특수한상황에맞는특별한프로그램을개 발하는쪽으로경향이바뀜 이와같은변화의이면에는 10살짜리꼬마의폭넓은지식을완벽하게재현하는프로그램은불가 능하지만제한된영역의전문가와같은폭이좁지만깊이있는지식을갖는프로그램은제작가능 하다는현실적배경이뒷받침됨 영상처리분야 시각적인영상을인식할수있는- 인간의감각으로 본다 라는-프로그램을설계하는것은스스로어 떤일을처리할수있는시스템을개발하기위하여인공지능연구자에게는꼭필요함 영상인식(IMAGE UNDERSTANDING) 시스템은궤도문제( 예, 가장효율적인방법으로로버트의 팔을움직일수있는), 이동문제등과같은또다른로봇(robot) 프로그래밍문제들을해결 로봇(robot) 분야 오늘날로봇은느리고, 서툴고, 영리하지못하고, 대부분장님이지만이미자동차를제작하고농작 물을경작하고또한다른생산적활동의중요한역할을해옴 비록시각은극히제한되어있고촉각기능이없고제한된이동만을할수있지만, 반복적이고구 조화된제조환경에서는별문제를발생시키지않으며, 공장에서로봇기술의구현은모든경우에 항상실제적인생산성향상으로직결 게임과탐색분야 모든가능한행위의조합에서모든범위를다조사한다는것은나무(tree) 의모든가지를추적하 는것과동일하며최적의순서가보장된다는것이확인 하지만대부분의경우에있어서탐색트리(search tree) 가너무커서완전히탐색한다는것은적합 하지못하며, 그러므로대부분의인공지능프로그램은경험적(heuristic) 원리나형식화되지않은 실용적방법을적용 따라서탐색에있어서모든경우의수중에서가장가망성이있는행위들의조합만을탐색하며, 일반적으로이런경험적원리의사용은최적의결과가발견되었다는것을보장할수없음 경험적탐색(heuristic search) 방법은주로로봇이어떤물건을다루는계획이나로봇자신이공 간에서이동하는계획프로그램에서주로적용 서양장기(CHESS), 체커(CHECHER), 서양주사위놀이(BACKGAMMON) 등과같은게임프로그 램은경험적탐색이적용되는유용한예 316
전략제품현황분석 학습과추론 컴퓨터가경험을통하여자신의능력을확장하지않는한프로그램의성능은프로그래머의지식과 통찰력과유용한시간에의하여제한. 따라서학습(LEARN) 은인공지능에서특별히중요한관심분 야임 60년경 IBM에있는 ARTHUR L.SAMUEL이만든체커프로그램은학습을진화와자연적선택구 조를모의(SIMULATE) 하게끔설계. 개조된정도를평가하기위하여기록시스템하에서이프로 그램의한버전(VERSION) 과다른버전이시합을하며, 이와같은방법으로주어진기록시스템과 시스템의변화가직접경쟁으로테스트되고이긴버전이새로운변종을구성하기위하여존속됨 (5) 인공지능의레벨에따른관점 인공지능을하나의 에이전트 라고인식하고, 능이해는것이조금더용이 입력과출력의관계로보면우리가말하는인공지 흔히 인공지능 이라고하는것을그수준에따라레벨 1에서레벨 4 단계로나눌수있음. 레벨 1, 단순한제어프로그램 : 레벨 1 은마케팅적으로 인공지능,AI라고지칭하는것이며지극 히단순한제어프로그램을탑재하고있는전자제품을 인공지능탑재 라고부르는경우가이에해 당 예) 제어단계로, [ 세로몇센티이상, 가로몇센티이상, 높이몇센티이상의짐은대( 大 ) 라는 장소로이동하고, 몇센티에서몇센티까지는중( 중) 으로, 몇센티미만은소라는장소로이동하 라] 는것이빠짐없이엄격한룰로정해져있고, 그대로움직임 레벨 2, 고전적인인공지능 : 레벨2 는행동의패턴이지극히다채로운경우에서의지능. 장기프 로그램이나청소로봇혹은질문에대답하는인공지능이이에해당. 소위고전적인인공지능이라 하는데, 입력과출력관계를맺는방법이세련되어입력과출력의조합수가극단적으로많은경우 를주로말함 - 이때인공지능은적절한판단을내리기위해추론/ 탐색을하거나, 기존에보유한지식베이스를 기반으로판단하기도하며, 고전적인퍼즐을푸는프로그램이나진단프로그램이이에해당 예) 탐색, 추론혹은지식은사용하는방법으로, 짐의세로-가로-높이- 무게등의정보로분류하고, 지시하지만짐의종류에따라많은지식이담겨있음 예를들어 취급주의 라는태그가붙어있으면 조심스럽게다루라 라든지, 골프가방은세워두고, 생 선식품은냉장고로이동하라는식 레벨 3, 기계학습을받아들인인공지능 : 레벨3은검색엔진에내장되어있거나빅데이터를바탕으 로자동적으로판단하는인공지능 317
데이터인텔리전스 - 인공지능기반 SW - 추론의구조나지식베이스가데이터를바탕으로학습되는것으로전형적으로기계학습의알고리 즘이이용되는경우가많고, 기계학습이라는것은표본이되는데이터를바탕으로규칙이나지식 을스스로학습하는것 - 이기술은패턴인식이라는과거부터의연구를기초로 1990년대부터진행되어 2000년대들어와 빅데이터시대를맞으면서더욱진화중이며최근의인공지능은이레벨3을일컫는것이보통 예) 기계학습의단계로처음부터엄격한룰혹은지식이주어져있지않으며몇가지의샘플을주 고 이것은대 이것은중 이것은소 라는룰을배우게되면학습이후에는 이것은대( 대) 이군, 이것은중( 중) 이네 이것은대( 대) 도아니고중( 중) 도아니다 라고스스로판별하고구분할수있 게됨 레벨 4. 딥러닝을받아들인인공지능 : 기계학습을할때의데이터를나타내기위해서사용되는 입력값(input) 또는특징(feature) 자체를학습하는것이이단계로 특징표현학습 이라고부름 예) 특징표현학습방식은특징을스스로발견하는단계이며, 예를들면골프가방을몇가지묶어 이타입의짐은사이즈가 대 일지도모르지만다른것과는분명히같지않은형상이므로다르게 취급하는편이좋겠다 라고판별하고, 그러한 골프가방의짐을취급하는룰 을스스로만들게됨 - 시간이흘러간만큼가장효율적인구분의방법을배워가는것이레벨 4의 AI. 318
전략제품현황분석 2. 산업환경분석 가. 산업특징및구조 (1) 산업의특징 인공지능산업은인공지능에대한정의, 양하게구분 기술및시장의범위등에의해조사기관마다매우다 산업적관점에서봤을때인공지능은인지, 학습, 추론등인간의사고능력을모방하는인공지능 관련기술을접목해제품및서비스경쟁력을제고시키는산업을포괄 - Frost&Sullivan(2015) 는인공지능관련시장을크게하드웨어와소프트웨어로양분함 [ 인공지능시장별특성및기업 ] 구분형태특성기업/ 서비스 하드웨어시장 B2B 인공지능작업을수행하는 CPUs 설계및제조 TeraDeep Intel IBM Qualcomm B2B2C 인공지능작업을수행하는 APls나 Plastform 형태로제공하는 PaaS 서비스 MetaMind IBM Watson Microsoft Asure Amazon Web services Google cloud 소프트웨어시장 B2B 기업의니즈에따라다양한인공지능을 SaaS 방식으 로제공 기능중심( 판매, 마케팅) 이나서비스( 자연어처리, 예측 분석) 따라범주화 Haiku Deck( 생산성) Thoughtly( 리서치) Zephyr( 헬스) Celect( 소매) Kasisto( 금융) B2C 서비스정확성향상을위한지능을최종소비자에게제공검색, 통역, 콘텐츠필터링, 음성인식, 영상광고 Facebook Google Microsoft Apple(siri) Amazon * 출처 : Frost & Sullivan, 2015 319
데이터인텔리전스 - 인공지능기반 SW (2) 산업의구조 인공지능기술자체만으로만들어낼수있는실물재화에대해서는아직구현되지않은상태이며, 인공지능기술개발이충분히이루어진이후에도특정재화로써존재하기는어려울전망 인간의지능이눈에보이고만질수있는것이아니듯인공지능역시주로특정재화가만들어내 는기능에효율성을높일수있는 다만일반적인 SW 계측면에서잘구성될필요가있음 SW 산업과유사성을보일것으로전망 산업과는달리인공지능기술이적용되기위해서는제반기술및산업이생태 결론적으로인공지능을산업적측면에서볼때, 협의로는제한된 SW 제품내적용분야에서, 광 의로는당장에인공지능기술을필요로하는일부산업( 로봇, 자동차등) 을포괄하는형태가될 것으로보임 SW 산업자체의특징인네트워크구조, 외부성, 규모의경제, 전환비용, 무임승차등이그대로 반영될수있음 네트워크구조 : SW 단독으로사용되어서경제적인가치가존재하지않고 HW, 응용애플리케이 션, 사용자의능력등과보완작용하여하나의시스템을구성하여소비되는구조 외부성 : 같은 SW 를사용하는사용자들이늘어날수록더높은효용성을가질수있으며, 주로전 화, 인터넷, 컴퓨터 OS 등을예로들수있음 규모의경제 : 재화생산에있어고정비용이외에한계및가변비용이거의 0 과같기때문에(SW 측면에서볼때복제비용), 생산규모가증가할수록더높은부가가치를가질수있는산업적특징 을가짐 전환비용 : 한번특정 SW를사용하고난뒤에는이용자습관으로인해고착효과가높아지므로동 일한기능을지니는다른재화로전환하기위한전환비용이높을수있음 무임승차 : 규모의경제와같이복제비용이거의 0에도달해있는상황이므로무료라는생각으로 무단복제가쉽게일어날수있음 인공지능(AI) 은새로운산업혁명을이끌어갈성장엔진으로부상 한동안정체기에빠져있던인공지능은최근급속한성능향상을보이며새로운성장동력으로주목 - 최근, 기존의데이터처리량과는질적으로다른빅데이터(BigData) 를처리할수있는환경이조 성되면서인공지능의성능은비약적으로발전 인공지능기술은금융, 의료, 제조업등경제산업은물론사회문화적측면에서광범위한파급효 과를가져올전망 - 경제산업측면에서인공지능기술은이미제조업( 자율주행차, 지능형로봇, 스마트팩토리등) 및 서비스업( 의료, 교육, 금융등) 과융합되며상용화가시작, 사회문화측면에서는인공지능의확산 은대대적인고용구조의변화, 새로운사회규범및질서체계확립등을초래 320
전략제품현황분석 나. 경쟁환경 * 출처 : 현대경제연구원 [ 인공지능(AI) 산업의발전기반및파급효과 ] 글로벌인공지능시장의주도권확보를위한경쟁이가속화 선진국정부및글로벌 ICT 기술격차를확대하는데주력 선도기업은인공지능시장의초기주도권확보를위해후발주자와의 인공지능의성능향상을위해서는빅데이터확보가필수적이므로데이터확보량차이에따른기술 격차가벌어지면추격에어려움이존재 특히, 구글은동영상자료확보를위한유튜브인수, 클라우드공간에무제한이미지저장서비스 제공등으로빅데이터확보부문에서선두로부상 IT 강국으로성장한우리나라가새로운도약을이루기위해서는인공지능(AI) 않고선도적지위를확보하는것이필수적 분야에서뒤떨어지지 인공지능은미래 ICT 기술융합트렌드를주도하는핵심기술로기존의정보통신산업지도를획기적으로변화시킬것으로예상 이미글로벌선도기업은인공지능기술을바탕으로다양한영역에서상용화를시도하고있는데 비해국내기업의인공지능수준은아직미약한수준 321
데이터인텔리전스 - 인공지능기반 SW * 출처 : IBM C-Suite Study [ 미래를선도할 ICT 기술 ] * 출처 : Ericsson [ 인공지능이도움이될만한분야 ] 322
전략제품현황분석 다. 전후방산업환경 인공지능기반 SW 분야는후방산업의기술이기술발전에가장많은영향을미치는것을알 수있으며후방산업의기술력으로만들어진인공지능기반 수있으므로후방산업의기술의존도가매우높음 SW를통해서전방산업이완성될 후방산업은인공지능기반을통한상황인지, 자기학습, 상황인지, 패턴, 추천검색, 예측서비스등의 계속발전할것으로판단됨 전방산업은후방산업의기술력이더해져더욱다양한서비스와산업의형태로진화할것으로보이 며, 특히 IoT 분야에서엄청난영향을미칠것으로판단됨 [ 인공지능기반 SW 분야산업구조 ] 후방산업인공지능기반 SW 분야 전방산업 상황인지, 자기학습기술, 음성/ 언어처리, 영상처리, 추천검색, 예측서비스등 머신러닝, 언어/ 음성처리소프트웨어, 이미지/ 영상처리, 검색솔루션, 번역솔루션등 개인비서서비스, 대화형네비게이션, 실시간번역서비스, 스마트카, 대화형음성검색, 스마트가전, IoT 등 323
데이터인텔리전스 - 인공지능기반 SW 3. 시장환경분석 가. 세계시장 15 년에발표한자료에따르면, 응용어플리케이션별로소요될인공지능기술을소프트웨어적인차원에서바라보았고, 특히광고서비스와투자자문분야에서인공지능기술이많이소요될것으로전망함 15년인공지능관련매출액은 2억 250만달러에서연평균 82.9% 씩급성장하여 20년에 41억 4,470 만달러규모가될전망 인공지능시장을주도할것으로예측된응용영역은광고서비스(Ad Service) 와투자( 자문) 분야이 며, 그외에제조, 자원관리(Oil and Gas, Retail), 미디어분야가선전할것으로예측함 [ 인공지능관련매출액전망 기술별( 단위 : 백만달러) ] Technology 2015 2016 2017 2018 2019 2020 CAGR ( 15~ 20) Cognitive Computing 10.9 11.6 12.4 13.2 14.2 15.0 6.5% Machine Learning 13.6 14.8 16.2 17.9 19.8 21.4 9.6% Deep Learning 108.5 221.1 453.1 929.5 1,904.6 3,884.9 104.5% Predictive APIs 20.3 22.9 26.4 30.8 36.0 43.4 16.4% Natural Language Processing 7.8 10.1 13.0 16.6 21.1 26.3 27.5% Image Recognition 24.4 32.6 44.7 61.7 85.7 119.1 37.3% Speech Recognition 14.6 16.6 19.3 22.6 26.4 30.9 16.1% Other 2.3 2.4 2.6 2.8 3.1 3.5 9.1% Total 202.5 332.1 587.5 1,095.1 2,111.0 4,144.7 82.9% * 출처 : Tractica, 2016 [ 인공지능기반 SW 세계시장규모및전망 ] 구분 15 16 17 18 19 20 ( 단위 : 백만달러, %) CAGR ('13~'15) 세계시장 202.5 332.1 587.5 1,095.1 2,111.0 4,144.7 3.2% * 출처 : Tractica, 2016 기술분야별로는최근각광을받고있는딥러닝(Deep Learning) 관련기술이가장빠르게확산될것으로보이며, 이미지인식기술이다음으로높은시장을형성할전망 324
전략제품현황분석 [ 인공지능관련매출액전망 전망별( 단위 : 백만달러) ] 산업 2015 2016 2017 2018 2019 2020 CAGR ( 15~ 20) Ad Service 38.7 71.3 137.8 273.4 549.8 1,109.4 95.6% Automotive 16.9 22.6 32.1 48.4 77.0 128.8 50.2% Agriculture 16.3 21.9 31.3 47.1 74.9 125.5 50.4% Consumer Finance 3.1 5.1 9.1 17.1 33.3 66.7 85.1% Data Storage 0.6 1.1 2.1 4.2 8.4 16.9 95.8% Education 8.5 12.5 19.7 33.5 59.9 111.3 67.2% Investment 32.2 59.4 115.1 228.9 461.1 931.4 96.0% Healthcare 1.5 2.4 4.2 7.8 15.1 29.6 81.2% Legal 2.9 3.9 5.4 8.0 12.5 20.8 48.3% Manufacturing 13.6 25.0 48.3 96.0 193.3 390.6 95.8% Media 7.3 11.2 18.8 33.5 62.6 120.3 75.1% Medical Diagnostics 13.9 25.5 49.2 97.6 196.3 396.5 95.6% Oil and Gas 0.6 0.9 1.6 2.8 5.3 10.3 78.1% Philanthropies 23.9 34.1 52.4 86.1 149.7 271.9 62.6% Retail 23.9 34.1 52.4 86.1 149.7 271.9 62.6% Total 202.5 332.1 587.5 1,095.1 2,11.0 4,144.7 82.9% * 출처 : Tractica, 2016 15 년에발표된자료에서인공지능기술이체화된기기를스마트머신 (Smart Machine) 으로 정의하였고이와관련된시장은전문가시스템, 자율로봇, 지능형가상비서, 기타등으로구분 하고있음 15년인공지능관련매출액은 74억 6,880만달러에서연평균 19.8% 씩성장해 18년 130억 930 만달러규모가될전망 주로전문가시스템(Expert systems) 과자율로봇(Automous Robots) 이인공지능시장을이끌 것으로예상됨 전문가시스템은문제인식 시스템디자인 정형화 시스템실행 시스템확인의순서로문제해 결능력을보여줄것으로보임 전문가시스템이사용될영역은매우다양할것으로전망되며, 롱테일비즈니스(long-tail business) 의유형을띌것으로보임 325
데이터인텔리전스 - 인공지능기반 SW 자율로봇은제조업분야( 자동차, 음식제조, 전기전자등) 에서주로사용될것으로보이며, 생산 및재고관리를효율적으로할수있는기능을포함할것으로예상됨 자연어처리는비교적다양한언어, 그안에존재하는단어, 억양( 지역), 비속어, 은어등을내포해 야되며언어와언어간을이어주는문제역시해결해야함으로상품화되는데시간이걸릴것으로 보임 [ 인공지능관련매출액전망 제품유형별 ( 단위 : 백만달러) ] 산업 2013 2014 2015 2016 2017 2018 CAGR ( 13~ 18) Expert systems 3,030.1 3,455.8 3,949.7 4,520.8 5,185.3 5,959.5 14.49% Autonomous Robots intelligent virtual assistants 1,137.5 1,375.9 1,668.4 2,025.7 2,464.5 3,003.2 21.43% 456.4 592.3 769.7 1,002.2 1,306.7 1,706.9 30.19% others 652.2 838.8 1,081.0 1,396.2 1,805.5 2,339.7 29.11% Total 5,276.2 6,262.8 7,468.8 8,944.9 10,762.0 13,009.3 19.8% * 출처 : TechNavio, 2015 IDC 는세계인공지능시장규모( 영상음성처리분야) 를 2015년약 1,270억달러에서 2017년 약 1,650억달러로연평균 14.0% 의고성장을지속할것으로전망 인공지능관련스타트업투자규모는 2010년 4,500만달러에서 2015년 3억 1,00 만달러, 투자 건수는 6건에서 54건으로급증 3 번째중흥기 를맞이한인공지능은다양한단말과서비스를통해우리의생활속으로파고들 전망이며, 그로인한급속한시장성장또한예상하지만인공지능대한기준과적용범위가제 각각이어서시장규모역시작게는몇조원에서많게는몇천조원에까지이를것으로전망 IDC의경우세계인공지능시장규모를 2017년 1650 억달러(195조 8000 억원) 규모로전망 했는가하면, Market&market은 2020 년에광고, 미디어서비스분야에서의활용으로인공지 능시장은약 50 억달러( 약 6.2 조원) 에이를것으로추정 일본의 EY 종합연구소는커머스, 광고, 금융, 유통, 자동차등모든산업분야에인공지능이도 입된다고가정하여 2020년에는 23 조엔, 2030년에는 87조엔의인공지능관련시장이창출될 것이라고전망 326
전략제품현황분석 [ 세계인공지능관련시장전망 ] 조사기관대상 15년향후 CAGR IDC 영상음성처리분야 Cognitive SW 플랫폼 1270억달러 1,650억달러 ( 17 년) 14% 10억달러 37 억달러( 17 년) 92% BCC리서치음성인식 840억달러 1,130억달러( 17 년) 16% Market&market 서비스 ( 광고, 미디어등 ) 4.2억달러 50 억달러( 20 년) 64% Tracica AI 시스템 2억달러 111억달러( 17 년) - 일본EY연구소 AI관련산업전반 ( 자국) 3조 7,450억엔 23조 638억엔( 20 년) 44% IBM 2025년 2,000조원시장창출 맥킨지 2025년 6조 7 천억달러(7,000 조원) 파급효과 * 출처 : TechNavio, 2015 * 출처 : Tractica [ 세계각국인공지능시장전망 ] 327
데이터인텔리전스 - 인공지능기반 SW 세계인공지능시장은빠르게성장하고있으며, 다양한산업에적용중 세계인공지능시장은빠르게성장할것으로보이며, 인공지능산업에대한투자도급증 인공지능관련스타트업투자규모는 2010년 4,500만달러에서 2015년 3억 1,000 만달러, 투 자건수는 6건에서 54건으로증가하며인공지능기술은다양한분야에접목되어산업확장을도 모할전망 전세계인공지능기반스마트머신시장은 2014년 62억 2,900만달러에서 2019년 152억 7,900 만달러규모로성장전망(BCC 리서치) 영상처리시장은 2015년 765억달러에서 2017년 1,090 억달러, 음성인식시장은같은기간 840억달러에서 1,130억달러수준전망 기업용인공지능시스템시장은 2015년 2억달러에서 2024년 111억달러로연평균 56.1% 성 장전망 (Tractica) 예측분석SW 시장은 2012년 20억달러에서 2019년 65억달러로성장전망 * 출처 : CB Insights [ 세계인공지능스타트업투자추이 ] 328
전략제품현황분석 나. 국내시장 국내인공지능시장규모는 2013년 3.6조원에서 2017년 6.4조원으로성장할것으로전망되 며, IT기업을필두로일부대기업이인공지능산업투자및연구를추진하고있으나아직까지 인터넷과게임등특정사업에한정되어있는실정 한국정부는최근인공지능산업육성정책을수립하고있으나착수시점및투자규모측면에서 주요국대비뒤처져있으며이에정부는최근인공지능의중요성을인식하고 을수립함 AI산업육성정책 한국정부는 2013년부터 10년간지식공유및지능진화가가능한인공지능SW 개발을목표로 엑 소브레인(Exobrain) 프로젝트를추진 미국은이미 2008 년부터시냅스인지컴퓨팅프로젝트 SyNAPS7) 를추진하는등인공지능연구 개발에서앞서나가고있음 한국정부가주도적으로추진하고있는인공지능관련프로젝트의투자규모는주요선진국대비 미흡한수준 한국정부는향후 10년간 1,070 억원이투자되는 엑소브레인(Exobrain) 프로젝트를비롯하여인 공지능관련분야에연간총 380억원을투자계획 [ 국내주요인공지능 R&D 과제현황 ] 과제 엑소브레인 (Exobrain) 딥뷰 (Deep View) 인공지능관련빅데이터 내용 지식공유 지능진화가가능한인공진 SW 개발이목표. 13 년~ 23년간 1,070억원투자 대규모실시간영상이해기반의시각지능플랫폼개발을목표 초고성능빅데이터에코시스템개발이목적 15년부터 4년간 129억원지원 * 출처 : 정보통신기술진흥센터 [ 인공지능기반 SW 국내시장규모및전망 ] 구분 15 16 17 18 19 20 ( 단위 : 조원, %) CAGR ('13~'15) 국내시장 4.7 5.4 6.4 7.5 9.1 11.1 14.3% * 출처 : 미래창조과학부 329
데이터인텔리전스 - 인공지능기반 SW * 출처 : 미래창조과학부, 한일산업기술협력재단 [ 국가별주요 AI 프로젝트투자비교 ] 민간부문의인공지능산업기반은시장규모, 기업수및투자규모측면에서부족한수준이며국내인공지능시장규모및관련기업수는한국의 ICT 산업의위상에비해부족한수준임 2013년기준국내인공지능시장규모는 3.6 조원으로세계인공지능시장규모( 약 240 조원) 의 1.5% 로추정 2015년기준국내인공지능관련기업은약 24개~64 개로추정되며, 이는세계인공지능관련 스타트업수와비교할때약 2.5% ~6.7% 수준 한국 ICT산업의세계 ICT산업대비비중 10.7%(2015 년기준), ICT수출시장점유율 6.7%(2013 년기준) 등에비해낮은수준 국내기업의인공지능관련투자도글로벌기업대비낮은수준 2014년이후삼성전자가 AI 부문에투자한금액은 지보, 바이카이우스 ( 각각 2,000 만달러, 480 억원) 등으로알려짐 네이버는 2013년 5년간인공지능연구개발에 1,000억원투자계획을밝힘 구글은 2001년부터 2015년까지 14년간인공지능관련기업인수에 280 억달러( 약 33조 7,000 억원, 연평균 20 억달러) 를투자 중국의인터넷기업바이두는 3 억달러( 약 3,600 억원) 를투자하여실리콘밸리에딥러닝연구소를 설립 330
전략제품현황분석 * 출처 : Venture Scanner, 정보통신기술진흥센터, 미래부자료활용현대경제연구원재구성 [ 한국 ICT 산업의위상 ] * 출처 : 언론보도종합 [ 주요기업의인공지능투자규모추정 ] 331
데이터인텔리전스 - 인공지능기반 SW 인공지능확산에따른부작용을극복하고효용을극대화하기위한사회적논의와준비가부족 한실정임 새로운과학기술의부정적영향을최소화하고긍정적영향을극대화하기위해서는사회적논의와 합의가중요 과학기술의발전은경제적부가가치창출등긍정적인효과도가져오지만, 의일상생활에예기치못한부작용도유발 환경윤리문제등국민 미래창조과학부는 2003 년부터기술영향평가를수행하고있으며, 2015년에는인공지능기술과유 전자가위기술을대상으로기술영향평가를수행 인공지능발전에따른일자리감소, 오작동피해, 인권침해, 윤리적문제등부작용을최소화하기 위한사회적합의는아직미흡 WEF, 옥스퍼드大로예측 등의연구결과들은인공지능과로봇으로인해일자리가대규모로감소할것으 최근국내에서일반인을대상으로실시된설문조사에서도인공지능확산에따라일자리가감소할 것이라는전망이총 74% 로다수를차지 [ 역대기술영향평가대상기술 ] 연도 대상기술 2003 NBIT 융합기술 2005 RFID 나노 2006 줄기세포나노소재 UCT 2007 기후변화대응기술 2008 국가재난질환대응기술 2011 뇌-기계인터페이스 2012 빅데이터 2013 3차원프린팅스마트네트워크 2014 무인이동체초고층건축물 2015 인공지능유전자가위 * 출처 : 미래창조과학부 332
전략제품현황분석 * 출처 : 한국언론진흥재단 [ 인공지능확산에따른일자리전망 ] 세계주요국과비교했을때한국의인공지능관련기술수준이낮고특허보유수도적은것으 로나타났으며한국의인공지능기술은미국, 일본, 유럽등주요국에비해상당히낮은수준 세계인공지능관련기술연구및개발은미국이주도하고있으며, 미국의기술수준(100) 을기준 으로한국의기술수준을평가 한국은인공지능 SW 기술은최고기술국대비 75.0% 수준, 인공지능응용 SW 기술은 74.0% 수준으로조사되어주요선진국과상당한격차를보임, 한편중국과비교했을때인공지능 SW 기 술은큰차이가나지않고, 인공지능응용 SW기술은오히려낮은수준으로평가 인공지능관련특허보유건수도미국, 일본과비교할때미미한수준 미국, 일본, 한국, PCT( 국제특허) 등 4개 DB에등록된인공지능관련특허 11,613건중한국인 이보유한특허는 306건으로전체의 3% 에불과 논문랭킹집계사이트인 SJR 에따르면 96~ 13년인공지능분야의논문을가장많이발표한순서 대로 1 위중국( 약 7 만개), 2 위미국( 약 5.7 만개), 3 위일본( 약 2.4 만개) 순이며한국은 11 위( 약 1.1 만개) 를기록 * 출처 : IITP [ 주요국가의인공지능기술수준비교 ] 인공지능 인공지능응용 SW 국가 상대수준 (%) 격차기간( 년) 상대수준 (%) 격차기간( 년) 미국 100.0 0.0 100.0 0.0 일본 89.3 0.9 67.2 1.4 한국 75.0 2.0 74.0 2.3 중국 71.9 2.3 85.8 2.9 333
데이터인텔리전스 - 인공지능기반 SW 4. 기술환경분석 가. 기술개발트렌드 머신러닝, 딥러닝, IoT 등의확산에힘입어큰주목을받아왔던인공지능분야가비약적발전 이예상되고있는가운데, 특히생산성증대와매출확대를위한기업들의도입이본격화될 것으로예상 하지만인공지능은화이트일자리대체문제와다양한윤리적문제를수반하고이어단순히기술 적진화의관점에서만접근할수없고기술전문가, 경제학자, 사회과학자, 등다양한진영의전문 가들이인공지능확산이산업과인류에미치는영향력을다각적으로검토해야하는과제에직면 인공지능진화의핵심동력, 딥러닝 컴퓨터가사람처럼생각하고배울수있도록하는인공지능기술 딥러닝 의성능이비약적으로발 전하고있는가운데슈퍼컴퓨터와의결합까지이루어지면서딥러닝분야는인공지능분야에서최고 의연구영역중하나가될전망 딥러닝기술을활용해페이스북은사진속인물을인지하고자동으로태그를걸어주는 딥페이스 기술을개발했고 MS는스마트폰으로찍은사진을보고컴퓨터가품종을알려주는기술을연구 최근에는단순히어떤사진인지를분별하는것을뛰어넘어사진을문자로묘사하는수준으로까지 발전하고있음 인간의감정 을이해하는인공지능의고도화 인간의감정을이해하는인공지능은중요한연구영역이될것이며, 컴퓨터가언어를이해하고카 메라기술, 음성및안면인식기술등이발전하면서컴퓨터가인간의감정상태를더정교하게파 악하고인간과컴퓨터사이에원활한상호작용이가능할것으로기대 연구자들은이같은기술과지식을교육, 우울증치료, 의료진단, 고객서비스, 온라인쇼핑등에 활용하는방식을다양하게모색중 인공지능의거대화를이끄는 사물인터넷(IoT) 의확장 사물인터넷의확산으로인해무선으로연결되지않은기기를찾아보기어려운정도가될것이며 이를통해확보한막대한데이터를어떻게활용할것인가에대한문제가인공지능분야에서중요하 게대두 IoT 기능을갖춘웨어러블단말을신체에장착하면맥박이나심박수의변화로사람의감정을인지 할수있게되는것과같이방대한비정형데이터가 능을뛰어넘는초지능(super intelligence) 단계로의진화를나타낼전망 IoT를통해수집되면서인공지능은사람의지 334
전략제품현황분석 인공지능활용서비스 의본격적등장 쇼핑과고객서비스분야에서기업들이인공지능을활용해고객만족도를높이고있음 의류업체 North Face는 IBM 의인공지능플랫폼 Watson 기반의 Fluid Exper Personal Shopper 앱을개발해고객이쇼핑하면서궁금한사항들을왓슨에게질문하고이를분석해고객 의구매결정에도움을줄수 lt는조언서비스를제공중 Carnegie Mellon의 Andrew Moore 학장은인공지능의발전으로비즈니스방식에도큰변화가 이뤄질것이라며, 1990년대말에데이터베이스경쟁이치열했다면지금은정교한의사결정프로 세스를지원하는 AI 플랫폼경쟁이이뤄지고있다고지적 인공지능, 다양한 윤리적논쟁 유발 인간의개입없이자율적인파단에따른살상행위가가능한 킬러로봇. 인간관계의혼란을야기할섹스로봇, 돌발상황과관련한여러가정이요구되는무인자동차등이등장하면서이와관련한윤리논쟁이전면부각되고있음 사람마다가치관이다른상황에서올바른 AI 알고리즘에대한고민이필요 인공지능, 화이트컬러일자리대체 인공지능은단순히업무나생산효율성을높이는데그치지않고빠른속도로인간의일자리를대 체하고있음 인공지능에의한화이트컬러일자리대체문제에대해 National Academy of Sciences에서는 기술전문가, 경제학자, 사회과학자들이함께논의하고있으며, 정보처리중심의화이트컬러직업 이인공지능으로대체될경우의변화에대한예측을진행중 신기술소개사이트 메이크유즈오브(Make User Of) 는컴퓨터가대체할직업으로콜센터직 원, 부동산중개인, 작가와함께회계사, 변호사, 의사, 등과같은고소득전문직도꼽고있음 335
데이터인텔리전스 - 인공지능기반 SW * 출처 : 전자신문, 2015; ECOsight, ETRI, 2015 [ 미래기술지도 ] 336
전략제품현황분석 나. 국가별인공지능관련정책동향 미국의인공지능관련정책 13년 2 월국립보건연구원(NIH) 는브레인이니셔티브(Brain Research through Advancing Innovative Neurotechnologies Initiative, BRAIN Initiative) 추진계획을발표 10년동안총 30 억달러규모의투자가진행되며, R&D 주요내용은인간의뇌지도작성을비롯 해지각, 행동, 의식등이이루어질때발생하는뇌의활동에대한연구 미국은 125 조개에이르는뇌의시냅스(synapse) 분석을통해인간이어떻게데이터를두뇌에저 장하고처리하는지를밝히고이를컴퓨터시스템에그대로적용하여진정한인공지능을구현하는 것을목표로함 (IITP, 2015) 국방고등연구계획국(DARPA) 는무인기술(Drone 등) 에대한인공지능기술을개발하는데초점을 맞추고있는상황 2014 년국방고등연구계획국은항공기에적용시켜자율항공기로완전히대체시키기위한프로젝트 인 ALIAS(Aircrew Labor In-cockpit Automation System) 을발표하였고, 주요 R&D 목표로이 륙과착륙은물론어떤상황에서든지자동항해가가능한항공기개발을중점으로두고있음 2015년 1 월인간의개입을최소화한무인드론개발프로젝트 CODE(Collaborative Operations in Denied Environment) 를발표 무인항공기기술을토대로차량, 포, 그리고함대등다양한분야로적용할계획 2008 년에는민간과합작하여인간의뇌구조와유사한형태를지닌데이터처리칩셋인 뉴로모 픽칩(neuromorphic chip) 개발등적극적으로인공지능과관련된기술개발을주도하고있음 * 출처 : ETRI, 인공지능기술과산업의가능성, 2015 [ 미국의인공지능관련기술 ] 337
데이터인텔리전스 - 인공지능기반 SW 일본의인공지능관련정책 인공지능전반에대한연구개발체계가언급된것은최근이며이전까지는주로로봇이라는키워드 를위주로파편적인연구개발이이루어져왔으며최근그체계를공고히하려는움직임이나타나고 있음 14년 9 월로봇혁명실현회의결과를발표하였고, 15년 1 월 로봇신전략 을발표 주요내용은로봇기술및제품에대한주도권확보전략이지만로봇의최종진화는결국인간을모 방하는형태가될것이므로인공지능과그궤를같이한다고볼수있음 일본을세계로봇이노베이션거점으로하는 로봇창출력의근본적강화 중소기업, 농업, 간병 의료, 인프라등세계최고의로봇활용사회를목표로로봇이일상을실현 할수있는 로봇활용 보급 사물인터넷(IoT) 시대에빅데이터, IT 와융합, 네트워크, 인공지능을구사하는로봇으로세계를주 도하는 로봇혁명전개 발전 09 년최첨단연구개발지원프로그램(FIRST) 의 30개과제테마중 1개가인공지능과관련됨 13 년혁신적연구개발추진프로그램(ImPACT) 에 12개테마중 2개를선점함 14 년전략적이노베이션프로그램(SIP) 의 10개테마중 1개로나타남 15년 2 월총무성은 인공지능화가가속화되는 ICT 미래상에관한연구회 를개최하였고, 총 12 명의각분야별전문가를모아어떻게인공지능에대한연구를해야하는가에대한논의및토의 를진행함 2045 연구회 로불리며, 정보통신, 인공지능, 뇌과학, 인지심리학분야등공학을비롯해인문 학등다양한영역의전문가가참여함 주요논의사항으로는 인공지능으로무엇을할수있는가?, 인공지능을어떻게사용할것인가?, 해외에비해늦은일본의연구개발체제를어떻게할것인가? 산업기술종합연구소내에인공지능의개발과실용화, 기초연구간의선순환을위해 인공지능연구 센터 를수립함 유럽의인공지능관련정책 인간두뇌의인지형태기반의지식처리를위한 Human Brain 프로젝트를 EU 6대미래유망 기술중하나로선정, 10억유로를투입하여 10 년간추진(~ 22 년) 예정 Human Brain 프로젝트에서는인간의인지형태를프로그램화시켜향후인간의지식처리형태 를가진인공지능개발예정, 인간뇌의작동방식에대한정확한이해, 활용을통해컴퓨팅아키 텍처, 신경과학, 의학분야등에적용예정 338
전략제품 현황분석 중국의 인공지능 관련 정책 15년 3월 열린 중국의 최대 정치 행사인 양회(兩會)에서 '차이나 브레인' 프로젝트를 제안함 중국 최대 검색사업자 바이두(百度)의 리옌훙(李彦宏) 최고경영자(CEO)에 의해 제안된 차이나 브 레인 은 인간 기기 간 상호작용, 무인자동차, 군사 민간용 드론 등의 모든 분야에 인공지능 기술을 적용하려는 개발 프로젝트 한국의 인공지능 관련 정책 인공지능 분야에 대한 정부의 관심이 최근 높아지고 있으며, 로봇산업, 컴퓨팅(감성, 인지 등), 빅 데이터, 자율주행자동차 등의 분야에서 인공지능 세부기술이 R&D로 추진되고 있음 13년 미래창조과학부 주관으로 진행된 엑소브레인 프로젝트에서 실질적을 인공지능과 관련된 정 부 R&D가 시작되었다고 볼 수 있음 엑소브레인 프로젝트는 13년~ 17년까지 1단계(핵심기술개발), 17~ 20년까지 2단계(응용기술개 발), 20년~ 23년까지 3단계(글로벌 기술개발)로 중장기 기술개발에 속함 *출처 : http://exobrain.kr/exointro [ 엑소브레인 세부과제별 기술개발 내용 및 전략 ] *출처 : http://exobrain.kr/exointro [ 연도별 기술개발 전략 ] 339
데이터인텔리전스 - 인공지능기반 SW 인공지능관련정책으로는로봇, 자율주행자동차, 빅데이터, 사물인터넷등의분야에서찾아볼수 있음 70 년대부터민간분야( 자동차제조부문) 에서주도하여자동차용접로봇을국내최초로도입하는 등산학자체적으로로봇 R&D 를진행하였으며 00년대들어정부주도로로봇분야에대한 R&D를 수행 15 년국토부( 국토교통부) 주도로자율주행자동차상용화지원방안을마련함으로써제도적측면 에서자율주행자동차가보다빠르게정착될수있도록함 13 년행정자치부주도( 관계부처합동) 로빅데이터마스터플랜을마련하였으며, 주로어플리케이션 영역별발생하는데이터를분석하여해법( 요인, 결과, 대책등) 을제시하는형태 340
전략제품현황분석 다. 주요업체별기술개발동향 (1) 해외업체동향 IBM 은 Watson ( 이하왓슨) 과같은차세대분석플랫폼을연구개발하기위해인공지능에대해집중적으로투자 2011년 1 월왓슨은 Jeopardy 라불리는미국의한퀴즈쇼에서사상가장많은우승횟수와우승 상금을보유한켄제닝과브랫러터와의대결에서압도적으로승리함 IBM 은왓슨을이용하여최근 Watson Discovery Advisor 를개발할예정이고, 이를통해과학 분야의수많은데이터를종합하여의미있는결과를도출할수있도록연구를진행할예정 실제로 IBM의왓슨은국내의료진단서비스에도입예정 Microsoft는 하는형태의가상비서 IBM과달리현재의정확한답을요구하는문제보다미래에발생할결과를예측 Cortana( 코타나) 를개발함 코타나는 2014년에열린브라질월드컵에서 16강전승자를비롯해 3-4위경기를제외한 15개경 기결과예측을적중시킴 실제로코타나는음성인식기술과검색엔진 빙 을통해사용자가원하는답변을찾아주는가상개 인비서(VPA: Vitual Personal Assistants) 서비스로볼수있음 시각적정보를활용해어떤사물도인식할수있도록하는 아담(ADAM) 프로젝트를진행중이며, 수십조의신경망으로이뤄진인간의뇌를응용해뉴런네트워크를구축하고스스로학습할수있 도록하는딥러닝프로젝트를시행중 Facebook 은인공지능연구소를설립하고두명의유명한전문가러쿤(Yann LeCun) 교수및 퍼거스(Rob Fergus) 교수를영입하고 2013년 Deep Face라는딥러닝기반얼굴인식엔진을 개발함 사람의측면얼굴이미지도인식할수있도록하는것이목표이며, 이미지를 3D화한뒤딥러닝 기술을통해얼굴이미지를분석하여정면이미지를예측하는형태임 페이스북에업로드된사진 440만점중 4,030 명의얼굴옆모습만보고정면얼굴까지추정, 현 재까지인식률 97.25% 당시 LWF 얼굴영상데이터에대하여 97.35% 의높은성능을발표한바있음페이스북은 2015 년 6월얼굴인식기술을탑재한사진공유서비스 Moments 를공개하였음. Moments는사진을스 캔해서사진내특정인물의앨범을자동으로생성하는데흥미로운것은사용자가아니라다른사 람이촬영한사진들까지도모을수있는점임 341
데이터인텔리전스 - 인공지능기반 SW * 자료: Facebook [ Facebook Moments ] Google 은인공지능에대해소프트웨어( 알고리즘) 과하드웨어분야모두지속적인연구개발투 자를진행중 2013 년부터시작한 인공지능맨허튼프로젝트 에서실리콘밸리벤처기업들을참여시키며거대한 인공지능연구개발투자를진행중임 2013 년~2014년사이로봇과관련된회사 8개를사들이며소프트웨어뿐만아니라로봇과같은 하드웨어측면에도해당알고리즘을적용할수있는지테스트베드환경을마련중 2014 유럽데이터센터 회의에서구글데이터센터의부회장조카바(Joe Kava) 는딥러닝을활용 해구글의데이터센터온도를조절관리한운용결과를발표( 박혜영, 2014) 구글은검색에기계학습알고리즘을적극적으로활용, 구글검색엔진의근간이라고할수있는페 이지랭크알고리즘랭크브레인(Rank Brain) 은기계학습에기반을둔텍스트마이닝(text mining) 기술임 구글은기계학습기술을사용한음성인식기술과영상인식기술을이용해멀티미디어콘텐츠의 검색서비스도이용함 또한, 대규모데이터센터를운영하는데있어서성능및에너지관점에서최적화하기위해기계학 습을활용하고있음. 데이터센터의서버및장비들의사용시간및에너지사용량을측정한후이 러한정보에대해기계학습기술을이용하여서버및기타장비를관리하고, 냉각시스템을운영함 그결과 PUE(power usage effectiveness) 예측에 99.6% 의높은정확도를얻을수있었고, 에 너지절약을포함한데이터센터의운영을크게효율화하였음 구글의개인비서서비스 구글나우(Google Now) 는자연어인터페이스를갖추고있으며, 사용자 의검색활동, 기기정보, 방문한장소등분석하여사용자가원하는정보를능동적으로제공함 342
전략제품현황분석 * 자료: 소프트웨어정책연구소 [ 구글의데이터센터 PUE 예측신경망 ] 아마존(Amazon): 구매추천및예측, AWS 기계학습클라우드 아마존은기계학습을이용해고객의구매패턴을분석해관심있을만한상품을추천함 구매추천서비스는매우효과적이어서아마존매출의 하며 1/3 이상이구매추천서비스에의해발생 2014년에는고객이주문하기도전에배송을시작하는기술을실용화하였음 기계학습을이용해고객이구매할것으로예상되는물품을미리포장해서고객과가까운물류창고 에옮겨놓음으로써배달시간과물류비용을절감하며이와같이기계학습기술의효과를활용한 경험을바탕으로아마존웹서비스(AWS, Amazon Web Services) 에서는클라우드서비스에기계 학습기능을추가해제공하고있음 아마존이보유한기계학습알고리즘을클라우드사용자가활용하여부정거래탐지, 요구예측, 콘텐 츠개인화, 사용자행동예측, 소셜미디어확인, 텍스트분석등인공지능을요구하는애플리케이션 을구축할수있음 벤처기업에지원되는펀딩의규모는총 27억 3 천만달러에달하며, 영역별로는딥러닝기술을 이용한응용인공지능기술개발관련업체가평균 1,380만달러로가장높게나타남 영역별총펀딩규모역시딥러닝응용인공지능기술개발분야가가장많이형성되어있음 업체별생존기간은음성및비디오콘텐츠인식기술개발업체가 장높게나타남 8년이라는중간값을가지며가 343
데이터인텔리전스 - 인공지능기반 SW * 출처 : http://insights,venturescanner.com/ [ 인공지능기술에따른벤처기업 ] 344
전략제품현황분석 (2) 국내업체동향 삼성전자의음성인식기술을적용한 S 보이스 스마트폰앱을선보였고, 특히자연어처리기술의 특화를통해안정적인음성인식기술을개발하는데초점을맞추고있음 국가별로사투리, 축약어포함매주수천개문장을테스트하며 DB를확보하는한편잡음발생 환경에서음성인식성능을유지할수있는기술을개발중 디오텍은국내딥러닝관련솔루션기업이었으나최근의료기기전문업체인힘스인터네셔널에 인수됨에따라의료분야에딥러닝이적용된제품및서비스를개발할전망 음성, 필기, 영상등의데이터와딥러닝기술을활용하는솔루션기업이며, 인수기업은체성분분 석및혈압진단기기를제공하는기업이므로주로관련제품은의료기기와서비스에인공지능기 술을활용할것으로보임 쿨디는딥러닝기술을이용해이미지로부터관련정보를인식하는기술을개발하는스타트업 클디(cldi) 의기술은사람의뇌가동작하는방식을모방한 심층신경망(Deep Neural Network) 기 반의인공지능기술로이미지를인식하고, 그안에담긴정보를분석함으로써사용자들이원하는 정보를빠르고정확하게찾을수있게도와주는형태 유빅은국제소송이디스커버리( 전자증거개시제도) 서비스를제공하는기업 인공지능기반예측코딩기술도입으로이메일을통한기술유출을차단할수있는솔루션을개발 예측코딩기술을활용해이메일에담긴기술정보유출, 리베이트, 카르텔, 부정회계, 횡령등기업 부정사건의위험징후를감지가능 이메일을계정별로분석하고, 분석을마친이메일을위험징후의세단계인컨셉/ 준비/ 실행중해당하는단계로분류하여사용자가위험징후를더욱정확히예측할수있도록위험도평가기능을고도화함 345
데이터인텔리전스 - 인공지능기반 SW 다. 기술인프라현황 국내의인공지능관련기술인프라현황 국내에는인공지능기계학습연구를위해필요한데이터셋이부족함. 해외에서는다양한데이터셋 이구축/ 공개되어연구에사용되고있으나, 우리나라에적용하기위해필요한데이터와는성질이 다른경우가많음. 얼굴인식및문서인식기술을우리나라에서의실용화하려면한국인의얼굴영상데이터, 필기한글 데이터등우리나라에서수집된데이터가필요한데, 이러한데이터들이제대로준비되어있지않 음 필기한글영상데이터의경우 90년대에만들어진 PE92나 SERI95a 이후다양성과수량이개선된 데이터가구축되지못했으며실제우리나라에서사용될만한응용분야에딥러닝을적용하려는연 구자들은학습데이터확보의어려움에직면하고있음 국내전문가부족현상 국내의인공지능활성화에가장큰원인은머신러닝에정통한전문가의부족임 2000 년대까지인공지능기계학습기술의실용화수준과거리가많음. 그로인해기업, 정부, 대중 의관심을별로받지못했으며연구지원도줄어들어기계학습분야의많은연구자들이타분야로 이동하였음 2013 년이후딥러닝의출현에의해기계학습분야가부흥하면서갑자기기계학습전문가들의수 요가급증하였으나그동안기계학습분야에서꾸준히연구하던전문가들은매우소수에불과했기 때문에현재는산업적수요에비해딥러닝전문가의수가크게부족한상황임 346
전략제품현황분석 라. 특허동향분석 (1) 연도별출원동향 인공지능기반 SW 기술의지난 7 년( 10~ 16) 간출원동향30) 을살펴보면연도별출원경향이전 체적으로 2010 년도를시작하여꾸준히증가되는경향을나타내고있어, 본기술에대한연구 개발이활발하게이루어지고있음을알수있음 각국가별로살펴보면한국의출원경향은 2010년도부터증감추세를반복하면서소수의출원을진 행하고있는것으로나타남, 미국은점차적으로증가하는추세를보이고있으며, 일본은소폭증 가추세를유지하고있는경향을보이고있음 국가별출원비중을살펴보면미국이전체의 73.5% 로최대출원국으로머신러닝소프트웨어 기술을리드하고있는것으로나타났으며, 일본이 10%, 유럽은 8.8%, 한국은 7.6 순으로나 타남 [ 인공지능기반 SW 기술연도별출원동향 ] 30) 특허출원후 1년 6개월이경과하여야공개되는특허제도의특성상실제출원이이루어졌으나아직공개되지않은미공개데이터가존재하여 2015, 2016년데이터가적게나타나는것에대하여유의해야함 347
데이터인텔리전스 - 인공지능기반 SW (2) 국가별출원현황 한국의출원현황을살펴보면 10 년부터꾸준히소폭이지만, 증감추세를 2014년도까지유지하 고있는경향을보이고있음 한국은 2010~2013년도에는외국인비중이 30~40% 정도수준에서유지하고있어, 국내출원인 이다수비중이나, 외국인비중도높다고할수있음 미국의출원현황은출원건수가지속적으로증가추세를 2014 년도까지유지하고있으며, 관련 기술에활발한연구개발을하고있는점이특징임 2010년도이후미국의외국인출원이 20% 미만정도로최근까지이러한추세가나타나고있어, 타국가에비해내국인출원이다수이루어지고있는것이특징으로나타남 일본의출원현황은 10 년도이후부터증가추세를소폭으로나타나는추세를보이고있으며, 내 외국인비중은외국인이 30~40% 이상으로내국인출원이높은경향을보이고있는점이특 징임, 유럽의경우에는조금씩증가하는추세를보이고있으며, 외국인비중이전체 80% 이 상으로외국인비중이타국가보다높은것으로나타남 [ 국가별출원현황 ] 348
전략제품현황분석 (3) 투입기술및융합성분석 인공지능기반 SW 기술 분야의투입기술을확인하기위하여특허분류코드인 IPC Code 31) 를 통하여살펴본결과가장많은비중을차지하고있는 IPC는 G06F 분야가가장많은 529건으 로나타났으며, G06N이 234 건, G06Q가 152건으로 G06F분야가대다수를차지하고있음 이외에 G06K 87 건, A61B 56 건, G10L 46 건, G06T 40 건, H04L 39 건, H04N 29 건, H04W 23건등의기술이투입되어있어머신러닝소프트웨어기술분야에다양한기술이존재하지만, 데이터표시, 조사분석분야에집중되고있음 더불어해당 IPC의특허인용수명을살펴보면 A61B로서기술분야의수명이 9년으로가장긴것으 로나타났으며, H04W 기술분야는 4년으로가장짧은것으로분석 [ 인공지능기반 SW 기술분야상위투입기술 ] IPC 기술내용특허인용수명 (TCT) 32) G06F 전기에의한디지털데이터처리 6년 G01N 재료의화학적또는물리적성질의검출에의한재료의조사또는분석 9년 H04N 화상통신 7년 G06K 데이터의인식; 데이터의표시; 기록매체; 기록매체의취급 7년 A61B 진단; 수술; 개인식별 9년 G10L 음성분석또는합성; 음성인식; 음성또는음성처리; 음성또는오디오부 호화또는복호화 7 년 G06T 이미지데이터처리또는발생일반 6년 H04L 디지털정보의전송 6년 H04N 화상통신 7년 H04W 무선통신네트워크 4년 31) 전세계적으로통용되고있는국제특허분류(IPC: International Patent Classification) 를통해특허정보기술분야에서공지기술을조사할수있으며, 기술및권리정보에용이하게접근가능 32) 특허인용수명지수는후방인용(Backward Citation) 에기반한특허인용수명의평균, Q1, Q2( 중앙값), Q3 에대한통계값을제시함. 특히이와같이산출된 Q2는 TCT(Technology Cycle Time, 기술순환주기또는기술수명주기) 라고부름 349
데이터인텔리전스 - 인공지능기반 SW 투입기술이가장많은 G06F 분야와융합이높게이루어진기술은 G06N 분야로나타났으며, G06Q, H04L 분야와도나타융합된기술의건수가높은것으로분석 이외에 G06N 분야와융합된기술은 H04L, G06Q, G06K 분야와융합된기술이많은것으로나 타났으며, G06Q 분야와융합된기술은 G06K, H04L, H04N 기술로분석됨 [ 인공지능기반 SW 기술분야 IPC 기술및융합성 ] (4) 주요출원인분석 앞서국가별특허건수에서미국이가장많은특허를출원하고있는것으로나타났으며, 출원인에도상당수가미국출원인으로나타났음, 미국이외에일본, 독일출원인이상위그룹에 포함되었음 상위 주요상위출원인을살펴보면미국의 MIcrosoft, IBM, Google, Yahoo, Facebook 등으로주요 SNS포 털, 시스템 SI 전문기업이상위그룹에포함되었으며, 일본의 Sony 사와, 독일의 SIemens 사가상위그룹에 포함됨 350
전략제품현황분석 3극출원은 Microsoft, HeartFlow, Sony 사등이상당수하고있는것으로분석되었으나, 타 출원인은보유특허중에서일부만 3극출원을하고있는것으로나타남 피인용지수에대한통계에서는대부분상위그룹출원인에서 Yahoo사가 7.6으로가장높은 수치를기록하고있으며, Microsoft사가 5.66 등으로기술력이높은출원인으로나타났음 주력기술분야는머신러닝기술을응용하여클라우드에있는데이터분석기술, 의도파악기술, 예측기술등으로연구개발을하고있는것으로나타남 [ 주요출원인의출원현황 ] 주요출원인 국가 주요 IP 시장국 ( 건수 %) 3극패밀 IP시리수 한국미국일본유럽 장국 종합 ( 건) 피인 용지 수 주력기술분야 Microsoft 미국 7 112 4 15 5% 81% 3% 11% 미국 20 5.66 상황의존검색기술 IBM 미국 53 3 0% 95% 5% 0% 미국 0 3 머신러닝이용클라우드데이터분석 Google 미국 47 2 0% 96% 0% 4% 미국 1 1.88 머신러닝이용사용자의도파악기술 Sony 일본 14 8 2 0% 58% 33% 8% 미국 9 2.85 특정알고리즘합성기술 Yahoo 미국 21 0% 100% 0% 0% 미국 1 7.6 다량데이터분류, 분석기술 Facebook 미국 4 14 1 1 20% 70% 5% 5% 미국 8 1.13 모바일사용자미래상태예측기술 HeartFlow 미국 17 1 2 0% 85% 5% 10% 미국 17 0 의학진단예측기술 Amazon 미국 18 0% 100% 0% 0% 미국 o 0.67 기계학습을통한물품구매예측기술 Siemens 독일 10 6 0% 63% 0% 38% 미국 2 1.4 정보데이터를통한예측기술 AT&T 미국 15 0% 100% 0% 0% 미국 0 4.18 화자의도파악자동응답기술 351
데이터인텔리전스 - 인공지능기반 SW (5) 국내출원인동향 국내출원인동향을살펴보면대기업은현대모비스, 에스케이텔레콤, 삼성전자등이상위그룹 에나타났으나특허건수는크지않아본기술분야에대한대기업의참여가적은것으로나타 남, 중소기업으로는이큐스앤자루, 밸류스트릿등데이터분석솔루션전문기업이참여하고있 는것으로나타남 기업이외의주요출원인에서연구소와, 대학의출원이활발한것으로나타났으며연구소에는 한국전자통신연구원, 과학기술정보연구원, 등에서출원이이루어지고있으며, 여러대학에서도 다수참여하고있는것으로나타남 [ 국내주요출원인의출원현황 ] 352
전략제품현황분석 5. 가. 중소기업환경 중소기업경쟁력 인공지능기반 SW 분야의중소기업경쟁력은기술분류별로차이가있으나데이터분석기술은 중소기업이다수참여하여시장에서의역할이점차커지는분야로분석됨 [ 인공지능기반 SW 분야중소기업현황 ] 기술분류주요기술대기업중소기업중소기업참여영역중소기업참여정도 금융 사기및부정방지개인신용평가분석금융거래이상탐지기술, 실시간모니터링기술, 무선침입방지기술 SK 텔레콤 LG CNS KT 삼성전자 솔트룩스와이즈넛 딥러닝모니터링기술자동제어자연어처리음성시스템 추천 타겟팅디지털디스플레이콘텐츠추천자동차품질개선의료보건서비스분석및개선유망잠재고객분석챗봇기술, 상품추천기술, 인공지능대화기술, 추천패턴인식기술 SK 텔레콤 LG CNS KT 삼성전자네이버 디오텍쿨디유빅솔트룩스와이즈넛 딥러닝데이터마이닝상품추천기술패턴인식, 콘텐츠추천기술, 자동추론 * 중소기업참여정도와점유율은주요제품시장에참여하는중소기업의참여규모와정도( 업체수, 비율등) 를고려하여 5단계로구분 ( 낮은단계:, 중간단계(,, ) 높은단계: ) 353
데이터인텔리전스 - 인공지능기반 SW 나. 중소기업기술수요 인공지능기반 SW 분야의중소기업의기술수요를파악하기위하여중소기업기술수요조사및중 소기업청 R&D 신청과제(2013~2015 년) 를분석한결과아래표의내용과같은수요들이다수있 는것으로분석 인공지능기반 SW 것으로나타났으며, 것으로분석됨 분야중소기업은최근에데이터분석과관련된기술개발에다수수요가있는 머신러닝기반을통한개발기술에대한관심이높아지고있는추세를반영한 [ 인공지능기반 SW 분야과제신청현황및수요조사결과 ] 전략제품기술분류관심기술 금융 사기및부정방지개인신용평가분석금융거래이상탐지기술, 실시간모니터링기술, 무선침입방지기술 인공지능기반 SW 추천 타겟팅디지털디스플레이콘텐츠추천자동차품질개선의료보건서비스분석및개선유망잠재고객분석챗봇기술, 상품추천기술, 인공지능대화기술, 추천패턴인식기술 354
전략제품현황분석 다. 중소기업핵심기술 (1) 데이터기반요소기술발굴 인공지능기반 SW 기술의특허및논문데이터검색을통해도출된유효데이터를대상으로데이터마이닝기법(Scientometrics 기법) 을통해클러스터링된키워드의연관성을바탕으로요소기술후보군을도출 인공지능기반 SW 기술의특허및논문유효데이터를기반으로키워드클러스터링을통하여 9개 의요소기술후보군을도출 제품별 dataset 구축 : 인공지능기반 SW 기술관련특허/ 논문데이터를추출하여노이즈제거 후제품별 dataset 구축 1 차클러스터링 : 키워드맵을통한고빈도키워드확인- 빈도수(tf-idf) 33) 가상위 30% 에해당하 는키워드를대상으로 1차추출 2 차클러스터링 : 1차클러스터링에서추출된고빈도키워드사이에서고연관도키워드를 2차추 출 ( 고연관도기준은연관도수치34) 가 2 이상인클러스터로제한) 다음그림은키워드간연관네트워크를시각화한것으로, 간의연관도를나타내는직선으로구성 각키워드를나타내는원과키워드 각키워드가특허와논문중어느데이터에서도출되었는지원의색으로구분하였으며, 도출된클러스터는황색음영으로표시 키워드로 키워드를나타내는원은고빈도의키워드일수록원의크기가크게표현되며, 선은키워드사이의연관도수치가높을수록굵게표현 연관도를나타내는 인공지능기반 SW 기술전략제품의특허논문유효데이터에대하여키워드클러스터링결과를기반으로요소기술도출데이터기반의요소기술도출은키워드클러스터링을통해도출된요소기술에대하여전문가의검증및조정을통하여요소기술을도출 33) 빈도수(tf-idf) : 각키워드가출현되는특허또는논문수를의미 34) 연관도수치: 두개이상의키워드사이의특허또는논문수를의미 355
데이터인텔리전스 - 인공지능기반 SW [ 인공지능기반 SW 분야키워드클러스터링 ] [ 인공지능기반 SW 분야주요키워드및관련문헌 ] No 주요키워드연관도수치관련특허/ 논문제목 클러스터 01 neural network, deep 6~8 1. METHOD FOR PSEUDO-RECURRENT PROCESSING OF DATA USING A FEEDFORWARD NEURAL NETWORK ARCHITECTURE 2. SYSTEMS AND METHODS FOR SPEECH TRANSCRIPTION 3. Stock prediction using deep learning 클러스터 02 prediction accuracy, approach 4~6 1. Computer-based method and system of assessing intelligibility of speech represented by a speech signal 2. PERSONALIZED MACHINE LEARNING MODELS 3. Investigating optimal accelerometer placement for energy expenditure prediction in children using a machine learning approach 클러스터 03 defect prediction, perception 4 1. SYSTEMS AND METHODS FOR QUANTUM PROCESSING OF DATA 2. SEARCH RESULT RANKING USING MACHINE LEARNING 3. The monitoring system of Business support system with emergency prediction based on machine learning approach 356