보도일시 화 조간 온라인 부터보도해주시기바랍니다 배포일시 월 담당부서 담당과장김지원 담당자 지능정보사회추진단인공지능정책팀 김근영사무관 조찬영주무관 누구나인공지능 (AI) 응용서비스를개발할수있도록 인공지능허브 지원을다각도로확대한다 - 1 인공지능학습용데이터대폭확대, 2 개방형경진대회추진, 3 고성능클라우드컴퓨팅지원확대 - 과학기술정보통신부 장관유영민 이하 과기정통부 는국내인공지능 중소 벤처기업의경쟁력을높일수있도록 인공지능허브 를확대구축한다 ㅇ 인공지능허브 란누구나인공지능기술 서비스개발에필요한 필수요소를자유롭게활용할수있는개발환경을제공하기위해시작한사업으로서 지난해 월부터구축 운영되었다 정부는지난해 월국가차원의전략적투자가필요한혁신성장 전략투자분야로인공지능을선정하면서 핵심사업인인공지능허브에대한투자를대폭확대 하기로하였다 ㅇ지난해까지는인공지능개발필수요소중학습용데이터위주로 개방 제공이되었다면 올해부터는학습용데이터제공을대폭확대하는동시에개방형경진대회를통한인공지능알고리즘 개발 제공과고성능컴퓨팅지원이보강될예정이다
인공지능학습용데이터 인공지능학습용데이터는인공지능학습에활용할수있는형태의데이터로 인공지능기술및서비스개발을위한필수요소이다 하지만데이터구축에많은시간과비용이소요되어중소 벤처기업이자체적으로확보하기에는어려움이많았다 이에과기정통부는 년부터 인공지능학습용데이터구축을 시작하였고 월부터일반상식 이미지 특허 법률등 종의 학습용데이터를제공했다 금년 월중에 년에구축을추진한관광 농업 헬스케어분야데이터를추가해 종으로확대하고 월에는한국어음성 대화등 종을추가개방할예정이다 금년에는학습용데이터의제공종류와규모를글자체 동작 엑스 레이이미지등 종 최소 만건 으로대폭확대하고 개방시기도차년도 월에서해당연도 월 월로앞당길예정이다 ㅇ또한민간중심으로인공지능학습용데이터가자생적으로생성 확장하는생태계가구축될수있도록 대중이데이터구축에참여 하는방식 크라우드소싱 의데이터확산체계마련 학습용데이터 구축도구공개 인공지능응용시범서비스등새로운서비스도지속검토 도입할계획이다
v ~ ㅇ ㅇ 개방형경진대회를통한알고리즘개발 제공 국내중소 벤처기업과연구자등이보다쉽고효율적으로인공 지능서비스를개발할수있도록인공지능기술공개를두가지방식으로확대한다 첫번째 실시간으로우수알고리즘을공개경쟁하고 알고리즘 개발이력과우수인재순위가공개되는형태의온라인인공지능경진대회플랫폼을새롭게구축하여운영한다 ㅇ올해첫회를맞이하는온라인인공지능경진대회는누구나손쉽게 접속하여자율적인형태로기술력을겨룰수있는혁신의장 으로 민간또는지자체 정부부처도과제를직접등록하고우수연구자에게직접포상할수있는플랫폼으로활용할계획이다 ㅇ올해에는도전문제들을우수하게해결하는 개팀을발굴 월경공고 월경선발 하고 이후 개월간 월 인공지능서비스개발 상용화를위한사업화비 평균 억원 총 억원 를지원할예정이다 둘째로 과기정통부가국책연구과제로지원한기술을연구자들이이용하기쉬운형태 오픈 로개방하는범위를점차확대한다 ㅇ 월부터한국어질문분석 음성처리등 종을개방하였고 금년 월중에는대화처리등 종을추가개방하고 차년도 월에는질의응답후보추론 발음평가등 종을추가개방할예정이다
고성능컴퓨팅 고성능컴퓨팅환경은대량의학습데이터를빠르게학습하여인공 지능기술및서비스개발시기를앞당기는데필수적이나 비용이많이소요되는문제가있다 이에자체컴퓨팅환경이열악한인공지능중소 벤처기업등을대상으로클라우드기반의컴퓨팅자원지원을대규모로확대한다 특히 딥러닝에특화된컴퓨팅자원 을제공함으로써신속한인공지능기술및서비스개발을촉진할것이다 ㅇ올해에는중소 벤처기업 연구 공공기관 대학등의신청을받아 여개기관을선정 월예정 하고이후 개월간 월 컴퓨팅자원을지원할예정이다 장석영과기정통부정보통신정책실장은 국내인공지능산업의 경쟁력을키우기위해서는국내개발자들이인공지능서비스와 제품을제약없이개발할수있는환경조성이중요하다 며 앞으로도기술력있는국내중소 벤처기업이역량을확보해세계로진출할수있도록생태계마련에힘쓰겠다 고밝혔다 과기정통부는인공지능학습용데이터구축 클라우드컴퓨팅 제공 경진대회등사업수행에필요한사항에대해서도사업자 공모등을진행할예정으로 사업의신청 접수기간등세부적인 내용과절차 일정등자세한내용은 월 일 허브 또는한국정보화진흥원누리집 정보통신산업진흥원누리집 를통해확인할수있다 이자료에대하여더욱자세한내용을원하시면과학기술정보통신부지능정보사회추진단인공지능정책팀김근영사무관 ( 02-2110-1617), 조찬영주무관 ( 02-2110-1618) 에게연락주시기바랍니다.
참고 1-1 19 년도인공지능학습용데이터셋지원및개방계획 ( 안 ) 개요 ㅇ중소 벤처기업등에게 제품 서비스개발의성능향상에필수적인 학습용데이터셋구축지원및개방을통해 활용확산촉진 19 년도구축지원및개방 ( 안 ) 분야번역말뭉치사물이미지글자체이미지인도보행영상복합영상사람동작영상안면이미지위험물이미지질병진단이미지이상행동영상 구축내용 o 한국어인공지능번역기술개발및성능강화를위한한국어 - 영어병렬말뭉치데이터 120만문장구축 o 한국형객체, 장소, 상황인지기술개발및성능강화를위한사물 / 거리 / 간판 / 심볼이미지데이터 360만장구축 o 한글광학글자인식 (OCR) 성능개선을위한한글글자체 ( 손글씨및인쇄체 ) 이미지 500만장구축 o 시각장애인, 전동휠체어등의보행지원기술개발을위한국내인도 횡단보도보행영상및인도위객체 ( 사람, 자전거, 가로수, 펜스등 ) 라벨링데이터 6만건 (500시간) 구축 o 감성인식 AI개발을위해동영상에서인물의표정, 음성, 발화내용, 상황등의감정이포함된다중영상데이터 9만건 (50시간 ) 구축 o 사람의동작 자세 행동인식기술개발을위해다양한조건에서사람동작영상데이터 50만건구축 o 다양한각도, 조도등의환경하에서안면인식 식별성능강화를위한한국인얼굴이미지데이터 1,400만장구축 o 위험물 도구자동판별기술개발및성능개선을위한위험물, 범죄도구, 반입금지물품등의 X-ray 이미지 40만장구축 o 국내에서유병률, 중증도등이높은주요질환관련진단이미지 (X-ray, MRI, 초음파영상등 ) 및진단결과데이터 1만장구축 o 이상행동지능형탐지기술성능강화를위한주 야간적용가능한이기종 ( 가시광선, 적외선 ) 영상데이터 11만건 (300 시간 ) 구축 활용서비스 ( 예시 ) 한국어 - 영어 AI 번역시스템등 국내사물인식및 안내서비스등 자동한글인식 서비스등 장애인길안내, 자율전동휠체어등 인간의감정, 상황이해로봇등 가정, 공공시설 등의서비스로봇등 한국인얼굴 인식 AI 시스템, 범죄자탐지 공항, 항만, 철도, 주요 시설 AI 보안검사 주요질병 자동검진 AI 의사 지능형 CCTV, AI 안전감시
참고 1-2 17~18 년도인공지능학습용데이터셋개방현황 구분 분야 구축내용 특허 o 국내출원 등록된전기 전자분야의특허정보, 심사정보, 특허전문기술용어데이터 100만건 활용서비스 ( 예시 ) 유망기술예측, 특허가치평가등 17 년구축 ( 18.1월 법률 o 국가법령중교통사고, 층간소음, 창업인허가분야의 관련법령, 조문, 판례, 법률용어데이터 11 만건 법률정보추천, 법률상담챗봇등 개방 ) 한국형 o 한국인안면이미지 600 만장 (200 명 ) 및한국음식이미지 본인확인기술, 750 만건 이미지 데이터 15 만장 (150 종 ) 등 615 만장 식단추천등 일반상식 o 한국어위키백과에서 AI 서비스개발에활용도가 높은일반상식데이터 15 만건 인공지능비서, 교육용챗봇등 관광 o 주요관광지역시설, 식당의이미지에각종다국어 ( 한, 영, 중, 일 ) 정보 ( 명칭, 위치, 메뉴, 관광정보등 ) 를결합한데이터셋 150 만건 관광정보검색, AI 관광가이드등 농업 o 국내농작물의영농정보, 상담정보, 지원사업정보등의 지식베이스및농작물병충해이미지데이터 5 만건 병충해자동진단 AI 등 18 년구축 ( 19.1월 헬스케어 o 안저이미지에주요질환 ( 녹내장, 황반변성, 당뇨망막증등 ) 의 전문의검사소견을결합한데이터셋 3 천장 안저질환검사및예측등 개방 ) 850만건 특허 o 전기 전자, 기계, 화학분야의등록된특허청구항 정보, 특허전문기술용어데이터 70 만건 유망기술예측, 특허가치평가등 법률 o 이혼, 한부모가족, 학교폭력, 퇴직금개분야법령정보 ( 법령, 판례, 사례, 용어등 ) 데이터 10 만건 법률정보추천, 법률상담챗봇등 한국형 o 한국인안면이미지 600 만장 (200 명 ) 및국산차량이 본인확인기술, 이미지 미지 15 만장 (100 종 ) 등 615 만장 차량추적등 한국어 o 한국어음성인식성능을향상시키기위해자유연속발화, 가상비서, 18~ 19 년구축 ( 19.4월개방예정 ) 250만건 음성한국어대화복합영상기계독해 소음환경등을고려한음성데이터 150 만건 (1,000 시간 ) o 중소상인비즈니스에적용가능한한국어챗봇구축을 위한한국어표준대화시나리오데이터 50 만건 o 영상에서인물의표정, 음성 ( 억양 ), 발화내용등의 감정이포함된멀티모달영상데이터 3.5 만건 (20 시간 ) o 지문으로부터 AI가학습을통해질의에대한답변을 추론하는딥러닝기반기계독해 (MRC) 데이터 50 만건 음성인식서비스등소상공인챗봇서비스등인간의감정, 상황이해 AI 서비스등질의응답 AI 서비스등
참고 2 클라우드컴퓨팅지원계획 개요 ㅇ컴퓨팅환경이열악한중소 벤처기업등에막대한계산을효율적으로 처리할수있는 기반의고성능클라우드컴퓨팅자원제공 고성능컴퓨팅인프라지원을통해중소 벤처기업 스타트업에신속한 제품 서비스를개발할수있도록지원 18 년지원주요내용 ㅇ 지원대상 컴퓨팅환경이열악한중소 벤처기업 스타트업등 ㅇ 지원내용 민간의 기반클라우드컴퓨팅을임대하여제공 서버 식 인공지능개발용공개소프트웨어및서비스개발환경등 기반클라우드컴퓨팅사용방법등의교육을통해응용서비스개발지원 인공지능제품개발시기술적문제자문 ㅇ 선정방법 공모를통해신청한기업의개발내용 활용방법등신청 사항을심사하여대상기업선정 년 개기업지원예정 ㅇ 지원일정 사업지원대상선정 월 이용 월 월 ㅇ 지원환경 인공지능개발환경과컴퓨팅인프라지원내용 인공지능개발프레임워크 등 서버용 이상 배정밀도 단정밀도 식이상 서버당 이상
참고 3-1 개방형경진대회플랫폼운영계획 개요 ㅇ 우수 특화 알고리즘개발을통한기술혁신을가속화할수있도록 도전적 창의적문제해결의 인챌린지온라인플랫폼구축 운영 정부에서제시한도전적인문제를해결하는우수 특화 알고리즘을 개발하는중소 벤처기업등에게인센티브 포상금등 를제공 v 민간의혁신이활발한미국도연방정부가중심이되어 12 년부터개방형경진대회플랫폼 (Challege.gov) 을통해 AI 개발및확산에기여 - 100 여개이상의정부부처및연방기관이도전형과제를 819 개제안 ( 18.2 기준 ), 25 만명이상참가, 약 1 억달러 ( 12~ 16) 포상금수여 주요내용 ㅇ 문제발굴 전문가로구성된문제발굴위원회가공공 산업데이터를 활용하여지정한 개과제에대한문제해결알고리즘개발경연 기업에서개발한알고리즘을활용하여지정과제를수행한결과를 평가하여상위기업 사업화지원기업의 배수 의사업화계획평가를 통해사업화지원기업선정 ㅇ 문제해결 누구나경진대회과제를직접등록 참여할수있고 이를해결하기위한 알고리즘을학습할수있는환경제공 ㅇ 사업화지원 알고리즘개발성과와사업계획서를평가하여사업화 지원대상을선정 사업화지원 ㅇ 우수아이디어 제안한데이터품질과문제우수성 문제정의 해결 목표 평가방법등 을심사하여우수제안에대해 선발및포상
참고 3-2 인공지능소프트웨어개방계획 개요 ㅇ정부의 연구개발결과물을중소 벤처기업이활용하여지능화 제품 서비스개발에활용할수있도록오픈 형태로개방 주요내용 ㅇ 제공형태 오픈 를대표적인웹서비스방식으로개발 제공 개발자가오픈 를호출하고데이터를입력하면이를전달받은 서버에서연산을수행한후에분석결과를사용자에전달 ㅇ 활용방법 개발자는여러종의 를조합하여지능형검색 자동질의응답 상담솔루션등다양한응용서비스개발에활용
참고 4 인공지능 (AI) 오픈이노베이션허브 이용방법 이용방법및준수사항 ㅇ 이용대상 국내기업및대학 연구기관 개인등누구나계정을 발급받아포털에서제공한서비스를활용가능 ㅇ 준수사항 제공한데이터를활용하여제품 서비스개발및연구 개발 에활용한논문 제품등결과물에데이터의출처명시 다운로드를받은데이터셋은제 자에게재배포불가능 이용절차