저작권기술 Newsletter 2018 년 14 호 3 저작권신기술동향 (Hot Issues on the R&D) 저작권관련최신특허기술 IBM 과구글의안면인식기술특허 해외저작권기술소개 영상저작권, 인공지능과비디오내안면인식기술 국내저작권기술소개 음악저작권을위한마이크로음성식별기술
국내저작권기술소개 음악저작권을위한마이크로음성식별기술 기술분야 : 저작권관리기술 적용시장 : 1 인창작자콘텐츠생산시장 기술개발의배경 MCN(Multi Channel Network) 은유튜브와같은영상플랫폼 1) 내의창작자들과제휴하여, 영상제작이나판매등을지원하고수익일부를공유하는새로운형태의콘텐츠제작플랫폼이다. 흔히 BJ(Broadcasting Jockey), 콘텐츠크리에이터라불리는 1인콘텐츠제작자들이콘텐츠를제작하여방송을진행하며, 유튜브의경우분당 300시간분량의영상이업로드되고있다. 문제는영상에사용되는음악등의콘텐츠들이저작권에대한고려없이무분별하게사용되는경우가많다는것이다. 1인콘텐츠제작자들로부터만들어지는콘텐츠이기때문에유명콘텐츠크리에이터들을제외하고는, 저작권있는콘텐츠에대한불법사용이많이발생하고있다. 저작권문제해결을위한기존모니터링시스템은, ( 그림 1) 과같이사람의청음에의존하고마지막결과도출작업도사람이담당하는경우가많다. 그러므로현재의콘텐츠생산량을생각하면현실적으로거의모니터링이되지않고있는실정이라봐도무방하다. 최근이와같은음악저작권문제를해결하기위해인공지능을활용한방송음악모니터링기술이연구되고있다. ( 그림 1) 기존음악모니터링시스템의동작방식 1) 영상제작과유통을편리하게할수있는기능들을제공해주는소프트웨어환경 2
음악식별기술 음악식별기술은오디오기반의특징점인식기술로도불리며, 음악의특징을신호적으로파악하여음악을찾아내는기술이다. 방송음악모니터링을위해서는음악의특징을찾아내서저장된특징과비교하는과정이필요한데, 이를위한핵심기술로음악식별기술이사용된다. 음악식별기술은음악에서인간의 DNA와같은특징점을추출하여, 데이터화하고이를기반으로음악을검색하는기술이핵심이다. 특정음악의저작권위반여부등을파악할때사용될수있는기술로써, 아래의세가지조건을만족해야한다. 가. 사람이직접느꼈을때유사한음악이면, 특징점값도유사해야한다. 나. 서로다른음악에서추출된특징점은달라야한다. 다. 특징점을이용해서효율적인검색이가능해야한다. 특징점기반기술을보유한기업으로는 Gracenote, Shazam, Google 등이대표적이다. Gracenote 는음악인식솔루션회사로써 2008년소니가인수하였으며, LG, Ford 등에음악인식솔루션을납품하는업체이다. Shazam은 2002년에시작한음악서비스기업이며, 전세계 150여개국에 5천만명이상의사용자를확보한회사이다. 오디오기반의특징점인식기술의원리를살펴보면, 먼저음악을파형으로파악한다. 이들파형을시간의흐름에따라주파수로표현한후, 업체별알고리즘을적용해주파수구간의특징점을얻어낸다. 얻어낸특징점을데이터화하고이데이터를기반으로음악을식별하는작업을수행한다. ( 그림 2) 는오디오기반의특징점인식과정을통한검색결과도출작업을보여준다. 먼저오디오음원을통해특징점을생성한후, 데이터베이스를만들어낸다. 입력되는음원에서특징점을추출하여, 데이터베이스와비교분석후검색결과를도출하는과정이다. ( 그림 2) 오디오기반의특징점인식과정 3
실시간방송음악식별을위한국내기술 국내의경우를살펴보면, ETRI가최근실시간방송콘텐츠에대한식별기술을개발하고있다. 이는실시간방송콘텐츠에서시청각특징을빠르게추출하여이를데이터베이스로만들고, 실시간콘텐츠전체또는일부분을식별하는기술이다. 실시간콘텐츠를대상으로하는기술이기때문에아래와같은기술적특징을가진다. 주요내용은실시간고속식별자및특징점동시추출기능을수행할수있다는점이다. 가. 실시간방송콘텐츠의식별자고속생성 (100ms 이내 ) 나. 최신방송식별데이터베이스고속업데이트 (1초단위 ) 다. 1PC 당 4개방송채널의특징점동시추출가능라. 세컨드스크린을통한연관정보제공가능마. 스마트단말용 (Android, ios) 방송프로그램식별앱동시개발 실시간방송콘텐츠지원을위한콘텐츠특징점등의식별자고속생성기술을개발하였다. 현재성능은 100ms 이내에고속생성이가능하다. 또한최신방송식별데이터베이스는 1초단위업데이트가가능하다. 이외에도다수채널방송의동시특징점추출기능, 정보제공기능, 앱, PC 등에서기술활용이가능하도록하는프로그램등이개발되었다. ETRI에서는방송음악모니터링기술도개발하였다. 콘텐츠식별을위한기술로 Active Audioprint (AAP) 기술로불리는기술이다. AAP 기술은아래의주요기술들을포함한다. 가. 음질왜곡을최소화하면서식별데이터등을오디오에삽입하는기술나. 빠른응답속도를보이는음향특징기반검색기술다. 실시간정보삽입, 검색, 동기화가가능한오디오데이터전송기술 ( 그림 3) 은 AAP 기술개념및서비스흐름을보여준다. 콘텐츠가생산되면, Active Audioprint가콘텐츠에삽입된다. Active Audioprint는오디오콘텐츠를식별할수있는기능을가진다. Active Audioprint는광고, 협찬상품정보, 방송관련정보등의정보로구성된다. 생성된 Active Audioprint는콘텐츠자체와결합되어방송이되고동시에데이터베이스에저장이된다. 저장된 Active Audioprint는기업체등에서방송되는콘텐츠와비교모니터링를위해사용된다. 오디오수신측에서는 TV, 라디오, 모바일단말등다양한장비를활용해모니터링을수행할수있다. 또한기업체는자신들이요청한광고방송모니터링을통해자신들이요청한광고, 협찬상품정보등이콘텐츠에정확히포함되는지를모니터링한다. 4
( 그림 3) AAP 기술의개념및서비스흐름도 2) 2) 시사점 영상콘텐츠는다양한경로로제작되고있으며, 콘텐츠의수또한기하급수적으로늘고있다. 영상콘텐츠를활용한수익모델도기존방송이나영화등의미디어뿐아니라 MCN이나모바일을활용한다양한형태의영상물등으로진화하고있다. 음성식별기술은새로운콘텐츠시장및산업으로자리잡은 MCN 시장및 1인콘텐츠제작시장을저작권침해없이활성화시킬수있는기반기술로자리매김할수있을것으로기대된다. [ 기획및편집 : 한국저작권위원회, 작성 : 엘엔제이테크 ] 참고문헌 1. KB 지식비타민, 동영상플랫폼의절대강자, 유튜브의성장과변화, 2017 2. 국내외 MCN 산업동향및기업실태조사보고서, 한국전파진흥협회, 2016 3. 오디오핑거프린팅기반입체음향재현시스템, 류상현, 김현국, 전자공학회논문지, 2013 4. Google AI Blog, https://ai.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html 2) 출처 : 미디어접근편의성향상을위한 Active Audioprint 기술개발, ETRI, 2017.12 5