오수정 한국언론재단데이터베이스팀차장대우 인터넷 비효율적뉴스유통과기술적낙후해결 뉴 스포맷표준화가절실하다. 포털등여러사이트에기사를제공할때마다그쪽요구사항에 맞게프로그램개발을다따로하는실정이다. 언론사가시스템을개편할때적용할수있는표준안이없어개별사가다다른시스템을갖추게되기때문에불필요한비용이지출된다. 한국언론재단주최로지난 4월 22일열린 뉴스전송방식표준화모색을위한토론회 참석자들의얘기다. 뉴스유통시장의활성화, 뉴스이용자들의요구에능동적으로대처하고개인또는기업에필요한차별화된멀티미디어형맞춤정보를다양한디바이스를통해전송하고활용하려면포맷표준화는시급한과제라는것이이번토론회의결론이었다. NewsML 기반의뉴스전송포맷표준화모델개발 국제표준뉴스포맷 NewsML 그러나표준화된뉴스포맷은이미있으며국제적으로널리이용되고있다. 로이터, AP, AFP 등국제적인유수통신사를비롯, 뉴욕타임스, BBC 등의언론사, 일본신문협회, 세계신문협회 (WAN) 와같은언론단체, 시스템벤더회사등총 55개사가회원사로가입된국제언론통신평의회 (IPTC:International Press Telecommunications Council) 가국제표준뉴스포맷으로승인한 NewsML(News Markup Language) 이그것이다. NewsML은 1998년로이터통신이처음설계해 1999년 IPTC에표준화를제안함으로써시작되었다. IPTC는로이터의제안을검토하면서 뉴스생산, 유통, 소비자의이용을포함한라이프사이클전반을통 155
< 그림 > NewsML 문서의네가지계층 NewsML 한글버전 이라할 NewsML-KR 제안서로서의목적을갖고있으며향후언론사실무자들의의견수렴을거쳐보완, 수정할실험판으로서의성격을띤다. 해뉴스를표시하고관리할수있는 XML(eXtensible Markup Language) 기반의표준 을만드는작업을진행했다. 그리고 1년뒤, NewsML 1.0 버전을승인했고지금까지 2번의업데이트를거쳐현재 1.2 버전이발표되었으며 2.0 버전을검토중이다. 한국언론재단데이터베이스팀은국내뉴스포맷표준화모델개발을위해 1차적으로언론업계에잘알려지지않은 NewsML을번역, 소개하는작업이선행돼야하며국내표준과국제표준이서로통용되기위해선 NewsML의기본근간을살리면서우리나라뉴스의독자적인부분을담을수있는한국형 NewsML 개발이필요하다는문제의식을갖고 NewsML 기반의뉴스전송포맷표준화모델개발 용역을발주했다. 이용역은 ( 주 ) 와이즈미디어가 7월 12일부터 9월 11일까지 2개월간수행해최종보고서를발간했다 ( 카인즈회원사전용게시판인 www.kinds.or.kr/committee 자료실에서보고서전문을볼수있음 ). 이보고서는 NewsML에대한본격적소개서이자 차선없는고속도로현재각언론사의뉴스포맷과메타데이터는천차만별이기때문에시장에참여한언론사수만큼이나다양한유형이존재한다. 이는뉴스라는상품을유통하는고속도로에차선도없이비효율적으로뉴스가유통되고있음을의미한다. 언론사는고객사들의포맷에맞춰여러포맷으로콘텐츠를제공한다. 여러언론사로부터뉴스콘텐츠를제공받는고객역시각기다른포맷의콘텐츠를제공받기때문에상품이나시스템변경이있을때마다추가적인작업이병행돼야하는불편함과비용부담이따른다. NewsML은이러한유통구조의복잡성과기술적낙후로인한시장성장의방해요인을제거하기위한수단이다. 또한멀티디바이스의등장, 실시간맞춤서비스수요충족등고객지향의콘텐츠생산을위해콘텐츠기획부터고객의피드백을받는최종단계까지뉴스의라이프사이클을통합관리해야한다. 그러기위해선각단계의영역에관련되어있는어플리케이션들이상호연계성을가질수있어야한다. 지금과같은업무중심의어플리케이션은신문용기사와웹용기사를별도관리함으로써운영및보관에필요한시스템투자를각각해야하거나각시스템마다콘텐츠작성자, 편집자, 웹기자와웹관리자를따로배치할수 신문과방송 156
현재각언론사의뉴스포맷과메타데이터는천차만별이기때문에시장에참여한언론사수만큼이나다양 한유형이존재한다. 이는뉴스라는상품을유통하는고속도로에차선도없이비효율적으로뉴스가유통 되고있음을의미한다. 밖에없고같은기사가여러응용시스템에흩어져있게돼뉴스관련정보를통합관리하지못하는불편함이있다. 반면콘텐츠관리체계표준화는업무프로세스표준화를가져오고생산성증대, 콘텐츠의효율적관리를가능케해기회비용을줄이는한편시장의요구에즉각대응할수있는상품구성을위한시스템통합운영을지원한다. 또한 NewsML 표준에의한뉴스콘텐츠로는다양한메타데이터를활용해상품개발이쉽고 CMS를 NewsML에기반해구축할경우웹, 모바일, 이메일, ebook 등디지털디바이스로의출판이자유롭고새로운시장발굴및확대도가능하다. 게다가뉴스콘텐츠저작권보호를위한필수정보를모두기록함으로써기사도용및무단전재를예방하는효과도크다. 해당콘텐츠의소유권, 발효날짜, 해당콘텐츠이용권한에대한상세한정보는물론저작권보호를위한안내문을상세하게기록할수있다. 기사와함께다양한정보포함 NewsML은 XML 문서다. NewsML은 html과비슷하지만 html이디자인요소와데이터가하나로돼있기때문에구조가복잡하고관리가어려운반면, NewsML은디자인요소는포함하지않고콘텐츠내용과이를설명하는메타데이터만포함한다. NewsML 문서는네가지계층으로구성되어있다 ( 그림참조 ). 그림의가장안쪽에위치한콘텐트아이템 (Content Item) 은뉴스콘텐츠의내용에해당하는것으로뉴스환경에서다루어지는정보의기본단위이다. 여기에는기사본문내용과함께이것이텍스트인지, 멀티미디어데이터인지를인식하기위한부가정보를포함하고있다. 구조계층인뉴스콤포넌트 (News Component) 는뉴스를담는컨테이너기능을한다. 여기에는텍스트기사와이기사관련여러개의사진, 그리고사진에대한별도의설명문등여러개의콘텐트아이템을포함할수있다. 뉴스콤포넌트는해당콘텐츠의제공자, 작성자, 출처, 파일이름, 작성일자, 저작권정보, 사용권한정보, 주제분류값, 장르와같은다수의다양한정보를기록할수있다. 관리계층인뉴스아이템 (News Item) 은 NewsML 에서뉴스를관리하는가장중요한단위이다. 뉴스아이템은개별적으로식별이가능하고출고할수있는뉴스의단위조각으로변경 (revision) 정보, 상태 (status) 정보, 긴급도등뉴스콘텐츠관리에필요한메타데이터로이루어져있다. 변경정보는제공된콘텐츠가최초의것인지수정된것인지에대한정보와변경이력을담고있으며, 상태정보는제공된콘텐츠가사용가능한지 (usable), 추후별도의통지가있을때까지출고를제한하거나 (withheld), 특정시점에서출고를허락하거나 (embargoed), 이미제공된뉴스가어떤이유로든출고되지않도록조치 (canceled) 할수있게해준다. NewsML 문서의가장바깥쪽에위치한교환계층인뉴스엔벌로프 (News Envelope) 는우편물봉투에 157
있는정보처럼뉴스콘텐츠를배포하는역할을한다. 해당뉴스콘텐츠를누가, 누구에게제공하는지와제공되는날짜와시간, 그리고서비스나상품에대한정보등을포함한다. 뉴스콘텐츠본문이외이에대한관련정보가많다는것은콘텐츠활용도가높다는것이며콘텐츠관리의효율성도그만큼높아짐을의미하는것으로뉴스의라이프사이클전체를관리할수있다. NewsML이 DTD(Document Type Definition: XML 문서에사용되는구성요소를정의해두는문서로 NewsML에서는뉴스콘텐츠의관련정보표현에필요한각종항목을정의해둔다 ) 를통해문서구조를표준화하는방식으로국제표준뉴스포맷을제공한다는것외에또하나의특징은콘텐츠분류와용어에대한표준을함께제공한다는점이다. 뉴스콘텐츠교환을위해서는포맷의표준화뿐아니라콘텐츠를설명하는각종용어의표준화도이루어져야한다. 그렇지않으면 NewsML로제공했다하더라도부가정보를인식할수없거나다른의미로받아들여오류가발생한다. 이문제해결을위해반복적으로자주사용되거나정해진표현으로명기해야하는각종용어를미리정의해두었는데이런용어를 통제용어 라부르며통제용어를유형별로묶어토픽셋 (Topic Set) 이라는 XML 문서형태로제공하고있 다. IPTC는통제용어가등록된토픽셋을각국언어로번역해사용할수있도록웹사이트에공개하고있다. 토픽셋과통제용어는사전의역할과동시에뉴스콘텐츠를분류하는기능때문에뉴스콘텐츠분류체계 (Taxonomy) 라볼수있다. NewsML 한글버전, NewsML-KR IPTC는 NewsML을뉴스제공사가쉽게채택할수있도록 NewsML과관련한소스와정보를무상으로공개하고있어영어기반의시스템구축은 NewsML 버전 1.2를그대로따르면된다. 그리고 NewsML을각나라마다, 뉴스제공사마다변형하거나확장하는것도가능하게돼있다. 이번보고서에서제안한 NewsML-KR은 NewsML v1.2를그대로준수해한글화하고확장한것으로모든뉴스제공사가즉시사용가능한국내표준이다. 한글화의대상은 NewsML이제공하는토픽셋이다. IPTC는일부토픽셋은뉴스제공사가국내사정에맞게독자적으로관리해사용할수있도록했다. 제공처, 수신처, 출처등의정보를위한토픽셋인기관 (Party), 인명 (Person), 회사 (Company), 발생처 (Location), 기관명 (Organization) 등이그것이다. 그리고 NewsML의주제코드 (Subject Code) 토픽셋에는정치, 경제, 사회, 문화와같은약 1,200여개이 신문과방송 158
한국형 NewsML 표준승인과보급을통한기술인프라구축은뉴스산업성장촉진과활성화를위한최 우선적과제이며어떠한형태로든지속적인논의와보완이필요하다. 이를위해뉴스제공사간이해관계 를초월한협력이필요한시점이다. 상의토픽이등록되어있는데여기에는북한, 북핵, 청와대같은국내에필요한토픽이존재하지않는다. 이런것들을새로추가했다. 토픽셋은뉴스콘텐츠에대한다양한메타데이터이자뉴스콘텐츠분류체계이므로교환시이들정보를상호참조할수있어야하므로 NewsML에서정의한표준을따랐다. 이해관계초월한협력절실일본은 NewsML을성공적으로도입해활용하고있는사례로꼽힌다. 일본신문협회산하기술위원회는 2000년 NewsML팀을별도로구성해현재까지3기팀이활동중에있으며이팀에의해만들어진 nsknewsml이일본표준 NewsML이다. 신문, 통신사, 벤더 (vendor) 기업등 40여개사의기술진으로구성된 NewsML팀은초기각신문사기사를기초로 NewsML의각요소들과비교분석을통해표준안에모두수용될수있는지여부를검증했고 NewsML 기능사양서를일본어로번역, 소개했으며 NewsML 을최초설계한로이터통신에연수팀을파견하기도했다. NewsML팀은 NewsML 가이드라인을자체적으로작성해관계자들에게배포하는한편, 교토통신사에 NewsML 도입을제안해 2001년교토통신은차기뉴스전달포맷으로 NewsML을채택했다. 또한같은해 nsknewsml level 1이정식발표되었고마이니치신문사는이에기초한 NewsML 소스를공개했다. 이같은일련의노력으로일본에는 NewsML 채택뉴스 제공사가지속적으로증가하는추세다. 중국도 2002년 1월 중국뉴스ML협회 (Chinese NewsML Community) 를구성, 대만, 홍콩과함께뉴스ML을개발, 채택하는논의를진행하고있다. 우리나라는 2002년로이터통신이국내파트너사인뉴시스통신사에 NewsML기반의뉴스시스템구축을권고하면서 NewsML 기반의시스템을구축한것이시발이다. 그러나이는완전한 NewsML이아니라내부시스템이생산한콘텐츠를 NewsML로변환해제공하는방식이었다. 연합뉴스는입체화된뉴스정보전달을위해 NewsML을응용한 knewsml을개발했는데이것도 NewsML의전면도입이아니라응용모델로개발된것이다. 인터넷강국이라는우리나라는뉴스포맷표준화추진은국제적추세에비해뒤늦은출발을보이고있는셈이다. 한국언론재단은언론산업의중요현안임에도불구하고공론화되지못했던뉴스포맷표준화논의의진전을위한첫단계로 NewsML을번역, 소개함과동시에 NewsML-KR을제시했다. 그리고이에대한의견수렴과보완을위해 10월 22일언론재단연수센터에서 온라인뉴스저작권보호와뉴스ML 기반의전송포맷표준화방안토론회 를열었다. 한국형 NewsML 표준승인과보급을통한기술인프라구축은뉴스산업성장촉진과활성화를위한최우선적과제이며어떠한형태로든지속적인논의와보완이필요하다. 이를위해뉴스제공사간이해관계를초월한협력이필요한시점이다. 159