DjVu High Compression Technology 문서 압축 신기술 소개 및 Paperless 적용 사례 2007.9 We Make Imaging Work. Everywhere. Copyright 2007, Celartem Technology, Inc. All rights reserved
목차 문서 압축 포맷 - DjVu 란? DjVu 주요 특징 DjVu Technology 소개 주요 적용 사례
문서 압축 포맷 - DjVu 란?
문서 압축 포맷 - DjVu 란? DjVu 포맷 이란? 기본 사상 : 종이 문서를 가장 효율적으로 Scan-to-Web 하기 위해서 탄생한 포맷 종합 디지털 포맷으로 발전 : Scan 문서, Digital Photo, Digital Document 를 압축 저장하는 포맷으로 발전 개방형 파일 포맷 : 컬러 스캔 문서, 디지털 문서를 가장 효율적으로 압축,저장,관리, 배포를 위하여 개발 및 공개된 포맷 매우 인상적인 압축 파일 크기: 경우에 따라서 1,000:1 까지 압축 고품질의 이미지 유지: full color, full text resolution OCR된 텍스트를 hidden XML로 저장 및 검색 진정한 포터블 포맷: no fonts, any devices Highly optimized Web viewing : 900KB plug-in viewer Page streaming 기술을 통한 빠른 검색 및 디스플레이 개방형 구조로 어플리케이션들과 연동이 용이
DjVu 주요 특징
DjVu 주요 특징 핵심 요소 경량화 PDF 대비 파일크기 평균 1/5 1/20 크기로 압축 Content Quality 액세스 속도 압축 사이즈는 최저 콘텐트 품질은 최고 유지 DjVu segmentation 기술 적용 텍스트 계층의 가독성을 극대화로 인하여 OCR 품질 최대 및 자동화 구현 웹상에서 full color 5000 페이지 도서도 1초 단위 액세스 및 뷰잉 DjVu 만의 페이지 단위 스트리밍 기술 적용 책의 페이지 수와 상관없이 일정한 검색 및 액세스 속도 유지 안정성 1999년 미국 AT&T에서 DjVu 기술을 발표한 이래로 전세계에서 600백만 이상의 사용자 해외-미국 워싱턴주/싱가폴 National Archive/일본 아시아 역사 기록 보존소/아일랜드정부 문서관리 국내-삼성전자/LG전자/두산인프라코어/대학교(서울대,연세대,다수)/삼성화재/농협 등에서 주요 문서 포맷으로 사용
DjVu 주요 특징 핵심 요소 Super Converter 모든 콘텐트 DjVu 및 PDF 로 압축 변환: 스캔 이미지(JPEG,TIFF,GIF,BMP), 디지털 문서(PDF,EPS,PS,QuarkXpress, MSOffice,HWP,etc) 한번의 변환으로 다양한 웹 온라인 ebook/오프라인 ebook 퍼블리싱/모바일 PDA 퍼블리싱) 표준 포맷 지원 : PDF/A, JBIG2, JPEG2000, JPEG2000/Part6 Paperless 구축 용이 발전성 ROI 전과정 자동화에 의한 시간 및 투입 인원 단축 흑백/컬러 책 -> 스캐닝 -> DjVu 압축 -> OCR 처리-> 웹 퍼블리싱 자동화 통합 뷰어 멀티포맷 지원/주석 편집기능 제공 DjVu 문서 보안 기능 및 Secure 뷰어 제공 새로운 비즈니스 모델과 연계하여 new viewer 출시 가능 네트웍 트래픽 압축 크기 만큼 감소 저장 스토리지 장비 절감 (PDF 대비 평균 1/10, JPEG 이미지 대비 평균1/20) 스캔 책 자동 검색 시스템 자동화로 인한 인건비 감소
DjVu Technology 소개
DjVu Technology 소개 가장 작은 크기의 컬러 스캔 문서 Uncompressed TIFF 포맷 보다 1,000 배 정도 작은 크기 JPEG/PDF 보다 5배에서 100배 정도 작은 크기 전형적인 풀컬러/고품질 문서의 DjVu 크기: 50KB 전형적인 웹페이지의 크기 정도 흑백 TIFF G4과 거의 같은 크기 46 MB 전형적인 400dpi 24 bit color로 스캔된 잡지 페이지 Benefits: 파일크기나 이미지 품질에 대한 우려 없이 고품질의 스캔된 컬러 문서를, 저장, 배포, 관리 의 용이성 모든 paper를 full color로 scan 을 가능하게 함: 비용 절감 효율성 증대 고객의 만족도 극대 1.3 MB 1.3 MB 56 KB TIFF JPEG PDF DjVu
DjVu Technology 소개 Black-White 이미지에 대해서 DjVu 는 흑백 TIFF G4 보다 3배에서 8배 정도까지 작게 압축이 가능 스캐닝 한 책 한권의 경우, TIFF G4보다 10배정도 작은 크기 최악의 경우도: 1.5배에서 2배 정도 작은 크기 전형적인 흑백 DjVu page size: 5-10 KB Benefits: 높은 흑백 압축율 (JB2 encoder) 100% 비손실/손실 압축 가능 Multi-page document format 탁월한 뷰잉 기능과 디스플레이 속도
DjVu Technology 소개 모든 전자문서 변환 및 뷰잉 PDF to DjVu: 2배에서 20배 정도 크기를 줄일 수 있음 DjVu의 VPD (Virtual Print Driver)를 이용 하여 Windows 내에 작성된 모든 문서를 DjVu 로 압축 변환 - MSOffice, 한글, 훈민정음, AutoCAD 포함 대부분의 CAD VPD를 통해서 압축된 전자문서들은 OCR 처리 없이 텍스트를 보전함 Benefits: 웹 페이지들의 snapshot 을 압축 저장 가능 윈도우시스템내의 어떠한 전자문서도 변환 윈도우시스템에서 가용한 모든 CAD 데이터도 변환 진정한 포터블 파일 생성(폰트가 필요없음) 스캔 된 문서와 전자문서를 하나의 포맷으로 통일
DjVu Technology 소개 Unique Segmented Compression 기술 Black&White 계층 Background color 계층 - 원문 압축 시 이미지를 Black&White, Background,Foreground 3계층으로 분석 Foreground color 계층 - 분리된 계층에서 텍스트 영역은 선명도를 극대화 - 3계층 중에서 흑백 부분은 JB2 압축 기술, 컬러부분은 IW44(wavelet) 압축 기술 적용 - 계층별로 최적의 압축율을 적용하여 1/100 1/1000 까지 압축율을 실현
DjVu Technology 소개 Unique Page Streaming 기술 전체 페이지에서 부분 Page 단위 전송 기술 1페이지문서나 5000페이지 문서나 액세스 속도 1초 미만 유지 Web Server 5000 Pages DjVu Background Cache DjVu plug-in viewer Current Page Sending Background Cache
Vu HidenText DjVu Technology 소개 D j 계층 스캐닝 문서의 속성: 스캔 된 문서는 고품질 이미지로서 보전 텍스트 검색 및 추출을 위해서는 OCR 을 이용 OCR된 텍스트는 DjVu 문서 내에 Hidden Text 계층으로 저장 DjVu 뷰어에서 키워드 검색 및 검색 결과 하 이 처리 가능 텍스트 계층은 XML과 plain 텍스트 형태로 추출이 가능 Windows 플랫폼에서 무료 DjVu IFilter 를 이용하여 full text 검색이 가능 Benefits: DjVu 파일들은 본문 내용 검색이 가능하고 검색엔진을 이용 색인이 가능 기존의 Document Management System들과의 연동이 용이 3rd Party 검색 시스템들과의 연동이 용이 페이지 단위 검색이 가능
DjVu Technology 소개 검색엔진과 연동 및 페이지 단위 본문 검색 Keyword 검색 검색엔진에 의한 페이지 단위 검색 결과 출력 - 페이지 번호 - 해당 키워드 본문 요약 검색된 페이지 본문 내에서 해당 키워드 하이라이트 표시
DjVu Technology 소개 Lightweight DjVu Viewing & Browsing Free browser plugins 900KB download, auto-installation Plugin-free viewing options: ExpressServer (서버 솔루션 이용) DjVu Java Viewer (public domain) 웹상에서 디스플레이 대기시간을 최 설계: Progressive page rendering 임의의 페이지를 직접 액세스 Pages 단위 스트리밍(page cache) 지원 실시간 zooming및 panning AJAX 기반 Viewer 제공 소 Benefits: any platform, any network 에서 문서들 순간적인 액세스 HTML 만큼 쉬운 DjVu 뷰잉 900KB 크기의 자동 설치
DjVu Technology 소개 DjVu: 웹 기반의 포맷 Hyperlink 지원 Windows 어플리케이션에서 plug-in이 가능한 ActiveX 기반 DjVu 문서들은 웹페이지내에 삽입 가능 (JPEG 이미지와 처리하는 것과 같이) 사용자의 요구사항에 맞게 커스터마이즈가 가능한 뷰어 Benefits: 자연스러운 HTML 및 DjVu 부라우징 표준 인터페이스 기술 이용 사용자 요구사항에 맞는 맞춤형 작업이 용이
DjVu Technology 소개 자동 하이퍼링크 Hyperlink Rule Before Hyperlink Inbox Automatic Hyperlink Agent Outbox After Hyperlinked DjVu DjVu 매뉴얼에 하이퍼링크 정보를 자동 으로 삽입 사용자 정의에 의한 패턴 Rule을 기반으로 자동으로 부품번호나 인덱스 번호 추출 부품번호나 인덱스 번호에 대해서 BOM DB와 재고 시스템과 연계된 하이퍼링크 정보 자동 삽입 백그라운드 에이전트로 수행 하이퍼링크 자동 삽입 수행 삽입된 하이퍼링크 수정/변경/확인 기능
DjVu Technology 소개 하이퍼링크 편집 부품 코드나 임의 영역에 하이라이트 컬러 부여 임의의 영역을 정의하고 하이퍼링크 정보 삽입 정사각형/원형/다각형의 하이라이트 영역 설정 기존 하이퍼링크 정보 추가/수정/편집 기능 페이지 추가/삭제/이동 기능 페이지간 하이퍼링크 부여 기능 다른 표준 이미지 포맷으로 export 하는 기능
DjVu Technology 소개 Secure DjVu 기능 Secure DjVu plug-in viewer 제공 불 법 복사나 프린트 방지 사용자 별 권한 부여 Super user authority Save authority Print authority Time expire Text Cut&Paste 방지 Secure DjVu admin command 제공
DjVu Technology 소개 S e - Publishing Secure Bundle DjVu Secure Indirect DjVu Secure Bundle DjVu WebServer (IIS/Apache) CGI/ASP/JSP Page Streaming Server ES Secure Indirect DjVu Secur e Bundl e DjVu Secure Indirect DjVu IE Browser DjVu Plug-in Viewer 6.1 사용자권한 - Print - Save - Time - Cut/Paste 기능 통제
주요 적용 사례
제조업체-제품 매뉴얼 퍼블리싱 스캔 책-본문 검색 Paperless Office 제조업체-PartBook 퍼블리싱 대학교/정부 퍼블리싱 Archiving 금융-스캔 이미징 솔루션 및 BRP Engineering
국내 사례 종이문서 없는 사무실 구현 사이트: http://www.eukor.com 사무실내의 종이문서(계약서,문서,서류) 스캐닝 하여 내용 검색 및 활용을 어플리케이션 Benefits 실제적인 종이 문서 없는 사무실 환경 실현 영문/한글 혼합 종이문서 내용 검색 서비스 고품질의 자동 OCR 텍스트(한글/영어/일어) 추출 EDMS 엔진과 연동 검색엔진과 연동하여 본문 내용 검색 제공 국내 및 해외 직원들간 정보 공유 서비스 실현 제공 S/W DocumentExpress Enterprise (ASIAN OCR버젼) DocumentExpress Professional Edition DjVu 내용검색용 Djvu TextFilter
국내 사례 전자 잡지 온라인 서비스 사이트: http://www.moazine.com 약 200여종의 디지털 잡지 유료 온라인 서비스 및 기사 본문 검색 서비스 Benefits QuarkXpress 파일 포맷 DjVu 압축 변환 고품질의 디지털 잡지 온라인 서비스 실현 대용량 본문 기사 내용 검색 및 기사 단위 검색 서비스 제공 Secure한 유료 컨턴츠 배포 서비스 제공 S/W DocumentExpress Enterprise Page Streaming Server FlipperViewer ebook viewer
국내 사례 전자도서관 원문 검색 서비스 사이트: http://sdl.snu.ac.kr 약 100만 건의 컬러 원문 (고문헌,귀중도서, 미술자료,의학자료,etc) DRM 기능의 DjVu 전용 viewer 개발 Benefits PDF 서비스로 불가능한 것을 DjVu로 대치 저장 장치 약 1/10 절약 Network traffic 최소화로 사용자 응답속도 최대 고품질 및 고화질의 컬러 원문 서비스 제공 제공 S/W TOC Manager DocumentExpress Enterprise with DjVu 서울대학교 DjVu DRM 전용 viewer
국내 사례 전자도서관 원문 검색 서비스 사이트: http://www.bok.or.kr 정보화 자료실에서 소장하고 있는 고문헌 자 료중 귀중본, 희귀본고서 400여권 DRM 기능의 DjVu 전용 viewer 개발 Benefits PDF 서비스로 불가능한 것을 DjVu로 대치 저장 장치 약 1/10 절약 Network traffic 최소화로 사용자 응답속도 최대 고품질 및 고화질의 컬러 원문 서비스 제공 제공 S/W DocumentExpress Enterprise with DjVu 제공 한국은행 DjVu DRM 전용 viewer
국내 사례 고 지적도 원문 제공 민원 서비스 지금까지 보관된 고 지적도를 디지털화 대 민원 서비스로 웹을 통해서 검색 및 프린팅 서비스 Benefits 한 장의 이미지 크기가 웹을 통해서 서비스하기 불가능 정도의 크기인 10M ~ 100M 이미지를 delay 타임 없이 고속으로 퍼블리싱 구현 고효율 압축(약 1/10-1/20 크기)을 통해서 저장 공간 효율화 전용 뷰어 없이도 표준 웹 브라우저를 이용 서비스 Network traffic 최소화로 사용자 응답속도 최대 제공 S/W DocumentExpress Enterprise with DjVu DjVu Express Server
국내 사례 전자도서관 원문 검색 서비스 사이트: http://library.scourt.go.kr/ 대법원 도서관에서 발행 법원사 컬러자료를 웹을 통해서 서비스 Benefits PDF 포맷으로 할 경우 1300 페이지 자료가 약600MB 크기로 웹 서비스 불가 DjVu로 약 1/20 크기로 압축 저장 장치 약 1/20 절약 DjVu 의 페이지 스트리밍 기술로 사용자의 응답속도 1초 미만 고품질 및 고화질의 컬러 원문 서비스 제공 제공 S/W DjVu 변환 용역으로 변환 결과 컨텐츠 제공
국내 사례 서비스 매뉴얼 및 기구전개도 웹 퍼블리싱 서비스 사이트: 삼성전자 : www.samsung.com LG전자 : www.lge.com 전체 PDF 매뉴얼을 DjVu 로 압축 변환 서비스 대 고객 Global 웹 퍼블리싱 서비스 목적 Global A/S 센터에 최신의 수리 매뉴얼 퍼블리싱 모든 제품 매뉴얼 대상 100GB 이상의 PDF 문서 DjVu로 압축 변환 Benefits 고 품질의 온라인 매뉴얼 퍼블리싱 서비스 실현 PDF 보다 1/10 보다 경량화 한 매뉴얼 제공서비스 기구전개도/회로도 문서와 BOM 데이터 연계 Network traffic 최소화로 사용자 응답속도 최대 A/S 센터의 대 고객 서비스 만족도 증대 제공 S/W SPiD/MANUAL 솔루션 제공 모바일 PDA용 Viewer
국내 사례 공작기계 및 엔진 온라인 PartsBook & Manual 퍼블리싱 시스템 사이트: 두산인프라코어(전 대우종합기계) PartsBook을 DjVu컨텐츠로 압축 퍼블리싱 서비스 Global dealer 들에게 up-to-date 한 PartsBook 제공 BOM DB와 연동/CATIA5 CAD 데이터 직접 활용 Benefits 실시간 온라인 PartsBook 퍼블리싱 서비스 실현 각국 언어별 퍼블리시싱 시스템 구현 BOM 데이터와 연계 CATIA5 CAD 데이터 직접 활용 Network traffic 최소화로 사용자 응답속도 최대 웹기반의 호기관리 시스템 실현 제공 S/W SPiD/Parts 솔루션 제공
국내 사례 통합 이미지 관리 시스템을 위한 압축 솔루션 사이트: 삼성화재 청약서/보상이미지/팩스이미지/오피스문서를 위한 통합 압축 솔루션 적용 청약서는 흑백 비손실 압축, 컬러 보상이미지는 10%크기로 압축 기존 TIFF/JPEG/DjVu 를 통일된 하나의 뷰어에서 볼수 있도록 하는 통합 뷰어 제공 Benefits 하나의 통합 뷰어를 통해서 모든 이미지 검색 빠른 이미지 검색 및 뷰잉 실현을 통한 만족도 증대 ROI 극대화 제공 S/W 모든 client 용 DjVu압축기 모듈 PDFtoDjVu 변환기 Office 문서 변환기 통합 뷰어
해외 사례 Publications Warehouse Over I Million pages in Phase 1 Color and B/W scan to web 30,000 D Size Drawings Section 508 Compliant Benefits Small storage requirements Improved web delivery Fast viewing A No-Plug-in viewing option Document Express Express Server
해외 사례 Smart Toolbox Service Vehicle Over 5 Million images and manuals GPRS Connection Laptop 12,000 Service professionals Benefits Improved productivity Improved service quality Lower cost ROI confidential Document Express Encoders Custom Viewer
Parts & service documents & manuals ANTARES Parts Ordering System Network ready manuals Benefits Reduce monthly DVD burning Move to network-only delivery Improve service quality Increase access and accuracy of information to dealers Dealer P&L $440,000 first year savings Document Express Enterprise HPUX encoding software Standard viewer 해외 사례
해외 사례 Pilot Training Manual Ongoing training and reference 360 page, 24MB PDF document Network ready manual Benefits Accurate, up-to-date information Always available Promotes staff productivity Efficient production & storage DjVu Enterprise Custom license Standard Viewer
해외 사례 Newspaper Publishing Drive new revenues for publishers Deliver previous seven days newspapers Hyperlinked keywords and pages for ease of navigation
감사합니다 최흥식 hsikchoi@celartem.com