및디지털라이브러리 인간의보정또는인간의노력없는문자인식 자동번호판인식 그리고 필기인식등으로광범위하게적용되고있다 은마이크로소프트와 에서라이브러리를제공하고있다 마이크로소프트는오피스도큐먼트이미징라이브러리를제공하고있으며 마이크로소프트오피스도큐먼트스캐닝이스캔한문서를편집하는것을도와준

Similar documents
Microsoft Word - src.doc

Microsoft Word - PLC제어응용-2차시.doc

Æí¶÷4-¼Ö·ç¼Çc03ÖÁ¾š

MF3010 MF Driver Installation Guide

Microsoft PowerPoint - chap01-C언어개요.pptx

Microsoft PowerPoint - chap02-C프로그램시작하기.pptx

JDK이클립스

소프트웨어공학 Tutorial #2: StarUML Eun Man Choi

SIGIL 완벽입문

B2B 매뉴얼

Microsoft Word - PowerDic for CowonS9_사용 설명서_ doc

용어사전 PDF

NX1000_Ver1.1

(Microsoft PowerPoint - \301\24613\260\255 - oFusion \276\300 \261\270\274\272)

OM2M 기반의 OHP-M2M 오픈소스설치가이드 2015 년 8 월 경북대학교통신프로토콜연구실 최예찬, 강형우 요약 사물인터넷 (Internet of Things: IoT) 이이슈가되면서다양한사

BMP 파일 처리

DBMS & SQL Server Installation Database Laboratory

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Jun.; 27(6),

Network Security - Wired Sniffing 실습 ICNS Lab. Kyung Hee University

untitled

Contents. Phase Revise Plan --- Phase Synchronize Artifacts --- Phase 2130 Analyze Activity2131. Define Essential Use Cases --- Activity21

특징 찾아보기 열쇠 없이 문을 열 수 있어요! 비밀번호 및 RF카드로도 문을 열 수 있습니다. 또한 비밀번호가 외부인에게 알려질 위험에 대비, 통제번호까지 입력해 둘 수 있어 더욱 안심하고 사용할 수 있습니다. 나만의 비밀번호 및 RF카드를 가질 수 있어요! 다수의 가

consulting

tiawPlot ac 사용방법

SBR-100S User Manual

슬라이드 1

메뉴얼41페이지-2

1

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상

[Blank Page] i

System Recovery 사용자 매뉴얼

N TIME KEEPER

Art & Technology #5: 3D 프린팅 - Art World | 현대자동차

Windows 8에서 BioStar 1 설치하기

서현수

Office 365 사용자 가이드

PowerDic for Cowon S9

Microsoft PowerPoint - 11주차_Android_GoogleMap.ppt [호환 모드]

MVVM 패턴의 이해

Microsoft Word - ntasFrameBuilderInstallGuide2.5.doc

07변성우_ok.hwp

목차 윈도우드라이버 1. 매뉴얼안내 운영체제 (OS) 환경 윈도우드라이버준비 윈도우드라이버설치 Windows XP/Server 2003 에서설치 Serial 또는 Parallel 포트의경우.

윈도우시스템프로그래밍

Microsoft Word - 디오텍_091221_.doc

PowerPoint 프레젠테이션

1

안드로이드기본 11 차시어댑터뷰 1 학습목표 어댑터뷰가무엇인지알수있다. 리스트뷰와스피너를사용하여데이터를출력할수있다. 2 확인해볼까? 3 어댑터뷰 1) 학습하기 어댑터뷰 - 1 -

커알못의 커널 탐방기 이 세상의 모든 커알못을 위해서

Microsoft PowerPoint - es-arduino-lecture-03

기존에 Windchill Program 이 설치된 Home Directory 를 선택해준다. 프로그램설치후설치내역을확인해보면 Adobe Acrobat 6.0 Support 내역을확인할수 있다.

U.Tu System Application DW Service AGENDA 1. 개요 4. 솔루션 모음 1.1. 제안의 배경 및 목적 4.1. 고객정의 DW구축에 필요한 메타정보 생성 1.2. 제품 개요 4.2. 사전 변경 관리 1.3. 제품 특장점 4.3. 부품화형

ISP and CodeVisionAVR C Compiler.hwp

<4D F736F F F696E74202D20B5A5C0CCC5CDBAA3C0CCBDBA5F3130C1D6C2F75F32C2F7BDC32E >

1. What is AX1 AX1 Program은 WIZnet 사의 Hardwired TCP/IP Chip인 iinchip 들의성능평가및 Test를위해제작된 Windows 기반의 PC Program이다. AX1은 Internet을통해 iinchip Evaluation

[Brochure] KOR_TunA

Ver. 2017SE-POS-SRS-3.0 Software Requirement Analysis for Point Of Sale System Project Team Team 6 Date Team Information 김병식 2016

슬라이드 1

Microsoft Word - CPL-TR IETF-ID.doc

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

<4D F736F F D D31312D30312D53572D30312DBBE7BFEBC0DABCB3B8EDBCAD5FBFDCBACEB9E8C6F7BFEB2E646F63>

UI TASK & KEY EVENT

Raspbian 설치 라즈비안 OS (Raspbian OS) 라즈베리파이 3 Model B USB 마우스 USB 키보드 마이크로 SD 카드 마이크로 SD 카드리더기 HDM I 케이블모니터

Microsoft PowerPoint 웹 연동 기술.pptx

<4D F736F F F696E74202D203137C0E55FBFACBDC0B9AEC1A6BCD6B7E7BCC72E707074>

행자부 G4C

Print

var answer = confirm(" 확인이나취소를누르세요."); // 확인창은사용자의의사를묻는데사용합니다. if(answer == true){ document.write(" 확인을눌렀습니다."); else { document.write(" 취소를눌렀습니다.");

메일서버등록제(SPF) 인증기능적용안내서 (Exchange Windows 2000) OS Mail Server SPF 적용모듈 작성기준 Windows Server 2000 Exchange Server 2003 GFI MailEssentials 14 for

Microsoft PowerPoint SDK설치.HelloAndroid(1.5h).pptx

Microsoft PowerPoint - 안드로이드 개발 환경 구축(170411)

문서관리시스템 (Document Management System) 사용자매뉴얼

Visual Basic 반복문

SQL Developer Connect to TimesTen 유니원아이앤씨 DB 기술지원팀 2010 년 07 월 28 일 문서정보 프로젝트명 SQL Developer Connect to TimesTen 서브시스템명 버전 1.0 문서명 작성일 작성자

다른 JSP 페이지호출 forward() 메서드 - 하나의 JSP 페이지실행이끝나고다른 JSP 페이지를호출할때사용한다. 예 ) <% RequestDispatcher dispatcher = request.getrequestdispatcher(" 실행할페이지.jsp");

MF5900 Series MF Driver Installation Guide

PowerPoint Presentation

쏘니표지

161117_EX Phone stick_manual


PHP & ASP

wtu05_ÃÖÁ¾

Data Sync Manager(DSM) Example Guide Data Sync Manager (DSM) Example Guide DSM Copyright 2003 Ari System, Inc. All Rights reserved. Data Sync Manager

EEAP - Proposal Template

카택스 비즈 관리자용 사용설명서 목차 사용 전에 시작하기 사용하기 설정하기 알아두기 훑어보기 차량 관리 운행내역 조회 부관리자 설정 자주묻는 질문 회원가입 사용자 관리 운행구간 조회 앱 권한 설정 GPS 오류 요인 부서 관리 운행일지 다운로드

임베디드시스템설계강의자료 6 system call 2/2 (2014 년도 1 학기 ) 김영진 아주대학교전자공학과

PowerPoint 프레젠테이션

arcplan Enterprise 6 Charting Facelifts

Microsoft PowerPoint Android-SDK설치.HelloAndroid(1.0h).pptx

Studuino소프트웨어 설치

[로플랫]표준상품소개서_(1.042)

사용설명서를 읽기 전에 안드로이드(Android)용 아이디스 모바일은 네트워크 연결을 통해 안드로이드 플랫폼 기반의 모바일 기기에서 장치 (DVR, NVR, 네트워크 비디오 서버, 네트워크 카메라) 에 접속하여 원격으로 영상을 감시할 수 있는 프로그램입니다. 장치의 사

DBPIA-NURIMEDIA

2 Journal of Disaster Prevention

MF Driver Installation Guide

52 l /08

SAS9.2_SAS_Enterprise_Miner_install_guide_single_user_v2

Microsoft PowerPoint - Java7.pptx

오토10. 8/9월호 내지8/5

vRealize Automation용 VMware Remote Console - VMware

Transcription:

김남규, 김동언, 김성우, 권순각 Nam-Gyu Kim, Dong-Eon Kim, Seong-Woo Kim, Soon-Kak Kwon 1. 서론어학학습을위해단어정리는필요하고 모르는단어의검색을위해서는다양한종이단어장 단어장어플리케이션 사전 인터넷검색등이사용되고있다 그러나 일반적으로이러한도구들은미리저장되어있는단어를학습해야하거나 학습할단어목록을만들기위해서단어마다키패드입력을통한사전검색을수행하고 종이사전을찾아서정리를해야하는단점이있다 이를해결하기위해서는문서로부터단어를인식하면 검색을위한준비및실행시간을줄일수있을 것이다 문서인식은전단계로광학문자인식이필요하다 광학문자인식 은출력된문서및이미지를스캐닝을통해한글 영문 숫자폰트에대해편집가능한텍스트로변환하고저장할수있게해주는기술이다 의역사는 년에독일의 가미리준비된몇개의표준패턴문자와입력문자를비교하여표준패턴문자와가장유사한것을해당문자로선정하는패턴매칭기법을이용한문자인식방법을특허로등록하면서시작되었다 은매우다양한분야에응용되고있으며 뱅킹 의료산업 보안문자와같은법적산업 저장소

및디지털라이브러리 인간의보정또는인간의노력없는문자인식 자동번호판인식 그리고 필기인식등으로광범위하게적용되고있다 은마이크로소프트와 에서라이브러리를제공하고있다 마이크로소프트는오피스도큐먼트이미징라이브러리를제공하고있으며 마이크로소프트오피스도큐먼트스캐닝이스캔한문서를편집하는것을도와준다 는 오픈소스 엔진을개발하였으며 는기본적으로 라이브러리를제공하고있지만자바라이브러리로 안드로이드라이브러리로는 도같이제공해주고있다 는출력파일의형식이존재하지않으므로출력파일을생성하기위한단계는존재하지않는다 이러한문자인식기술은글자를정확하게인식하는정도를나타내는인식률과인식을위한인식시간이중요한요인이다 본논문에서는문서를촬영하면소프트웨어가자동적으로문서내단어를인식하고 단어와단어의뜻을정리하여단어장으로만들어단어학습을도와주는방법을제안한다 제안한방법을통해문자인식기능을이용하고단어정리를수행하면단어검색을위한시간단축이가능하여단어학습시간을절약할수있을것이다 제안한방법은문자인식을위해서는 기법을사용하고 사전소프트웨어 의사전데이터를사용하며 안드로이드플랫폼으로구현한다 이러한방법을통하여스마트폰촬영을통한단어정리및편집 이분법을사용한사전데이터탐색 음성합성을이용한발음듣기 데이터베이스에저장하여단어장구축및편집의기능을제공한다 본논문은영어단어를정리하는어플리케이션으로구현하였지만 그외다양한언어도동일하게적용이가능할것으로기대된다 2. TESSERACT OCR 오픈소스 엔진인 은 에서개발하였으며 개발이후지속저인성능개선을통해 년에오픈소스로발표되었다 현재는구글이 의일부를지원하고있다 의작동과정은 과같다 첫째 이 Fig. 1. Flow of Tesseract processing. 미지의임계값을이용하여입력이미지를이진화한다 둘째 이진화한이미지의연결된구성요소를분석하여각구성요소의외곽선을추출하고 이를이진데이터로저장한다 셋째 텍스트라인 을분석하여구성요소를체계화한뒤 문자의자간에따라단어단위로나눈다 마지막으로 단어단위로나뉜요소를단어단위와페이지단위로인식한다 는출력파일의형식이존재하지않으므로출력파일을생성하기위한단계는존재하지않는다 는조명 각도 폰트모양에따라인식률이저하될수있다 라이브러리는바이너리파일을통해바로설치를할수있으며 바이너리를통해설치할경우환경변수를자동으로설정해주고관련라이브러리및언어팩을자동으로다운로드및설치를수행한다 설치가완료되었다면 라이브러리는빌드를통해생성하며 를통해 설치경로의파일을열수있다 그리고솔루션구성을 중에서필요에따라프로젝트설정을수행해주면된다

3. 제안된단어정리방법본논문에서제안하고있는방법의개요와시스템의구성에대해설명하고 단어를정리하고사전데이터를연결하기위한핵심원리인이분법과부가적인기능들을설명한다 카메라로문서를촬영하면소프트웨어가자동적으로문서내단어를인식하여인식순서에따라단어를표시시켜주고사용자가단어장에추가및편집이가능하게해준다 3.1 시스템구조 는제안하는방법에서사용자가상호작용하는시스템의흐름을나타낸다 사용자는문서의단어를정리하기위해카메라로촬영하면시스템에서단어를분석하고단어목록을출력해준다 사용자는시스템이출력한단어리스트를편집하여단어장으로데이터베이스에저장할수있고 단어장을데이터베이스에서조회할수있다 사용자가단어의정보를요청하면시스템은사전데이터에서단어와일치하는정보를조회하여출력해준다 3.2 주요기능제안한방법의주요기능구현과작동원리에대하여설명한다 단어정리문자인식으로저장된텍스트파일을읽어들여공백과특수문자를없애면서구분하고나머지구분한 문자를저장하여화면에보이도록리스트뷰에출력하고 단어수정과삭제또는사전에등록되지않은단어를모두제거할수있고 필터를통해원하는문자열을추려낼수있다 그리고리스트뷰에출력한단어들중사전에등록된단어의비율을확인할수있는데이것은사용자가단어를얼마만큼수정해야되는지 또는인식이잘되었는지확인할수있는지표가된다 단어사전검색오픈소스사전인 의사전파일을활용 이분법 을이용해검색하고자하는단어의위치를빠르게찾아내고임의접근하여단어의정보를찾도록수행한다 위의사전에등록되지않은단어를모두제거하는기능도이분법을사용해서사전에서데이터를찾지못하면제거하도록수행한다 은이분법은나타낸다 이분법은구하고자하는근이존재하는일정구간을반으로이분한후두개의구간중에서근이존재하지않는구간은버리고존재하는구간은또반으로이분하여존재하지않는구간을버리는방법을계속 번을시행하면점점구하고자하는근에다가가게되는원리이다 이분법을사용하면약 만회이상읽어야될것을 회내외로줄일수있다 단어장구축단어리스트를편집하고단어장으로저장할수있게한다 안드로이드에서제공하는 를사용하고 단어장을저장할때테이블을생성하여저장한 Fig. 2. Schematic diagram of the proposed system. Fig. 3. Searching process of word in the dictionary.

Fig. 4. Start scene of proposed application. 다 는 나 와같은데이터베이스관리시스템이지만 서버가아니라응용프로그램에넣어사용하는비교적가벼운데이터베이스이다 음성합성음성합성은안드로이드플랫폼을위해제공해주는 를사용한다 4. 모의실험및결과제안된단어정리방법에대해안드로이드스마트폰에서구동되는어플리케이션을구현한다 그림은영어단어정리를구현한어플리케이션의시작화면을나타낸다 처음애플리케이션을시작하면시작화면에서카메라촬영을수행할지데이터베이스에저장된단어장을조회할지사용자가선택을하게된다 카메라촬영을선택할경우영어문서촬영후단어정리를수행하게되고 단어장미리보기를선택할경우단어장의내용을확인한다음단어장을열어볼수있다 단어인식버튼을클릭하면 카메라로문서를촬영한다는모의실험에사용한 용지영어문서를나타낸다 스마트폰액정의넓이가한정되어있기때문에카메라로한번에촬영가능한면적은제한적이다 삼성갤럭시 기종을기준으로한번에 의테두리만큼촬영이가능하다 인식에성공한단어는 에표시하였다 인식된단어는새로운파일의이름으로단어장을만들고과같이화면을구성하고표시해준다 단어장에서사용자가알고있는단어는삭제할수 Fig. 5. Example of English document. Fig. 6. Captured area for one scene. 있으며 발음버튼을클릭하면영어발음을들을수있다 또한 현재문서인식의환경이좋지않아문서인식율이떨어졌다고판단될경우에는사용자가

Fig. 7. Detected words after recognition. Fig. 8. Vocabulary display. 버튼을클릭하면이전촬영단계로돌아갈수있다 인식율은조명 촬영거리 문서의기울기등에따라영향을받으므로현재보다인식율을높이기위해서는조도를높이든지 촬영거리를줄여주면된다 만약인식되지않는단어는추가버튼을클릭하여단어장에추가할수있다 단어장 이름으로단어장이만들어진경우에 에서단어장버튼을클릭하면 와같이단어장목록을볼수있다 원하는단어장을선택하고열기버튼을클릭하면 와같이단어장을열어정리되어있는단어를볼수있다 또한 목록에있는단어장을삭제할경우에는이름을선택하고삭제버튼을클릭하면된다 다양한실험환경에대해단어인식율을조사하였다 사용자가책을읽을수있는밝은조명에서는구름없는햇빛에서와같이인식율이같았으며 촬영거리는 에서과같이 용지의 크기이상을촬영하면 단어의인식율이떨어지지만 그이하를촬영하면인식율에는영향이없었다 문자의기울기에대한인식율은 에나타낸다 조명과거리에는인식율이영향을미치지않는조건에서기울기만을조정하였다 문서에서전체단어수는 개였으 Fig. 9. Vocabulary utilities, (a) Preview, (b) Open. Table 1. Recognition rate according to tilt 며 기울기가 인경우에는 개로거의모든단어를 인식하였지만 기울기가커질수록인식율이떨어짐 을알수있다 특히 도이상기울어지면단어의 인식율이많이떨어지므로단어장을만들기위해서 는문서에서단어와카메라기울기가어긋나지않도 록촬영하는것이필요하다 이를위해서는문서촬 영이시작될경우에 촬영되는화면에올바른방향으 로적색의직선을표시해주며 인식되는문서의단 어들의방향과직선의방향이같도록카메라방향을 조정하면기울기가어긋나지않게된다

5. 결론본논문에서는언어단어장을정리하는방법을제안하고 안드로이드계열스마트폰어플리케이션으로영어단어장을정리하는시스템을구현하였다 실험결과사용자가촬영환경 조명 기울기 을적절하게설정하여사용하면대부분의영어단어를인식할수있었고 소수의인식하지못한단어는편집하거나추가할수있도록구현하였다 스마트폰으로언제어디서나사용할수있는인터페이스로구성되어있기때문에사용자는영어를효과적으로학습할수있을것으로기대되며 현재특허출원 중으로서영어이외의언어에도확장적용함으로써다양한언어로상업화도가능할것으로기대된다 REFERENCE

년 월한국과학기술원졸업 년 월포항공과대학교전자계산학석사 년 월포항공과대학교컴퓨터공학과박사 년 월 년 월 연구소 일본 연구원 년 월 년 월포항공과대학교정보통신연구소연구원 년 월 년 월 중앙연구소선임연구원 년 월 현재동의대학교게임공학과조교수관심분야 인간과컴퓨터상호작용 컴퓨터비전 가상현실 년 월 전기및전자공학과졸업 년 월 전기및전자공학과석사 년 월 전기및전자공학과박사 년 월 년 월한국전자통신연구원선임연구원 년 월 년 월 방문교수 년 월 현재동의대학교컴퓨터소프트웨어공학과교수관심분야 임베디드소프트웨어 사물인터넷 년 월 현재동의대학교컴퓨터소프트웨어공학과학부과정관심분야 사물인터넷 영상인식 년 월경북대학교전자공학과졸업 년 월 전기및전자공학과석사 년 월 전기및전자공학과박사 년 월 년 월한국전자통신연구원연구원 년 월 년 월기술보증기금기술평가센터팀장 년 월 년 월 방문교수 년 월 년 월 방문교수 년 월 현재동의대학교컴퓨터소프트웨어공학과교수관심분야 멀티미디어신호처리 영상통신