온누리한글의유니코드 (Unicode) 적용방안연구 일시 : 00 년 0 월 일목요일, 한글날오후 시 장소 : 충남대학교인문대학문원강당 발표자 : 사이트관리자, 양정수 ( 들풀 ), yangjeongsoo@gmail.com,, 00,, 6
목차 문자집합과인코딩, 유니코드 한글코드표준의역사 유니코드와한글 한글 : 폰트파일과글자모양 한글 : 입력방식 (Input Automata 예 : 천지인 ) 온누리한글의세계화 (?) 와관련된몇가지이슈
문자집합 (Charset) 및인코딩 (Encoding), 유니코드 (Unicode) 문자집합 (Character Set, Charset) 특정언어를표현하기위해사용되는문자들의집합 인코딩 (Encoding) 특정한문자집합들내의문자를컴퓨터에서사용하기위한숫자로변환하는방법 유니코드란? 전세계에서사용되는문자집합을정의한것으로 00 년 월 일현재 Unicode. 의정의에의해약 00,000 문자이상을포함하고있음. 해당문자집합을표현하기위한인코딩방법으로, UTF-, UTF-6, UTF- 를사용함. UTF- : Byte ~ Byte 의가변길이로유니코드상의문자를표현함. UTF-6 : Byte 또는 Bypte 의가변길이로유니코드상의문자를표현함. UTF- : Byte 고정길이로유니코드상의문자를표현함.
한글문자인코딩의역사 구분 KSC 60 KSC KSC 60 KSC 6 KSC 60 KSC 6 KSC 60 KSC 00 제 / 개정년도 내용초 () 중 () 종 () : 한글자모 자기능문자 6자, 로마문자 6자, 보조부호계한자,00자..일폐지, KSC 60에흡수자음 (0), 모음 () : 한글자모 자기능문자 자, 도형문자 ( 기호 :, 숫자 :0, 로마문자 :) 한글,6자, 한자,6자한글,0자, 한자,자 ISO 0( 완성형 ) 규격에부합한글,0자, 고어,6자, 한자 6자, 기타,0자 KSC 60 규격의확장초 () 중 () 종 () : 한글자모 6자 KSC 60- 과공동표준한글,자, 한글자모 0자, KSC 60의 자모 ISI 066- 수용 보다자세한내용을원하시면아래의 URL 의문서를참고하시면좋을듯합니다. http://register.itfind.or.kr/report0/000/iita/iita-006/iita-006.pdf
유니코드 (Unicode) 와한글 http://www.unicode.org/public/unidata/blocks.txt 내에정의되어있는한글영역은아래와같음. 코드영역 00 ~ FF 0 ~ F AC00 ~ DAF FF00 ~ FFEF E000 ~ FFF F0000 ~ FFFFF 00000 ~ 0FFFF 설명 Hangul Jamo 초성 (0개) / 중성 (66개) / 종성 (개) : 0 자모조합가능한한글의총글자수 : 0 x 66 x (+{ 종성없음 }) =,00자 Hangul Compatibility Jamo 한글자모만별도로입력할때사용되는영역 Hangul Syllables 한글완성형,자에대한정의영역 Halfwidth and Fullwidth Forms 한글반각자모 Private Use Area (6,00자까지사용가능 ) 한글폰트새굴림체에서일부고어를이영역을통해사용함. http:///s/hangul/old_han.html Supplementary Private Use Area-A (6,자까지사용가능 ) Supplementary Private Use Area-B (6,자까지사용가능 )
한글 : 폰트파일 (Font File) 과글자모양 (Glyph) 아래의그림은화살표연결방향순서로, 폰트파일 / Glyph / Glyph 내곡선표현법에대한기초상식임. 6
한글 : 입력방식 (Input Automata : 예 - 천지인초성, ㅃ ) 초성상태변환단계 : ㅂ ㅍ ㅃ q0 6 0 6 ㄱ 0 ㄱ 6 ㄲ ㄴ ㄷ ㄸ ㄹ ㅁ ㅂㅃㅅㅆ ㅇ ㅈ ㅉ ㅊ ㅋ ㅌ ㅍ ㅎ ㄴ 6 ㄷ ㅂ ㅅ 0 0 ㅈ ㅇ
한글 : 입력방식 (Input Automata : 예 - 천지인중성, ㅑ ) 중성상태변환단계 : ㅣ ㅏ ㅑ q0 6 0 6 0 0 ㆍ ㆍㆍ ㅏ ㅐ ㅑ ㅒ ㅓ ㅔ ㅕ ㅖ ㅗ ㅘ ㅙ ㅚ ㅛ ㅜ 0 ㅝ ㅞ ㅟ ㅠ 6 ㅡ 6 ㅢ ㅣ 천 ( ㆍ ) ㆍ ㆍㆍ ㆍ ㅑ ㅏ ㅘ ㅠ ㅜ ㅜ ㅏ 지 ( ㅡ ) ㅡ ㅗ ㅛ 6 0 인 ( ㅣ ) ti ㅣ ㅓ ㅕ ㅐ ㅒ ㅔ ㅖ ㅚㅙ q0 ㅟ ㅞ ㅝ ㅢ bs f ti : Timer Interval bs : back space f: delete previous char others : input char state 그대로반영
한글 : 입력방식 (Input Automata : 예 - 천지인종성, ㄻ ) 종성상태변환단계 : ㄴ ㄹ ㄹ ( ㅇ ) ㄻ q0 6 0 6 0 6 0 ㄱ ㄱ ㄲ ㄳ ㄴ ㄵ ㄶ ㄷ ㄹ ㄺ ㄻ ㄼ ㄽ ㄾ ㄿ ㅀ ㅁ ㅂ 0 ㅄ ㅎ x/ ㄸ x/ ㅃ ㄱ / ㅎ ㄱ / ㅆ ㄴ / ㅅ ㄴ / ㅊ ㄴ / ㅉ ㄹ / ㅋ 6 ㄹ / ㄲ ㄹ / ㅃ ㄹ / ㅆ ㅂ / ㅎ ㅂ / ㅆ x/ ㅉ ㄹ / ㅇ ㄹ / ㄷ ㄹ / ㄸ ㄴ / ㅆ ㄴ 생 ㄷ 략 ㅂ 6 ㅅ 0 0 6 0 ㅈ ㅇ 0
온누리한글의세계화 (?) 와관련된몇가지이슈 이슈 ) 세계표준인 Unicode에온누리한글에서정의한문자집합을표현할방법은무엇인가? 유니코스상에서온누리한글에대한영역을확보하는것은전혀불가능하다고는할수는없으나, 단기적으로는불가능할것으로보임. 그러므로가급적기존의 Unicode 한글영역및 Private 영역을활용하는것이최선의방식으로보임. 이슈 ) 온누리한글에서정의한문자집합에포함된글자모양을가진폰트파일제작은가능한가? 이슈 ) 과관련하여 Unicode 상에서온누리한글코드영역을확보하는것이어려울경우, 해법은한글자모의확장 + 온누리한글을위한인코딩방식 (?) + 온누리한글전용폰트가결합된구조에서나올수있을것으로보임. 이경우, 온누리한글전용폰트제작방법이요구됨. 이슈 ) 온누리한글의입력을위한입력환경제공은가능한가? 이슈 ) 과이슈 ) 가해결되었다하더라도, 온누리한글입력기제작을위한온누리한글입력 Automata 에대한정의가필요함. 0
온누리한글의세계화 (?) 와관련 : 이슈 ) 참고 현재의완성형한글구성에사용된한글자모 초 () x 중 () x 종 ( + { 종성없음 }) =, 자 Unicode 한글자모영역에등록된한글자모 초 (0) x 중 (66) x 종 ( + { 종성없음 }) =,00 자 Unicode 상의한글자모추가지정가능수 초성 : 자, 중성 : 자, 종성 6 자 온누리한글에서요구되는한글자모에대한정리가요구됨.
온누리한글의세계화 (?) 와관련 : 이슈 ) 참고 코드영역 00 ~ FF 0 ~ F AC00 ~ DAF FF00 ~ FFEF E000 ~ FFF F0000 ~ FFFFF 00000 ~ 0FFFF 설명 Hangul Syllables 한글완성형, 자정의영역 Private Use Area (6,00 자까지사용가능 ) Supplementary Private Use Area-A (6, 자까지사용가능 ) Supplementary Private Use Area-B (6, 자까지사용가능 ) 만약, 온누리한글에서신규로요구되는한글 ( 즉, 기존의, 자이외의한글 ) 이 6,00 자미만이라면, 좌측유니코드 번코드영역을활용하는것이가장바람직할것으로생각됨. 추가로요구되는글자수가더필요로하다면, 좌측유니코드 번및 번코드영역도사용해볼수있을것으로보임. 물론 번과 번영역의합계인, 0,000 여자로국한되어야할것으로보임. 만약 6,00 + 0,000 여문자이상의수가요구된다면, 새로운방법이요구될것임. 왜냐하면, Unicode 에서한글을위해그와같이많은영역을할당해줄가능성이없을것임. 위에서보여지고있는 한글조합형벡터폰트 란글자는, 개별글자를벡터폰트로제작한방식이아니라, 한글자모만을벡터기반으로제작한후, 자모의결합구조를수학적으로계산한방식임. 이방식이, 온누리한글에적합한폰트제작방식일수도있음. 위와같은방식으로온누리한글을위한코드영역을할당하였다고하더라도, 해당글자의모양 (Glyph) 을포함하는폰트를제작하지않는다면, 실질적으로사용할수있는방법이존재하지않음. 폰트제작방법은, 해당글자의모든모양을앞서서예시로보여주었던 가 자와같이컴퓨터그래픽을통해제작하여야함.
온누리한글의세계화 (?) 와관련 : 이슈 ) 참고 앞선이슈, 이슈 를해결했다고하더라도, 온누리한글을효과적으로사용하기위해서는적절한입력방식이요구될것임. 기본적으로는일반데스크탑키보드와휴대폰의키패드정도의입력구조를지원하는것이바람직할것임. 해당입력을지원하기위한 Input Automata 는이장에서다루기에는아직부족한상황이나꼭필요한항목임에는틀림없음. 더불어, 온누리한글에서한글고어중어떤자모를복원할것인가를선택함에있어서 Input Automata 를고려할수있다면, 보다편리한입력기를만들수도있을것으로보임.