Size: px
Start display at page:

Download ""

Transcription

1 국립국어원 국어기초어휘선정및 어휘등급화를위한기초연구 연구책임자 : 이삼형

2

3 제출문 국립국어원장귀하 국립국어원과체결한연구용역계약에따라 국어기초어휘선정및어 휘등급화를위한기초연구 에관한연구보고서를작성하여제출합니다. 사업기간 : 2017 년 5 월 ~ 2017 년 12 월 2017 년 12 월 20 일 연구책임자 : 이삼형 ( 한양대학교 ) 연구기관 한양대학교산학협력단 연구책임자 이삼형 공동연구원박진호, 최형용, 김정선, 신명선 신동광, 강남욱, 이기연, 김시정 연구보조원 김수지 보조원이윤희, 양세문

4

5 요약문 1. 과업명 : 국어기초어휘선정및어휘등급화를위한기초연구 2. 과업의목적본연구는기초어휘와등급화에대한제반이론을검토하고, 기구축말뭉치및어휘목록사례를검토하여이론적기반을마련한다. 그리고말뭉치에기반한기초어휘선정및등급화를위한샘플말뭉치를개발, 실증함으로써국어기초어휘선정작업의구체적방안과중장기계획을수립하는데그목적이있다. 3. 과업의배경국어기초어휘선정및어휘등급화를위한기초연구는다음의국가 사회적요구를배경으로하고있다. 첫째, 국민의국어능력발전을위한어휘정비작업의필요성둘째, 말뭉치에기반한체계적기초어휘선정과활용체계개발셋째, 기초어휘평정작업에대한중장기계획수립의필요성 4. 연구내용및방법본연구의내용은다음과같이요약된다. 1) 기초연구 기초어휘, 어휘평정및등급화관련선행연구검토 국내외말뭉치및어휘목록의사례연구 2) 말뭉치구축 장르및시간 / 연대를중심으로한기준마련 말뭉치보완계획수립 3) 기초어휘선정및어휘등급화 말뭉치기반기초어휘목록의추출및검증절차마련 어휘등급화및검증 4) 기초어휘사업의중장기계획수립 중장기계획목표수립 중장기단계설정및실행전략수립 본연구의방법은다음과같이요약된다. 1) 문헌연구국민의어휘능력과어휘평정에관한문헌고찰을통해기초어휘선정과어휘등급화기준설정의토대를마련한다.

6 2) 사례연구국내외말뭉치및어휘목록의사례를수집하여말뭉치설계방법과어휘목록추출방법수립에활용한다. 3) 조사연구형태소분석기에서나타나는추출어휘의오류패턴을조사하여연구의정밀성을높인다. 4) 전문가자문연구결과물로서의샘플말뭉치및어휘선정기준에대한실험과정, 어휘등급의기준및방향등을각계전문가와검토함으로써연구의타당도를제고한다. 5. 연구결과본연구의결과를정리하면다음과같다. 첫째, 기초어휘의개념을정립하고어휘평정및등급화의이론적토대를마련하였다. 기초어휘, 어휘평정, 어휘등급과관련된선행연구와국내외말뭉치및어휘목록사례를검토함으로써추후수행될기초어휘선정및어휘등급화연구의실효적방법론을수립하기위한제반이론을확충하였다. 둘째, 기초어휘선정및어휘등급화를위한샘플말뭉치를구축하고검증및어휘목록추출절차를실증함으로써말뭉치보완계획을수립하였다. 등급화대상어휘목록을추출하기위해서는대규모말뭉치가필요하므로인터넷을통해대량의실제언어자료를수집하고형태소분석기를사용하여가공하는등말뭉치의구축및보완방법론을제시하였다. 셋째, 기초어휘선정및어휘등급화의절차를수립하였다. 먼저 1등급기초어휘선정절차는대규모말뭉치로부터정선된균형말뭉치로부터양적방법과질적방법을상호보완적으로사용하여어휘목록을추출하고이를검증하는순으로이루어진다. 그리고 2등급이상기초어휘의등급화는대규모말뭉치로부터추출된어휘목록을 교육용도서와의비교, 어휘능력검사, 전문가자문 등의방법을통해검증, 보완함으로써최종어휘목록을산출한다. 넷째, 기초어휘선정및어휘등급화사업의중장기계획을수립하였다. 본연구의연구결과에따라대규모말뭉치와어휘목록을회귀적으로검토한다. 구체적으로 어휘목록을제시하는토대확보단계, 추출된어휘목록과등급화방법을검증하고정교화하는발전및확장단계, 그리고만들어진어휘목록을지속적으로관리 보완하고전국민이활용할수있는체계를마련하는지속발전가능단계 의순서로사업을심화, 확장할수있도록중 장기발전계획을제시하였다. 6. 결과물 : 최종보고서 50 부, 시디 (CD) 10 매

7 Abstract 1. Task Title: Basic Research for Lexical Grading and Selection of Basic Vocabulary in Korean 2. Purpose of Task: This study desires to build the theoretical foundation and establish the relevance and working plan for basic vocabulary selection by demonstrating sample corpus for selection and grading of basic vocabulary based on corpus. Also, this research not only develops all sorts of theories about basic vocabulary and grading, but also examines corpus and vocabulary list cases that have been established in the past. 3. Background of Task: Necessities of the basic research for lexical grading and selection of basic vocabulary in Korean are as follows: First, it requires maintenance work on the vocabularies for the whole people. Second, it is necessary to select basic vocabularies based on corpus. Third, it needs a medium and long term plan for rating basic vocabularies. 4. Study Contents and Methods Study contents of Basic Research for Lexical Grading and Selection of Basic Vocabulary in Korean are as follows: 1) Fundamental research - Review of preceding studies on basic vocabulary, lexical rating and grading - Case study for corpora and vacabulary lists at domestic and foreign language. 2) Construction of a corpus - Consideration of genre and time / era - Supplement plan for corpus 3) Lexical grading and selection of basic vocabularies - Extraction and verification procedures of a corpus-based basic vocabulary list - Lexical grading and verification procedures 4) Establishment for long term plan of this basic vocabulary project - Goal setting for long term plan - Construction of phase settings and execution strategy during long term

8 Study methods of Basic Research for Lexical Grading and Selection of Basic Vocabulary in Korean are as follows: 1) Reference Study It provides the foundation of the basic vocabulary selection and the setting criteria for vocabulary grading through literature reviews on the vocabulary ability and lexical rating of the people. 2) Case Study It examines the methods for the corpus design and the extraction of lexical list by collecting examples of corpus and vocabulary lists at domestic and foreign language. 3) Survey Study It investigates the error patterns of corpus-based lexical extraction using morpheme analyzer and reinforces the accuracy of this study. 4) Experts Advice It enhances the validity of this study by examining the sample corpus as a research result, the experiment process on the vocabulary selection criteria, and the criteria and direction of the vocabulary class with experts from various fields. 5. Research Finding: The results of this study are as follows: First, this study established the concept of basic vocabulary and provided the theoretical foundation of lexical rating and grading. Moreover, it expanded all sorts of theories to establish the effective methodology of lexical grading research and the basic vocabulary selection to be carried out, by examining not only the preceding studies related to the basic vocabulary, the vocabulary rating, and the vocabulary class, but also the example of the vocabulary lists and the corpora of the domestic and foreign language Second, this study constructed a sample corpus for basic vocabulary selection and lexical grading, and established supplementary planning about a corpus by demonstrating and verifying extraction procedures for vocabulary list. In this study, a large corpus is required to extract the list of appropriate vocabulary for grading. Therefore, it collected a large number of actual language data through the Internet and produced the data using a morphological analyzer. Through this process, this study suggested a methodology for constructing and supplementing corpus. Third, this study established the procedures for basic vocabulary selection and lexical grading. First of all, it took the selection procedure about the first grade basic vocabulary, according to the order of extracting large corpus from the vocabulary list and verifying it, by making complementary uses of quantitative and qualitative method. In order to grade the basic vocabulary more than grade 2, the vocabulary list extracted from the large corpus is repeatedly verified through

9 comparison with educational books, vocabulary ability test, expert advice, etc., and the final list is produced. Fourth, this study has established a long term plan for the selection of basic vocabulary and lexical grading project. There are three phases in this plan. Based on the results of this study, the first step is to establish a basis for presenting the vocabulary list by recursively reviewing the large corpus and the vocabulary list, and the second step is development and expansion stage in which verify and refine the extracted vocabulary list and grading methods. Lastly, this plan suggested the road-map to deepen and expand the project in \order of sustainable development that establishes a system that can be utilized by the whole people and continuously manage the list of vocabulary created. 6. Output: 50 final reports, 10 CDs including final reports

10 목차 Ⅰ. 서론 1 1. 연구의목적과필요성 연구의목적 연구의필요성 2 2. 연구내용과방법 연구내용 연구방법 7 3. 연구추진과정 연구추진일정 주요협의회내용 10 Ⅱ. 기초연구 이론연구 기초어휘의개념 어휘평정및등급화의개념 말뭉치기반기초어휘선정및등급화방법론 기초어휘및어휘등급과관련된문법적쟁점 사례연구 국내말뭉치및어휘목록 해외말뭉치및어휘목록 48 Ⅲ. 말뭉치구축 장르에대한고려 시간 / 연대에대한고려 말뭉치구축현황 말뭉치보완계획 74 Ⅳ. 기초어휘선정및어휘등급화 말뭉치기반어휘목록의추출 형태소분석 78

11 1.2. 장르별단어빈도, 범위, 산포도추출 세변수사이의관계에대한통계적고찰 변수들에가중치를부여하여단어순위결정 다른어휘목록과의비교 텍스트포괄범위조사 향후과제 어휘등급화절차 등급어휘선정절차 등급이상어휘선정절차 110 Ⅴ. 기초어휘사업의중장기계획수립 중장기계획수립의경위 중장기계획수립 117 Ⅵ. 종합및제언 종합 정책제언 125 참고문헌 127 < 부록 1> 세종태그셋 139 < 부록 2> UTagger 오류패턴 140

12 < 표차례 > < 표 1> 국어교육용어휘목록선정의주요성과 14 < 표 2> 어휘력을구성하는어휘의양 (Nation, 1990: 19) 19 < 표 3> 어휘력의관점에서본어휘의구조 ( 김광해, 2003) 19 < 표 4> 문자및음성언어에서의텍스트포괄범위비교 (Nation, 2006: 79) 20 < 표 5> 산포도공식 ( 신동광, 2011 참조 ) 21 < 표 6> 어휘친숙도측정척도 ( 신동광, 2011) 21 < 표 7> Waring(2000) 의어휘지식측정척도 22 < 표 8> 어휘목록제작시어휘선정기준및적용순서 ( 신동광, 2011: 225) 22 < 표 9> 등급별어휘량의변화 23 < 표 10> 국어말뭉치의목록 29 < 표 11> 국어말뭉치의구성과특징 30 < 표 12> 국내어휘선정연구성과 ( 연도순 ) 33 < 표 13> 등급별어휘의상황 ( 김광해, 2003: 27 수정인용 ) 46 < 표 14> 한국어학습용어휘목록품사별분포 ( 조남호, 2003: 11) 47 < 표 15> Brown Corpus의주제영역및구성단어수 49 < 표 16> BNC의대 ( 大 ) 주제영역및구성단어수 50 < 표 17> BNC 문어자료의세부주제영역및구성단어수 50 < 표 18> COCA 주제영역별단어수 51 < 표 19> BNC-COCA 상위 2,000 단어선정을위한말뭉치구성 52 < 표 20> 2015 영어과교육과정기본어휘목록개발을위한말뭉치구성 53 < 표 21> 말뭉치분석기반영어어휘목록 57 < 표 22> 문자및음성언어에서의텍스트포괄범위비교 (Nation, 2006: 79) 61 < 표 23> 2015 영어과교육과정과목별어휘수 63 < 표 24> 신문말뭉치연도별빈도통계 : 지정사 이다 의경우 67 < 표 25> 말뭉치전체통계 71 < 표 26> 세종말뭉치장르별통계 71 < 표 27> 도서말뭉치장르별통계 72 < 표 28> 잡지말뭉치장르별통계 72 < 표 29> 블로그말뭉치장르별통계 73 < 표 30> 보완말뭉치의구성 76 < 표 31> 검토대상자료 79 < 표 32> 1명의직관에따른등위와가중치부여점수의비교 93 < 표 33> 100 단어목록 1에대한실험결과 95 < 표 34> 100 단어목록 2에대한실험결과 95 < 표 35> 100 단어목록 3에대한실험결과 96 < 표 36> 점수 ( 결정된 weighted sum), 빈도, 범위, 산포도사이의관계 97 < 표 37> < 연세한국어사전 > 표제어와의말뭉치등위비교 101 < 표 38> 텍스트포괄범위 102

13 < 그림차례 > [ 그림 1] 연구개요 1 [ 그림 2] 연구의내용 4 [ 그림 3] 어휘목록의추출및검증절차 6 [ 그림 4] 이해어휘량의발달 ( 玉村文郞編, 1989: 159) 16 [ 그림 5] Dickins의 GSL 예시 57 [ 그림 6] ERF의어휘등급척도 64 [ 그림 7] 순위-빈도그래프 65 [ 그림 8] 연도별빈도최상위 5개단어의절대빈도추이 68 [ 그림 9] 연도별빈도최상위 5개단어의상대빈도추이 68 [ 그림 10] 말뭉치기반어휘목록의추출절차 77 [ 그림 11] 100개장르에서의단어별절대빈도 82 [ 그림 12] 단어별빈도, 범위, 산포도 ( 빈도순소팅결과의첫부분 ) 83 [ 그림 13] 범위 ( 가로축 ) 와산포도 ( 세로축 ) 의관계 ( 청색선 : 회귀곡선 ) 84 [ 그림 14] 빈도 ( 가로축, 로그변환 ) 와산포도 ( 세로축 ) 의관계 ( 청색선 : 회귀곡선 ) 85 [ 그림 15] 범위 ( 가로축 ) 와빈도 ( 세로축, 로그변형 ) 의관계 ( 청색선 : 회귀곡선 ) 87 [ 그림 16] random 100 단어목록 1 89 [ 그림 17] random 100 단어목록 2 90 [ 그림 18] random 100 단어목록 3 91 [ 그림 19] 100 단어목록 1에대한정보통합결과 92 [ 그림 20] 100 단어목록 1에대한 6인이부여한등위통합결과 94 [ 그림 21] weighted sum(=0.2* 빈도 +0.7* 범위 +0.1* 산포도 ) 에따른소팅결과 96 [ 그림 22] 범위와점수 ( 로그변형 ) 의관계 97 [ 그림 23] 산포도와점수 ( 로그변형 ) 의관계 98 [ 그림 24] 빈도 ( 로그변형 ) 와점수 ( 로그변형 ) 의관계 98 [ 그림 25] < 연세한국어사전 > 표제어와말뭉치통계결과의비교 100 [ 그림 26] 기초어휘선정용말뭉치구축후절차 106 [ 그림 27] 선정된기초어휘의검증방향 108 [ 그림 28] 어휘등급화를위한결정요소 110 [ 그림 29] 어휘등급화절차 111 [ 그림 30] 등급별어휘의타당성검토방안 113 [ 그림 31] 기초어휘사업의중장기로드맵 117 [ 그림 32] 단계별발전방향 124

14 Ⅰ. 서론 연구의필요성 국민을위한기초어휘정비작업필요 말뭉치기반기초어휘목록구축필요 어휘평정작업에대한중장기계획수립필요 l 국어기초어휘선정및등급화를위한기초연구 연구목표 기초어휘선정및어휘등급화를위한이론 / 사례연구 기초어휘선정및어휘등급화를위한말뭉치구축설계 기초어휘선정및어휘등급화절차수립 기초어휘사업의중장기계획수립 성과및 활용방안 국민의국어능력발전을위한어휘정비사업 어휘관련사업의기반, 다방면연구의기초자료활용 [ 그림 1] 연구개요 1. 연구의목적및필요성 1.1. 연구의목적 본연구는기초어휘와등급화에대한제반이론을검토하고, 기구축말뭉치및어휘목록사례를검토하여이론적기반을마련한다. 그리고말뭉치에기반한기초어휘선정및등급화를위한샘플말뭉치를실증함으로써기초어휘선정작업의적실성과방안을마련하는데연구의목적이있다. 1

15 국어기초어휘선정및어휘등급화를위한기초연구 1.2. 연구의필요성 1) 국민전체를대상으로한어휘정비작업이필요하다 어휘는지식을습득하고, 사고하며의사소통하는수단으로언어를배우는유아기부터성인에이르기까지국어능력의핵심요소이다. 어휘능력은듣기, 읽기, 말하기쓰기의 4대언어기능을직접적으로지원하므로국민의언어생활에토대가되는능력이다. 기초어휘는의사소통에서가장기본적이고핵심적인어휘로, 국어정책수립의기준이된다. 국민의국어능력향상을위해서는근간이되는어휘능력향상이가장중요한데, 이를측정할수있는기준이되는것도기초어휘이다. 즉기초어휘목록구축은그자체만으로도어휘사용실태를보여준다는측면에서의의가있지만, 나아가교과서및교육자료개발및감수, 국가고사출제, 국민의국어능력평가를비롯한각종기초조사근거로활용될수있다는점에서특히중요하다. 국내의기초어휘는교육적필요성에의해한국어교육에서중점적으로이루어져왔다. 한국어등급별어휘, 한국어학습어휘와같이학습자의요구에부응하는연구성과들이축적되었으나 ( 조남호, 2003; 서상규, 2013), 정작모국어어휘에대한연구는미진한편이다. 이마저도모국어어휘에대한연구는어휘발달이두드러진유아와초등시기에집중되어있어 ( 장현진외, 2014; 김한샘, 2010), 국민전체를대상으로한어휘사용실태, 어휘목록구축등의연구는거의전무한실정이다. 또한기존에수행된연구의성격도기초조사에머물고있어구체적인성과물로나아가지못하였다는점에서국민을위한기초어휘정비작업이필요한시점이라고할수있다. 2) 말뭉치에기반한기초어휘선정이필요하다 말뭉치는언어의본질을연구하기위해기계가독형태로수집한대량의언어자료로, 사전제작또는문법기술의근거를마련하는데주로사용될뿐만아니라, 해당언어의실상을보여준다는점에서어휘정비작업에서도적극적으로활용되고있다. 어휘목록을추출하고등급화하는데에는말뭉치구축이선행되어야하는바, 말뭉치구축은인적, 물적자원이필요한작업이므로, 장기간의연구와구축, 검증등의작업이요구된다. 본연구에서는기초어휘선정과등급화를위해기존말뭉치와최신언어자료등을적극수집, 종합하여말뭉치를재정비한다. 이를위해지금까지구축된국내외말뭉치현황을파악하여기초어휘선정에필요한말뭉치구축방법및사례를살핀뒤, 언어실태를객관적으로보여주는말뭉치의규모와구성비율을설정하여, 말뭉치기반의기초어휘선정이타당하게이루어지도록한다. 2

16 Ⅰ. 서론 3) 기초어휘평정작업에대한중장기계획이필요하다 기초어휘는그중요성과필요성에대해서는일찍부터인식하였지만이에대한장기적인계획없이파편적으로연구들이진행되어왔다 ( 서상규, 2001). 그결과동일한주제의연구가반복될뿐, 구체적자료수집으로이어지지않는등실효성있는결과로나아가지못하였다. 국민의언어생활과관련한정책수립의지표가되는기초어휘연구는대규모말뭉치를기반으로하여언어실태파악, 어휘선정, 어휘등급화등의일련의과정을거쳐야하고국어정보학, 어휘, 국어교육분야의전문가들의협업이필요하다. 이에작업의복합성을고려해, 각과정마다의철저한사전준비와실행, 결과에대한검증이필수적이다. 또한최종결과물이지니는가치를생각할때장기적으로사업을발전, 지속해갈수있는중장기계획이필요하다. 3

17 국어기초어휘선정및어휘등급화를위한기초연구 2. 연구내용과방법 2.1. 연구내용 본연구는다음과같은세부과제로구성되어있다. 1) 기초연구 연구내용 2) 샘플말뭉치구축 3) 기초어휘선정및어휘등급화 4) 기초어휘사업의중장기계획수립 [ 그림 2] 연구내용 1) 기초연구 (1) 기초어휘, 어휘평정및등급화관련선행연구검토 기초어휘의개념과성격, 어휘평정, 어휘등급화의개념, 등급화방법론, 언어학 적쟁점등에대한이론적검토를실시한다. 검토의주요내용은다음과같다. 기초어휘의개념 - 기초어휘의개념범위, 성격 - 기초어휘와기본어휘의관계 어휘평정및등급화의개념 - 어휘평정과등급화의개념구분 - 국어어휘평정의예 등급화방법론 - 어휘등급설정을위한어휘평정기준수립 - 어휘등급의기준수립을위한고려요소 4

18 Ⅰ. 서론 기초어휘및어휘등급과관련한문법적쟁점 - 분석단위설정 - 어휘군의처리 - 어휘군, 상하관계, 유의관계와어휘등급 (2) 국내외말뭉치및어휘목록의사례연구 기존에구축된국내외말뭉치와어휘목록을수집하여성격과규모, 목적등을 분석하여본연구가구축하고자하는말뭉치와어휘목록의개발방향을수립한다. 본연구에서분석한주요내용은다음과같다. 국내말뭉치및어휘목록수집및분석 - 국내말뭉치구축현황 : 구성과특징, 규모 - 어휘목록선정현황 - 등급화사례 해외말뭉치및어휘목록수집및분석 - 해외말뭉치구축현황 : 구성과특징, 규모 - 어휘목록선정현황 - 어휘학습량및어휘등급화단위설정 2) 말뭉치구축 (1) 장르및시간 / 연대를고려한말뭉치구축 말뭉치기반어휘목록추출을위해서는말뭉치구축에있어서도다양한요인을 고려해구축해야한다. 본연구에서는우선적으로 장르와시간 / 연대 를주요고려 요소로파악하여샘플말뭉치를설계하고실증한다. (2) 말뭉치구축현황 등급화된어휘목록추출을위해서는실제언어생활을포착할수있는대규모 말뭉치구축이필요하다. 본연구에서는세종말뭉치를비롯하여기존에구축된말 뭉치를활용해샘플말뭉치를마련한다. 5

19 국어기초어휘선정및어휘등급화를위한기초연구 (3) 말뭉치보완계획 현재구축한샘플말뭉치에나타난문제를파악하여향후사업에서보완할말뭉 치를계획한다. 3) 기초어휘선정및어휘등급화 (1) 말뭉치기반기초어휘목록의추출및검증절차 샘플말뭉치를기반으로기초어휘목록을추출하여검증하는절차는다음과같다. 이러한절차는기초어휘선정및어휘등급화를위한구체적인방법론을적용해본것으로대규모말뭉치를기반으로하여기초어휘를선정하는내년도사업의예비수행의성격을지닌다. 형태소 분석 장르별어휘범위, 빈도, 산포도산출 세변수사이의관계에대한통계적고찰 변수에가중치부여하여어휘순위결정 다른어휘 목록과의 비교 텍스트포괄범위조사 [ 그림 3] 어휘목록의추출및검증절차 (2) 어휘등급화및검증절차 말뭉치기반어휘추출후기초어휘를선정하고이를등급화하여한다. 이때기초어휘의규모와성격등을규정해야하고, 이를위해양적분석단계와질적분석단계를거친다. 선정된기초어휘의검증방향에따라기초어휘를선정하고, 어휘등급화를위한결정요소에따라등급화와이에대한검증절차를진행한다. 6

20 Ⅰ. 서론 4) 기초어휘사업의중장기계획수립 (1) 중장기계획목표수립 국민전체를대상으로하는기초어휘의선정및등급화를목표로하는본사업은중장기적계획하에수행되어야하는특수성을지니고있다. 이에본연구에서는최종목표설정과이에달성하기위한구체적인중장기계획을수립하고자한다. 이는국어기본법, 국어발전기본계획등에입각한기존정책의연속선상에서수립되는계획이다. (2) 중장기단계설정및실행전략수립 중장기계획은 확보단계 발전및확장단계 지속발전가능단계 로구분하여세부목표와과제를설정하고, 이를추진하기위한실행전략을수립한다. 본연구에서제안한실행전략으로는말뭉치구축과업에걸맞은재정규모확보, 기초어휘과업의성격에맞는전문가인력풀구축등이있다 연구방법 본연구는이론적토대마련을위한문헌연구와사례연구, 대규모의말뭉치에 서어휘를추출하기위해활용될형태소분석기에대한조사연구, 연구내용과관 련하여전문가의자문을듣는등의방법으로수행하였다. 1) 문헌연구 국민의어휘능력과어휘평정에관한문헌고찰을통해기초어휘선정과어휘 등급화의기준설정의토대를마련한다. 문헌연구의주요내용을간추리면다음과 같다. 언어학 국어학 : 어휘의유형및구조, 기초어휘와기본어휘, 어휘분석의단위 언어교육 ( 국어교육, 한국어교육, 영어교육 ): 기초어휘선정방법, 어휘선정의기준, 어휘등급화의개념과방법 국어정보학 : 말뭉치구축방법론, 말뭉치기반어휘추출방법 7

21 국어기초어휘선정및어휘등급화를위한기초연구 2) 사례연구 국내외말뭉치및어휘목록의사례를수집하여말뭉치설계방법과어휘목록 추출방법을검토한다. 국어기구축말뭉치현황분석 국어교육과한국어교육분야에서의어휘목록 영어교육에서의말뭉치구축현황과기초어휘목록 3) 조사연구 본연구에서는말뭉치를기반으로어휘를추출하여형태소분석작업을거쳐어휘의빈도를조사한다. 대규모어휘분석을위해형태소분석기 (U-tagger) 를사용하는데이때일정비율의오류가출현한다. 본연구에서는형태분석결과의오류를수정하기위해오류패턴을조사하여정리함으로써기초어휘선정작업에활용하도록하였다. 조사개요는다음과같다. 조사내용 : 형태소분석기를활용한말뭉치기반추출어휘의오류패턴 조사방법 : 직접조사 ( 말뭉치자료수집 형태소태그부착 분석 패턴화 ) 조사규모 : 약 16,000 어절 ( 한파일당 2,000 어절씩, 문어 5 개파일, 구어 3 개파일 ) 4) 전문가자문 본연구에서는국어정보학, 어휘등급화등의관련전문가를초빙하여연구의타 당도를제고하였다. 전문가 : 김일환 ( 고려대 ), 김한샘 ( 연세대 ), 최운호 ( 목포대 ), 송영빈 ( 이화여대 ) 검토내용 : 최종보고서세부내용검토 검토기간 : 2017 년 11 월 28 일 ( 화 )~2017 년 12 월 7 일 ( 목 ) (10 일 ) 8

22 Ⅰ. 서론 3. 연구추진과정 3.1. 연구추진일정 단계수립 계획수립 세부연구내용 전체진행계획확정 분과별업무분담 월 기초연구 선행연구검토 기초어휘의개념과유형정립 말뭉치성격및범위설정 말뭉치구축 방법론수립 말뭉치구축및관리방법론수립 전문가자문 분석단위설정및검토 어휘평정 기초어휘선정기준마련 전문가자문 원시말뭉치구축 샘플말뭉치 구축 주석말뭉치구축 어휘추출및평정작업 중장기계획 설계 종합 중장기계획목표수립 세부목표및전략수립 전문가의견수렴 결과보고서작성 9

23 국어기초어휘선정및어휘등급화를위한기초연구 3.2. 주요협의회내용 본연구진은매달 1 회전체회의를정기적으로진행하였으며, 총 3 회의보고회를 개최하였다. 그리고연구결론에대해서는전문가자문회의를실시하였다. 내용을 일자별로정리하여제시하면다음과같다. 1) 착수보고회 날짜 : 2017 년 6 월 1 일 ( 목 ) 장소 : 국립국어원 참여자 : 국립국어원관계자, 연구진, 자문위원단 주요내용및결과 - 기본어휘 개념의모호성에서벗어나기위해국어능력의기초가되는어휘라는관점에서 기초어휘 로연구과제명을변경. 이에따라본연구는 기초어휘선정및등급화 를목적으로함. - 언어정보과에서기구축된말뭉치및차년부터구축예정인말뭉치를이용가능함. 말뭉치구축을지속적인사업으로진행예정에있으므로계획설계에있어고려바람. - 어휘평정에서전문어의경우우리말샘 DB를활용가능함. - 말뭉치구축및어휘목록작성에있어서지적재산권등데이터에대한법적문제를검토하는작업이기초연구에서추가되어야함. 2) 중간보고회 날짜 : 2017 년 9 월 25 일 ( 월 ) 장소 : 국립국어원 참여자 : 국립국어원관계자, 연구진, 자문위원단 주요내용및결과 - 연구용역사업진행사항보고, 이후사업진행방향및일정점검 - 연구기간과연구예산을고려하여현실적으로구축가능한말뭉치규모를제시 10

24 Ⅰ. 서론 할필요가있음. 실제로기초어휘는대개사용빈도가매우높으므로규모에관계없이나타난다는점에서대규모말뭉치의활용을재고할필요가있음. - 어휘등급화를위해서는저빈도어까지포함되어야하므로대규모말뭉치가필요함. 그러나현재어휘등급화에대한논의가더욱풍부하게이루어지지않고있어그필요성이드러나지않음. - 연구의궁극적인목표가말뭉치구축이아닌기초어휘선정과어휘등급화에있음을염두에두어야함. - 말뭉치구축이후의여러가지비용도함께고려하여중장기계획을세워야함. 3) 전문가자문회의 주요내용및결과 - 총평 : 연구보고서를보면기존한국에서의이주제에대해이루어진연구를충분히검토하고이를극복하는방안을모색하려고하는점이충분히전달됨. 영어를중심으로한이론적인토대를충실히반영하고있다는점도확인할수있었음. 이연구를통해한국어의특성이밝혀지길바람. 또한단발적인연구가아닌지속적인연구로결실을맺기를바람. - 수정및권고사항 (Ⅱ장) 어휘등급기준수립시고려요소들을실제작업에서어떻게적용할것인지의방법론이추가되기를바람. (Ⅲ장) 말뭉치구축계획에초중교과서는높은가중치를부여받아말뭉치에우선적으로포함되었으면함. (Ⅳ장) 어휘선정을위한통계적고려에서는주로 빈도, 범위, 산포도 라는 3개의통계적변수를기반으로한실험내용을구체적으로서술하고있음. 이러한방식에문제가있다기보다는어휘선정에서고려되는좀더포괄적인통계적접근에대한소개가이루어진다음실험에대한세부내용으로넘어가는것이전체를이해하는데에도움이될듯함. (Ⅴ장) 의중 장기계획이사업에목적에맞게충분히잘수립되었음. 하지만이연구사업의목표와목적한바를수행하기에는사업기간이짧아보이기도함. 보고서에서는 ' 중장기계획 ' 이라고되어있지만수행되는연구의양적부담을감안하면중 단기계획으로판단됨. 11

25 국어기초어휘선정및어휘등급화를위한기초연구 4) 최종보고회 날짜 : 2017 년 12 월 12 일 ( 화 ) 장소 : 국립국어원 참여자 : 국립국어원관계자, 연구진, 자문위원단 주요내용및결과 - 연구용역사업결과보고 - 올해연구에서수집한샘플말뭉치는문어에치중되어있어구어자료의보완이필요함. 순수구어자료 ( 세종구어말뭉치, 한양대연령별말뭉치등 ) 와함께구어적성격이상대적으로많이나타나는자료 ( 인터넷게시판, 뉴스인터뷰기사, 영화자막등 ) 를수집하여검토, 활용할계획임. - 어휘등급의수는추후연구를진행하는과정에서확정될것임. 어휘등급의수는목적과활용방향을고려하여결정될것이며, 세부적인구분이이루어질것으로예상함. - 향후 4개년사업이후국립국어원에서자체적으로어휘목록을갱신하고보완할수있도록보완계획혹은절차가함께제시되기를바람. 이러한보완계획은실질적방향제시와함께대외적인차원에서필요성과가능성을제시할근거가될것임. 12

26 Ⅱ. 기초연구 이장에서는기초어휘선정및어휘등급화의방향설정을위하여선행연구를검토하고기구축말뭉치와어휘목록의사례를분석한다. 먼저, 이론연구에서는기초어휘, 어휘평정, 어휘등급화등본연구의주요개념에관한기존논의를검토하고, 이를기반으로본연구에서사용할개념을설정하였다. 또한말뭉치기반기초어휘의선정및등급화의방법론을검토하여시사점을발견하고, 기초어휘및어휘등급과관련된문법적쟁점을검토하였다. 다음으로, 사례연구에서는국내와해외에서구축된말뭉치와말뭉치기반어휘목록의특성을분석함으로써본연구에서말뭉치기반어휘목록을작성할때고려해야할사항을제시하였다. 1. 이론연구 1.1. 기초어휘의개념 1) 기초어휘에대한접근방식 일반적으로기초어휘란해당언어의의사소통에서가장기본적이고핵심적인어휘를이른다. 어휘는단어에대하여집합개념을말하므로한언어의어휘가운데중요도가상대적으로높은단어들의집합으로정의하기도한다. 기초어휘에속하는단어는일상생활에서사용빈도가높고파생이나합성등의조어 ( 造語 ) 에고빈도로참여하며다른단어로대체하기어려운특성을지닌다고알려져있다. 한언어의어휘를구성하는수십만개의단어는그중요도가각기서로다르다고할수있다. 어떤단어는그언어에익숙하지않은어린이나외국인도거의대다수알고있기도하며, 어떤단어는평생그언어를사용한화자도거의접해보지못한것도있다. 국내외의기초어휘에대한접근방식은어휘선정의작업을전제로하므로, 이를근거로나누어볼수있다. 심재기외 (2016: 127~128) 에따르면, 어휘교육을위한관점, 외국인의원활한의사소통을위한관점, 한언어의근간이되는어휘를밝히고자하는관점, 역사언어학적관점이그것이다. 이러한네가지관점은기초어휘에대한다양한접근의방식을대표하고있지만이네가지관점의접근방식에따른결과물이크게차이가나는것은아니다. 기 13

27 국어기초어휘선정및어휘등급화를위한기초연구 초어휘에대한판정기준이나접근의태도가상이하다고하여, 완전히다른어휘목록이제시되는경우는드물기때문이다. 가령해당언어의근간이되는어휘는마찬가지로계통적으로도중요할가능성이높으며, 교육이나언어발달적인견지에서도유의미할수있을것이다. 국어에서기초어휘는어휘론, 국어교육및한국어교육에서향후발전과제로꾸준히언급되어왔던중점연구영역이다. 그러나국어에서기초어휘에대해논의해온중요성에비해, 구체적인목록을제시하고, 이에근거하여기초어휘의개념론이나그성격을논의한연구는많지않은편이며실제한국어화자전체에대한대표성을목표로이루어진연구는거의전무한편이다. 이삼형외 (2016: 76~79) 에서는기존의기초어휘연구는주로한국어교육에서선도되었다고지적하면서, 다음과같이주요성과를요약하고있다. < 표 1> 국어교육용어휘목록선정의주요성과 연구성과국어의기초어휘에대한연구 ( 임지룡, 1991) 등급별국어교육용어휘 ( 김광해, 2003) 초등학생교육용기초어휘선정연구 ( 장현진외, 2014) 규모및선정기준 - 1,500개 - 선정원리 : 절충적방법 ( 기존연구의고빈도어와필자의주관적판정 ) 1) - 제1언어, 제2언어교육의영역모두에적용할수있는등급으로평정한어휘목록 - 어휘등급의평정 : 메타계량 ( 기존계량처리된자료를충분히구하여그분포상황과자료의타당도를함께고려하면서비교함으로써중요도를구하는방법. 어휘목록 14종에대한타당도순위를정한다음비교하여등급화수행 ) - 초등학교저학년의기초어휘 511개 - 선행연구를토대로기초어휘 533개선정후교사 10명의중요도평정 - 품사별, 의미영역별분류 위의표에서볼수있는바와같이, 국어의기초어휘에대한기존성과는대체로언어학분야보다는교육분야에서실용적인목적으로사용하기위하여성하였다고할수있다. 그러나우리말에서투른외국인이나초등학교수준의대상을위한연구에머물러있는상황이며, 국어의사용에전반적으로관여한다고할수있을만한어휘목록확정이나규모의설계, 체계화된연구절차수립, 대규모의언어자료에근거한연구등제반분야에대한정교화가필요한실정이다. 1) 임지룡 (1991: 43) 은 1,500 단어를기초어휘로선정한뒤, 합성과파생의이차어휘를포함하면대략 5,000 개의어휘로확장될수있을것으로예상하였다. 14

28 Ⅱ. 기초연구 2) 기초어휘의개념과성격 기초어휘에대한기존의논의를살펴보면, 현재학계에서기초어휘의개념은기본어휘와혼용되어사용되고있다. 이두개념을구분하여사용하는연구가있는가하면 ( 임지룡, 1991; 김광해, 1993; 김종학, 2001), 구별하지않고혼용하여쓰는것도있고 ( 이충우, 1994; 김광해, 1988), 기초어휘로통일해서쓰기도한다 ( 성광수, 1999). 임지룡 (1991: 2~3) 은기초어휘와관련된유관개념을통해기초어휘를설명하고있는바, 기초어휘란특정언어가운데그중추적부분으로서구조적으로존재하는어의부분집단이며, 기본어휘란어떤목적에따라인위적으로선정되어공리성을지닌어의집단이고, 기간어휘란어떤특정집단을대상으로한어휘조사에서직접적으로얻어지는어집단의골격적인부분집단으로보았다. 이를통해볼때, 기초어휘는해당언어자체에대한어휘연구라는점에서기본어휘나기간어휘와변별되는데, 이러한점에서국어의전반을다루는본연구의성격과관련되는것은기초어휘의개념에가까운것임을알수있다. 또한기초어휘가해당언어의쓰임에서기저적인영역을이루는것이라면, 기본어휘는그목적에따라선정될수있으므로일정부분겹치는목록이있을수있으나근본적으로목표로하는언어기반이다르므로, 양자는서로변별된다고할수있다. 2) 즉기본어휘의목록을따라서말뭉치와통계를중심으로볼때, 기본어휘는어휘빈도의통계치에따르고기초어휘는이보다는균형이있고체계적이라는데그특징이있다 ( 이희자, 2003: 4). 한편, 이희자 (2003) 에따르면, 기초어휘는다음과같은특성을지닌다. 기초어휘 (basic vocabulary) 는 가장기본적이고핵심적이며일상적으로널리쓰이는단어들의총체 로서즉 일상생활에서쓰이는횟수가매우잦고사용범위가넓으며따라서역사적으로보았을때에도그목록이잘변하지않는특성을지닌것으로서형태론적으로는파생이나합성등이차조어의근간이되는최소한의필수어 ( 임지룡, 1991; 김종학, 1995 외참조 ) 라고규정할수있다. 또한기초어휘로선정된것들은일반적으로모국어의제1차습득어휘목록으로간주되는것들인데이는외국어로서의한국어교육에있어서필수 습득 어휘목록으로활용되는가하면, 김종학 (2001) 에서는이를어원연구, 어휘체계의변천양상파악등통시적인어휘연구의기초자료로도활용된다고밝히는등그쓰임새가언어연구와언어교육양방면에서매우크다고하였다. 2) 영어의경우, 통상적으로기초어휘란 1,000~2,000 개정도의목록을대상으로한것을가리키는데, Ogden 등이선정한기초영어체계 (The system of Basic English) 의 850 개목록등이유명하다. 15

29 국어기초어휘선정및어휘등급화를위한기초연구 1.2. 어휘평정및등급화의개념 일반적으로 어휘평정 은 빈도등급화 로치환되어이해되는경향이있다. 그러나 어휘평정 이란어휘소들을그중요한정도에따라등급을매겨배열하는것 ( 김광해, 2003) 으로서, 기본개념에충실하게판단한다면어휘평정과빈도등급화가똑같은개념은아니다. 빈도등급화는어휘평정작업의일환이될수있으나두개가완전히같은개념은아님에유의해야한다. 빈도를고려하지않은채특정목적에의중요도에따라어휘를등급화하여순위를매겨어휘평정작업을하는것도이론상가능하다. 국어어휘평정의대표적예는김광해 (2003) 가있다. 이연구에서이루어진어휘평정에서는 1차어휘는대개 1등급, 2차어휘는대개 2 5등급, 나머지가 3차어휘에대응되는결과를보여주었다. 이들어휘들은대개아동의어휘발달과도긴밀한관련을맺는데, 아동이어휘를획득해가는과정을보면대개 1차어휘를먼저배우고이후학교교육이이루어지는과정에서점차 2차어휘에익숙해지며가장나중에서야 3차어휘를획득해가는양상을띠는것으로상정해볼수있다. 구분 어휘량 연간증가율 연령 남여남여 ,606 6,655 7,822 9,812 12,863 17,359 23,085 28,809 34,379 39,475 43,886 47,721 50,069 50,985 51,176 5,158 6,250 7,283 9,256 12,635 18,057 25,254 31,035 35,726 39,722 42,447 44,161 45,190 45,467 45, [ 그림 4] 이해어휘량의발달 ( 玉村文郞編, 1989: 159) 위표에서제시된것은일본아동의이해어휘량발달과정을보여주는데, 어휘수정보만있기때문에목록의나열외에그활용을위한실질적정보가적은편이라는한계가있다. 이러한점에서볼때어휘평정결과는최종적으로그어휘를사용하는집단, 특히아동의어휘량발달과정과일정한관계를맺도록설계되어야할것으로보인다. 현재우리나라의경우에는신뢰할수있는대규모의어휘량발달결과가없는데, 어 16

30 Ⅱ. 기초연구 휘평정이이루어지고나면아동어휘량발달조사과정이훨씬수월해질것이다. 한편 어휘평정 과관련하여또하나주의해야할점은등급화가곧수준별유형화를의미하는것은아니라는점이다. 어휘의 수준 이라는개념도모호할뿐만아니라등급화와수준은동일한개념으로이해하기어렵다. 1등급은쉽고 7등급은어렵다 등과같은단편적인이해는해당등급어휘들의특성을있는그대로이해하는것을방해할수있음에유의해야한다 말뭉치기반기초어휘선정및등급화방법론 1) 어휘등급설정을위한어휘평정기준수립 어휘평정을하기위해서는평정의기준을수립해야한다. 이때중요하게부각되는문제가 중요한정도에따라등급을매긴다 고할때에논의되는 중요성 의개념이다. 중요성 을어떻게판단하느냐의문제는곧어휘평정기준수립과관련된다. 어휘평정기준수립은어휘평정의목적에따라달라질수있다. 만일한국어의사소통을목적으로한국어를배우는외국인학생들을위한사전편찬용으로어휘평정을시도한다면한국어기초의사소통에의유용성에초점을두어중요성을판단할수있다. 이경우구어의사소통에서의어휘사용빈도는매우유용한중요성판단기준이될수있다. 그러나만일한국어라는전체어휘의분포도에초점을두어어휘평정을시도한다면빈도외다른기준이더요구될수있다. 등급화하려는어휘집합의성격역시어휘평정기준수립에영향을미칠수있다. 예컨대과학학술분야의어휘를대상으로어휘평정을시도한다면과학학술분야라는특성이고려되어야한다. 과학, 학술 등의성격과관련하여사고도구어 (academic words) 나과학전문어 (technical words) 등을어떤방식으로평정할것인지가어휘평정기준수립에영향을미칠수있다. 특히과학전문어의경우대개의경우저빈도어로서한국어전체를대상으로평정할경우에는그빈도가매우적게나오겠지만, 과학학술분야텍스트에서는상대적으로빈도가높게나올수있다. 또한신명선 (2004) 에서논의된것처럼 사려된다 와같은특정사고도구어가과학학술분야에서특히높게사용되는현상이있을경우이러한단어들을어떻게평정할것인지가논의되어야한다. 본연구진은이번연구를첫단계로하여장기적으로한국어전체어휘를대상으로어휘평정을목표로하여세부적인절차를다듬어가고자한다. 이작업은한국어전체어휘를대상으로하는만큼우리말어휘의전반적인특성을드러낼수있고, 어휘평정결과가국어대사전편찬이나교육용교재편찬등에도유용하게이 17

31 국어기초어휘선정및어휘등급화를위한기초연구 용될수있도록제시되어야한다. 이러한작업은전술한것처럼어휘평정의목적을보다구체화하고우리말어휘집합이갖는전반적인성격을꼼꼼하게분석할때에가능하다. 현재본연구를통해우리말 ( 한국어 ) 어휘를전체적으로표집하고그방법론을모색하는과정에서, 예상할수있고또과정중설정하는방식에의해상당히차이를보일결과값을예상해보면서이론적인탐구를수행하였다. 이번연구과정을통해국외의다양한어휘평정작업의방식에대한이론적탐구를진행하고, 또몇가지설정을두고진행한말뭉치선정작업을통해예상되는결과를바탕으로두고평정의내용론을구체화하였다. 2) 어휘등급의기준수립을위한고려요소 어휘등급기준수립을위해고려할요소들을정리하면다음과같다. (1) 등급대상단어의수 한국어총어휘가 < 표준국어대사전 > 의경우 50여만, 우리말샘의경우 100만이넘는다. 그러나등급화대상이되는총단어는결국최대치로잡아도 20만수준안팎일것으로추정된다. 따라서대개의단어는무등급표시로갈수밖에없다고판단된다. 한편 당대사람들이사용하는단어는총어휘목록의 10~15% 정도 ( 김광해, 2003: 16) 임을고려해본다면사실집중등급대상목록은 5만 ~6만개정도로추정해볼수있다. 민간차원에서어휘평정이이루어진 낱말 v.2001 의경우 1~5 등급의어휘량이 66,751개로서일본어의이해어휘량발달 3) 로판단해볼때나름의타당성을확보해구축되었음을알수있다. (2) 어휘력의구조 Nation(1990) 은어휘력을설명하기위해어휘의유형을 고빈도어, 사고도구어, 전문어, 저빈도어 로나누고이들이텍스트에서차지하는비율을다음과같이제시 한바있다. 3) 오기와라히토시 (2016) 에따르면, 일본대학생 4 학년의사용어휘는약 3 만어, 이해어휘는약 4 만 5 천이라고한다. ( 荻原廣 (2016), 大学 4 年生の日本語の使用語彙は平均約 3 万語 理解語彙は平均約 4 万 5 千語, 京都語文 23, 佛教大学国語国文学会.) 18

32 Ⅱ. 기초연구 < 표 2> 어휘력을구성하는어휘의양 (Nation, 1990: 19) 유형고빈도어사고도구어전문어저빈도어 단어수 2천 8백주제별로 1천- 2천약12만 3천 빈도모든텍스트에서자주등장대부분의학술적텍스트에서자주등장전문적텍스트에서경우에따라자주등장자주등장하지않음 텍스트등장비율텍스트전체어휘의 87% 학술적텍스트전체어휘의 8% 전문적텍스트전체어휘의 3% 어떤텍스트든 2% 이상 어원교수, 학습을위한참고절반정도가 라틴어, 이단어들의학습에많은시간을투입해야함. 불어, 꼭알아야함. 그리스어고등교육을받으려면이단어들을위해많은시간투입해야함. 꼭알아야함. 2/3 정도가 라틴어, 어떤과목을학습한다는것은해당교과의불어, 어휘학습을포함함. 각교과교사가이단그리스어어들을다룰수있음. 단국어교사는학습전략을도울수있음. 이단어들을다루기위한교수전략필요. 이단어들만을가르치기위해시간을할애할필요성은적음. 고빈도어는말그대로빈도가가장높은것이며사고도구어, 전문어, 저빈도어로갈수록빈도가낮아진다. 김광해 (2003) 는저빈도어의경우말그대로빈도가매우낮아그유용성이떨어지는만큼고빈도어, 사고도구어, 전문어만을어휘력을구성하는요소로삼았다. 김광해 (2003) 에서는고빈도어를 1차어휘로, 사고도구어를 2 차어휘로, 전문어를 3차어휘로재규정한뒤다음과같은표를제시하기도하였다. < 표 3> 어휘력의관점에서본어휘의구조 ( 김광해, 2003) 문학 역사 3 차어휘 전문어 2 차어휘 사고도구어 과학 수학 1 차어휘 고빈도어 공학 사회思考및논리전개를위한도구기본어기술 철학여러종류의전문어 19

33 국어기초어휘선정및어휘등급화를위한기초연구 이와같이, 기초어휘선정을목적으로하는본연구에서도 1차어휘, 2차어휘, 3차어휘의발달과정에대한분석이이루어질수있도록어휘평정이이루어지도록할필요가있다. 또한어휘평정시 고빈도어, 사고도구어, 전문어, 저빈도어 와같은어휘유형들과그특징을적극고려하여어휘량의발달과정을분석할수있고어휘력의구조를좀더구체화할수있도록해야할것이다. (3) 기초어휘 (1 등급 ) 목록선정과말뭉치 기초어휘 (1 등급 ) 목록선정과관련하여말뭉치를어떻게설정할지는적극적인 검토가필요하다. 기초어휘선정방법은다음과같은두가지방법이가정될수 있다. ➀ 이원화방법 : 기초어휘의경우는일상구어생활텍스트로구성된말뭉치에서추출 ➁ 일원화방법 : 동일균형말뭉치구축후기초어휘를추출하는방법. 영어권의경우를참조하여전체텍스트의 80% 정도를포괄하는단어를기초어휘로선정할수있음. (4) 텍스트포괄범위 (Text Coverage) 어휘의텍스트포괄범위에대한좀더구체적인자료로는다음과같은것이있다. 이에따르면 1등급어휘가텍스트의대략 80% 를차지하는데, 그포괄범위는등급이올라갈수록낮아진다. 여기에서 1등급어휘는대개기존논의에서자주다루어졌던기초어휘개념에해당한다. < 표 4> 문자및음성언어에서의텍스트포괄범위비교 (Nation, 2006: 79) 어휘등급 등급수 텍스트 ( 구어 ) 텍스트 ( 문어 ) 포괄범위 (%) 포괄범위 (%) 1st 1, nd 1, rd 1, th-5th 1, th-9th 1, th-14th 1,000 5 < 고유명사 그외

34 Ⅱ. 기초연구 (5) 빈도 (Frequency), 사용범위 (Range), 산포도 (Dispersion) 4) 말뭉치기반어휘목록선정작업에서가장중요하게고려되는요소는빈도이다. 빈도는어휘평정시고려되는매우중요한요소인데다어휘평정의결과가사전편찬이나교재편찬등에서그유용성을확보하기위해서는주요하게고려할수밖에없다. 사용범위는하나의어휘가얼마나다양한말뭉치에서사용되는지를측정하는어휘선정기준이다. 예컨대인문, 사회, 과학, 예술의 4개분야로나누어네개의말뭉치를구축하였는데어떤하나의어휘가인문말뭉치에서만고빈도로등장하고과학분야말뭉치에서는등장하지않는다면해당단어는사용범위가낮은단어가된다. 산포도는사용범위가갖는한계를극복하기위해제안된개념으로, 사용범위가단순히한단어의빈도가한번이라도몇개의다른말뭉치에서사용됐는지를측정하는것이라면, 산포도는해당단어가한말뭉치안에서일정한빈도를유지하는정도를측정하는것이다. 어휘의산포도를구하는공식으로는다음과같은것이있다. < 표 5> 산포도공식 ( 신동광, 2011 참조 ) Dispersion( 산포도 )= 100x[1-(V/ 사용한 corpus 의수 -1)] * V = 각 corpus 에서나타나는 type 들이가지는빈도의표준편차 / 각 corpus 를구성하는 token 의평균 (6) 친숙도 (Familarity) 신동광 (2011) 에서는어휘사용정도의친숙도에초점을두어척도를개발하였는 데, 어휘친숙도측정척도는다음과같다. 이러한방식은기존의친숙도척도가다 음 Waring(2000) 과같이어휘지식의깊이에초점을둔것과는구별된다. < 표 6> 어휘친숙도측정척도 ( 신동광, 2011) 척도기준설명 5 표현의사용이매우친숙하다. 4 표현의사용이비교적친숙하다. 3 표현을잘사용하지않지만의미는잘알고있다. 2 표현을거의사용한적이없으나의미는대략알거같다. 1 표현을듣거나본적이없어의미를전혀알지못한다. 4) Nation 의이론에서기초어휘선정을위한세기준중 산포도 (dispersion) 라불리는것은 분포빈도수 / 사용분포 (spread frequency) 라고하기도한다. 산포도 라는용어가통계학에서다른의미로쓰여서혼란의여지가있기는하나, 해당단어가특정장르에편중되지않고여러장르에골고루퍼져서나타난다는의미를살리기에는 산포도 라는번역어가좋다고생각한다. 21

35 국어기초어휘선정및어휘등급화를위한기초연구 < 표 7> Waring(2000) 의어휘지식측정척도 등급 친숙도정도 1단계 단어를알지못한다. 2단계 단어의의미를이해한다고생각하지만실제사용하지는못한다. 3단계 단어의의미를이해하지만실제사용하지는못한다. 4단계 단어의의미를이해한다고생각하고실제사용할수도있다. 5단계 단어의의미를이해하고실제사용할수도있다. 신동광 (2011) 에서언급된것처럼친숙도척도는빈도, 사용범위, 산포도와는달리객관적인수치로나타내기어렵다. 관련전문가들을대상으로한광범위한조사를바탕으로하더라도주관성이개입된다는문제점이여전히제기될수있다. 그러나언어를배우고사용하는환경에따라유용성과필요성면에서친숙도가다른어휘가분명존재할수있다는점에서검토가필요한기준이다. 예컨대한국에서영어를배우는학생들에게 classroom, textbook, livingroom, watermelon, cute, song 등 ( 교실영어나우리나라환경에친숙한과일이나음식명등 ) 은그친숙도가원어민보다더높을수있다. 이러한양상은국내국어교육상황에서도발견된다. 교과서에특정제재가반복해서등장함으로써해당제재에나오는특정단어의친숙도가매우높아지는경우등에서나타난다. 어휘에따라해당단어가전문어로서그개념이해가매우어려운단어라할지라도학생들은해당단어를쉽게이해하고사용하고있을수있다. 이는교육적국면외특정시기의사회적이슈와관련해서도불거지는문제이다. 이러한점을고려할때에 친숙도 역시어휘평정시신중하게고려될필요가있다. (7) 어휘평정기준의적용순서 어휘평정기준은위에서언급된다양한요소들에대한본격적인검토를통해설 정된다. 그런데이들적용기준이설정되더라도이들을어떤순서로적용할것인가 의문제가남는다. 다음은주요영어어휘목록제작에서어휘선정기준을적용한 순서를정리한것이다. < 표 8> 어휘목록제작시어휘선정기준및적용순서 ( 신동광, 2011: 225) 어휘목록 어휘선정기준및적용순서 NEAT3000 사용범위 산포도 빈도 BNC3000 사용범위 빈도 산포도 OXFORD3000 빈도 사용범위 친숙도 22

36 Ⅱ. 기초연구 (8) 어휘평정과분야별등급화 한국어전체어휘를대상으로어휘평정작업을진행하지만, 그과정에서인문, 사회, 과학, 예술등분야별등급화역시고려해야한다. 분야별등급화의결과도출될 1등급어휘는한국어전체어휘를대상으로할때설정되는 1등급어휘와다소다를것으로판단된다. 전자가기초어휘의성격을강하게띠고있다면, 후자는해당분야의기반이되는어휘라는점에서한국어기초의사소통을하기위해꼭필요한양자는차별화된다. 한편분야별등급화를하기위해서는어떻게분야를나누어야하며몇개로나누어야하는지역시문제가될수있다. 이는말뭉치규모와분야별어휘특징에대한적극적인분석을통해수행되어야한다. (9) 어휘평정등급 어휘평정의결과는어휘의등급화로귀결되는데, 이과정에서주요하게부각되는문제가등급의수이다. 김광해 (2003) 의경우총어휘 237,990개를교육적중요도에따라총 7등급으로나누었다. 이후 낱말은김광해 (2003) 의 7등급어휘체계 ( 아래에서는낱말 v.2001로표기됨 ) 를 9등급체계로보완하였다. 다음에서알수있듯이김광해 (2003) 의 3, 4, 5등급이 낱말 에서는 3, 4, 5, 6, 7등급으로좀더세분화되었다. 낱말 v 낱말 v 어휘등급어휘량누계개념어휘등급어휘량누계개념 1등급 1,839 1,839 기초어휘 1등급 1,675 1,675 기초어휘 2등급 4,063 5,738 초등 1,2학년 2등급 4,228 6,067 정규교육이전 3등급 7,736 13,474 초등 3,4학년 3등급 8,361 14,428 4등급 8,753 22,227 초등 5,6학년정규교육개시 + 사춘기이전 5등급 9,697 31,924 중등 1,2학년 4등급 19,377 33,805 사춘기이후 6등급 11,552 43,476 중등 3학년, -급격한지적성장고등 1학년 5 등급 32,946 66,751 6 등급 45, ,320 7 등급 125, ,990 < 표 9> 등급별어휘량의변화 전문화된지적성장다량의전문어저빈도어대학이상전문어누락어분야별전문어 7 등급 16,528 60,004 고등 2,3 학년 8 등급 52, ,991 9 등급 106, ,606 등급외 234, ,715 등급외 253, ,715 전체 472, ,715 전체 472, ,715 등급표기 237,990 등급표기 219,606 저빈도어대학이상전문어 누락어분야별전문어 몇개의등급으로나누는것이타당한지에대한판단은말뭉치구축이후, 기초 어휘에대한수차례에걸친어휘량분석결과와샘플말뭉치구축과정을통해얻은 결과를바탕으로연구진과전문가들의의견을최종수합하여결정해야할것이다. 23

37 국어기초어휘선정및어휘등급화를위한기초연구 1.4. 기초어휘및어휘등급과관련된문법적쟁점 1) 기초어휘와관련된문법적쟁점 (1) 기초어휘선정을위한분석단위의설정 ➀ 빈도를고려한품사의설정 기초어휘선정에서가장중요하게고려해야하는것은빈도이므로이를고려하여선정된기초어휘를분류할때명사의하위범주로의존명사를따로설정하고부사에서도접속부사를따로독립시킬필요가있다. 또한 이다 와 아니다 를별도의범주로간주하는등의조치가필요하다. 예를들어현대국어의사용빈도를조사한국립국어원 (2002, 2005) 에서는단어를 일반명사, 의존명사, 대명사, 수사, 동사, 형용사, 보조용언, 부정지정사, 관형사, 일반부사, 접속부사, 감탄사 로품사를분류하였다. ➁ 조사와어미의기초어휘포함여부및처리방향 기초어휘선정을위한해외연구를참조하면텍스트포괄범위를기준으로한경우가적지않은데이때기준이되는것은단어형 (word form) 인경우가많다. 국어에서는단어형이조사결합형과어미결합형에해당한다. 따라서기초어휘가조사및어미와가지는상관성에대해미리정리할필요가있다. 이를처리하는방법은여러가지가있을수있는데결국조사와어미를개별적으로목록화하여추출하되이를기초어휘에서는제외하는방법이가장타당하다고판단된다. 이와관련된예를살펴보면, 국립국어원 (2002, 2005) 에서는조사와어미를구분하여범주화하되격조사는세분하고보조사와접속조사는하나의범주로다루었다. 이다 는 긍정지정사 로간주하여조사의아래에포함시켰다. 그리고어미는선어말어미, 연결어미, 종결어미는세분하지않고전성어미의경우만이를명사형어미와관형사형어미로세분하였다. ➂ 생산성이높은접사의기초어휘포함여부 일부기초어휘관련연구에서는생산성이높은접미사를기초어휘에포함시키 는경우가있으나생산성이높은접사라도어휘의일부일뿐이고생산성이높은접 사가결합하고있어도결합하는어근에따라기초어휘포함여부가달라질수있 24

38 Ⅱ. 기초연구 으므로접사만을따로기초어휘에포함시키는것은바람직하다고판단되지않는다. 이문제는분석단위의문제뿐만이아니라하나의어휘를중심으로이와형태론적인측면에서관련을가지는일군의무리인어휘군 (word family) 을고려할필요가있다. 5) ➃ 기타단위의처리 보조용언은대부분독립된항목으로간주되어야하나 지다 와 하다 의경우는 -아/ 어 가결합하였을때하나의단위로처리하는것이바람직하다. 예를들어 이루어지다, 행복해하다 는하나의단위로처리하는것이바람직하다. 부사의반복은우리말의단어형성방법가운데매우생산적인것이므로하나의단위로처리하지만부사형의반복은문장구성방법으로간주되므로하나의단위로처리하지않는것이좋다. 예를들어 많이많이 는하나의단위로처리하고 늦게늦게 는하나의단위로처리하지않아야한다. 동일한형식을지니는어떤어휘를다의어로볼것인지아니면동음이의어로간주할것인지에따라어휘항목수가달라질수있다. 일차적으로는다의어와동음이의어는 < 표준국어대사전 > 을기준으로판정하는것이바람직하다고판단된다. (2) 기초어휘선정을위한어휘군의처리 ➀ 파생어와관련된문제 빈도를기준으로기초어휘를선정할때생산성이낮은접사가포함된단어가선정될수있고반대로생산성이높은접사가포함된단어가선정되지않을수도있다. 예를들어국립국어원 (2005) 에는 살림, 살림꾼, 소리, 소리꾼, 심부름, 심부름꾼 쌍은모두포함되어있으나 씨름 과 씨름꾼 에대해서는 씨름 만있고 씨름꾼 은포함되어있지않다. 따라서파생어와관련하여서는이를어휘등급산정의기준으로적용하는방안을고민할필요가있다. 예를들면, 살림, 살림꾼, 소리, 소리꾼, 심부름, 심부름꾼 은모두기초어휘에포함되지만기초어휘의등급에서 살림, 소리, 심부름 이 살림꾼, 소리꾼, 심부름꾼 보다더기초적인어휘등급에포함될가능성이높다. 다만이경우의등급 5) 어휘군 은달리 단어족 이라고도한다. 그런데 단어 는한국어의경우 조사 도그대상에포함하는경우가있어특히단어가운데어휘적단어에만국한한다는점을강조하기위해 word family' 를 어휘군 으로번역하여사용하기로한다. 다만 어휘군 을 하나의어휘를중심으로이와형태론적인측면에서관련을가지는일군의무리 로정의한다고할때특히어근이모두어휘의자격을가지는합성어의경우는다른어휘에서도중복적으로포착되므로그범위를정하는것이쉽지않을때가있다. 25

39 국어기초어휘선정및어휘등급화를위한기초연구 확정은어근보다파생어의빈도가더높을수있으므로상호관련성을고려해서결정해야한다. 씨름, 씨름꾼 의경우에는 씨름 만기초어휘에포함되고 씨름꾼 은기초어휘에포함되지않을것이다. 따라서 씨름꾼 은더높은어휘등급을부여받을것이다. 이러한처리는어휘등급을결정할때접사의분석처리가영향을미칠수있음을의미한다. 따라서접사를구분하지않고파생어를하나의단위로계산할경우에는저빈도어휘이던것이접사를구분하여처리하면고빈도어휘가되는경우가생길수있음을고려해야할필요가있다. ➁ 합성어와관련된문제 합성어에서는단어와구의구별이가장중요한문제인데그판정여부는일차적으로는 < 표준국어대사전 > 을참조할필요가있다. < 표준국어대사전 > 에는어근의의미의합이형성된합성어의의미의합과다른정도인의미합성성 (semantic compositionality) 뿐만이아니라의미투명성 (semantic transparency) 이높은것들도빈도를고려하여등재된것들이적지않다. 따라서이두가지기준을고려하여비록 < 표준국어대사전 > 에등재되어있지않은경우라도합성어로판정되는것은합성어로판정하여하나의어휘로처리하는방안을검토할필요가있다. 합성어형성에서자주출현하는단위가운데는독립된단어로존재하지않는경우가있을수있다. 이때는이를따로분석단위로삼아의미에따라구분해야할필요성이있는지검토할필요가있다. 예로 큰가시고기, 큰마음, 큰방 의 큰 과 큰어머니, 큰아버지, 큰처남 의 큰 은모두독립된단어로존재하지않지만그의미차이가분명하므로이를구분해서처리해야하는지검토할필요성이있다. 2) 어휘등급과관련된형태론적쟁점 지금까지의어휘등급의판정은빈도를일차적인기준으로삼되여러연구들에서중복적으로다루고있는지를고려하는메타계량등의방식을동원하였다. 그러나빈도를일차적으로고려하는방식은어휘등급을어휘의중요도와혼동하는결과를낳는단점도가지고있다는점에유의할필요가있다. 빈도가높은단어가반드시교육등에서우선시되어야하는중요한단어와일대일로대응하는것은아니기때문이다. 가령 법 과 법률, 거짓 과 거짓말 의경우모두기초어휘에속하는것으로간주되어왔다. 법 과 법률 의경우 법 보다 법률 의빈도가현저히낮으므로 법 이 법률 보다기초어휘의등급이더높고교육의선후에서도 법 이먼저라는데이견이없다. 그러나 거짓 과 거짓말 은상황이반대여서 거짓 보다 거짓말 이빈도가 26

40 Ⅱ. 기초연구 더높지만형태론적관점에서교육의선후를따진다면 거짓말 이 거짓 보다먼저배워야할단어곧더중요한단어로간주되는것은문제가있을수있다. 이것은곧어휘등급판정이나중요도결정에있어빈도외에형태론적관점에서도고려해야할사항이있다는것을의미하는데이러한것가운데대표적인것으로어휘군과의미관계를들수있다. (1) 어휘군과어휘등급 분석단위를어휘군으로선정할경우, 어휘군의문제는기초어휘선정에서도매우중요한역할을담당하게된다. 또한, 선정된어휘의등급을나누는문제에서도큰역할을담당한다고할수있다. 법 과 법률, 거짓 과 거짓말 은모두어휘군의관계에놓여있는데빈도가어휘군의복잡성과일치하지않는 거짓 과 거짓말 의경우보다단순한단어구조를가지는단어인 거짓 을보다복잡한구조를가지는 거짓말 보다더높은어휘등급을부여할수있는판단근거가된다. 따라서어휘등급을결정할때빈도와형태론적복잡성가운데어떤것을더상위에두어야할것인지에대해천착할필요가있다. (2) 상하관계와어휘등급 어휘와어휘사이의상하관계는두가지로나누어분석할필요가있는데하나는공통되는요소를가지지않는경우이고다른하나는공통되는요소를가지는경우이다. 동물, 개, 삽사리 의경우는공통되는요소를가지지않는경우의상하관계에해당하는데 동물 과 개 에서는 동물 이상위어이고 개 와 삽사리 에서는 개 가상위어에속한다. 그러나이들가운데기초어휘로서의등급이가장높은것은 개 인데이는상하관계에서가장포괄적인의미를가지는최상위어가가장등급이높은기초어휘와일대일로대응하는것이아님을보여준다. 빛, 푸른빛, 연푸른빛 의경우는공통되는요소를가지는경우의상하관계에해당하는데이러한경우는예외없이보다짧은형식이상위어에해당하고또한기초어휘에해당할가능성이높다. 따라서 빛 이 푸른빛 보다기초어휘로서의등급이높고 푸른빛 이 연푸른빛 보다등급이높으며이들가운데 빛 이기초어휘로서의등급이가장높다. 공통되는요소를가지는경우의상하관계는어휘군과도매우밀접한연관을가지는데보다복잡한구조를가지는단어가그렇지않은단어보다기초어휘의등급이높다고보기는어렵기때문에빈도에만기대야하는단점을어휘군과상하관계가보완할수있다. 앞서제시한 거짓 과 거짓말 의관계가이러한예를잘보여준다. 27

41 국어기초어휘선정및어휘등급화를위한기초연구 (3) 유의관계와어휘등급 국어의경우유의관계는고유어와한자어사이에존재하는것이가장일반적인데이러한어종도어휘등급판정에고려할필요가있다. 가령김광해 (1989) 에서는고유어와한자어가일대다의대응관계를보이면서서로유의관계에놓이는다양한경우에대해언급하고있는데고유어 땅 에대해 육지, 영토, 대륙 등이이러한관계를갖는다고보았다. 이는곧비슷한의미를나타내는여러어휘가있을경우그등급을산정할때고유어가한자어보다기초어휘의등급이더높은것으로판단할필요가있음을의미한다. 가령유의관계에놓인 금년 과 올해, 전부 와 모두 의경우기초어휘에포함되어왔고한자어 금년, 전부 보다고유어 올해, 모두 의빈도가높아기초어휘로서의등급이더높은것이고유어에해당하는경우도있다. 그러나유의관계에놓인 바뀌다 와 변하다 의경우모두기초어휘에속하지만한자가포함된 변하다 가빈도가더높다고하더라도이것이기초어휘로서의등급이더높다고볼수있는지논의해볼필요가있다. 이상의논의들은어휘등급을산정할때빈도이외에도어휘사이의계열적관련성이고려되어야한다는것을의미하는것으로어휘등급이오로지양적인특성에의해서만결정되는것은아니라질적인측면에서도타당성을확보해야한다는점을강조하기위한것이다. 28

42 Ⅱ. 기초연구 2. 사례연구 2.1. 국내말뭉치및어휘목록 1) 국내말뭉치의구축현황 국내에서말뭉치구축과활용에대한연구는 1990년대이후본격적으로이루어졌다. 국내말뭉치연구중많은경우한국어교육영역에서이루어져왔으며, 구축대상자료는주로문어를중심으로구축된경향이있다. 현재까지국내에서구축된주요말뭉치를제시해보면다음과같다. < 표 10> 국어말뭉치의목록 말뭉치규모기관기간말뭉치목적 ( 어절 ) Ÿ 낱말빈도조사연세말뭉치1 288만 Ÿ 사전표제어확정연세말뭉치2 Ÿ 국어어휘통계적특성파악 110만연세대학교 1990 연세말뭉치 Ÿ 시대별낱말인지도파악 3,548만 ~ 3, 5, 6, 7 (1960~1990년대) 2013 연세말뭉치4 Ÿ 구어어휘특성파악 77만연세말뭉치8 Ÿ 교육용어휘체계화 87만연세말뭉치9 Ÿ 아동교육용어휘파악 150만연세구어말뭉치 99만 Ÿ 국어연구를위한한국어데고려대한국어고려대학교 1995 이터베이스구축 1,000만말모둠1 Ÿ 국어사전편찬 Ÿ 정보화사회의자연어처리 KAIST 1997 KAIST 코퍼스 Ⅲ 7,000만 Ÿ 언어연구와사전편찬 1998 Ÿ 기초언어말뭉치개발국립국어원 ~ 세종말뭉치 6,200만 2007 Ÿ 통합적국가말뭉치구축 2002 연령별구어한양대학교 ~ Ÿ 의사소통능력의발달단계연구 350만 2003 말뭉치고려대학교 2008 Ÿ 21세기국어의어휘사용양상 ~ 물결 21 코퍼스 60,000만 2013 연구국립국어원 년한국어 Ÿ 한국어교육연구를위한기반학습자말뭉치자료구축 400만 년한국어 Ÿ 한국어교육연구를위한기반학습자말뭉치자료구축 370만 29

43 국어기초어휘선정및어휘등급화를위한기초연구 위의목록은주로한국어어휘측정을파악하기위한기초자료로서구축된것이다. 이중특수목적의말뭉치로는, 빈도조사를통한사전편찬을위해구축된연세말뭉치1과고려대한국어말모둠1, 교육용어휘체계화연구를위해구축된연세말뭉치8, 9가있다. 그리고연령별구어말뭉치는의사소통능력의발달단계연구를위해, 한국어학습자말뭉치는한국어교육연구를위해구축된것이다. 이처럼국내말뭉치연구는언어실태파악과교육용어휘선정을주요목적으로구축되었음을확인할수있다. 이처럼말뭉치연구의목적과말뭉치의구성은밀접한관련성이있다. 국어말뭉치의구성을연령, 문어와구어의비율을기준으로살펴보면다음과같다. < 표 11> 국어말뭉치의구성과특징 말뭉치 연령별구분 문어 / 구어구분 영유아초중고성인문어준구어구어 연세말뭉치1, 2 연세말뭉치 3, 5, 6, 7 연세말뭉치4 연세말뭉치8 연세말뭉치9 연세구어말뭉치 고려대한국어말모둠 1 KAIST 코퍼스Ⅲ 세종말뭉치 연령별구어말뭉치 물결 21 코퍼스 한국어학습자말뭉치 : 전체자료의 5% 미만인경우표기 위의 < 표 11> 은국내선행연구에서구축된국어말뭉치를대상으로대상연령과문어, 구어자료포함여부를기준으로정리한것이다. 연령을기준으로볼때, 대부분의말뭉치가성인언어자료에집중되어있음을확인할수있다. 실제영 유아및청소년의사용언어를다룬말뭉치는한양대학교의 연령별구어말뭉치 가거의유일하다. 연세말뭉치1, 3, 5, 6, 7과고려대학교한국어말모둠1, 세종말뭉치에 30

44 Ⅱ. 기초연구 서구어를일부포함하고있으나, 교과서와동화등을대상자료로포함한것으로집필자가성인이라는점에서실제영 유아및청소년의사용언어를반영했다고보기는어렵다. 다만교과서와동화의예상독자가영 유아및청소년이라는점은고려할만하다. 한편고려대학교한국어말모둠1에서중학생의작문자료를대상으로하고있다는점도특징적인부분이다. 문어와구어자료포함여부를기준으로볼때, 대부분의말뭉치가문어자료에집중되어있다. 고려대학교한국어말모둠1과세종말뭉치의문어와구어의비율은약 9:1로구어의비율이낮은편이다. 세종말뭉치의경우 2007년보고서기준원시말뭉치총 6,200만어절중약 340만어절만이구어이다. 그리고한양대학교의연령별구어말뭉치와연세구어말뭉치는말뭉치규모는작은편이지만순구어자료만을대상으로하였다는점이특징적이다. 한편한국어학습자말뭉치의경우실제학습자의학습자료및인터뷰 / 설문자료를바탕으로구축한말뭉치로이에대한학습자의오류분석말뭉치가따로설계되었다는점이특징적이다. 2) 어휘목록 지금까지국내에서어휘목록을제시한연구성과는교육용어휘목록에집중되어있으며, 국어교육보다는한국어교육영역에서주로수행되었다. 어휘목록은다양한방향으로활용가능하나, 국내연구에서는언어교육의목적으로제시된사례가대다수이다. 교육용어휘선정절차에서언어사실을반영한기초자료를얻어내기위하여활용할수있는요소로는대규모의말뭉치, 교과서, 기본어휘목록및학습사전들의표제어 / 중요어휘목록등이다 ( 서상규외, 2009). 국내한국어교육용어휘목록의선정은실제언어자료를바탕으로구축한말뭉치에기반한양적분석방법이주로활용되었으며, 전문가의평정을통한질적분석방법이함께사용되어왔다. 구체적인연구성과를살펴보면, 한국어교육용으로선정된최초의어휘목록인한국어능력평가용기본어휘표는연세말뭉치에바탕을둔빈도조사결과를활용하여만든것이다. 서상규외 (2000) 는 1998년도에구성된한국어교육용말뭉치를보완하여주요연구대상으로삼아한국어교육을위한기초어휘의미빈도사전개발을추진하였다. 이때활용된한국어교육용말뭉치의구성은세종글말뭉치와세종입말뭉치가각 55만어절, 12.5만어절규모였으며, 여기에제6차교육과정초등학교교과서 26.7만어절과한국어교재 10.5만어절을포함하여총 100만어절의규모로구축되었다. 조남호 (2003) 은한국어학습용어휘선정연구에서현대국어어휘사용빈도조사를우선적으로수행한후에전문가선정위원들의등급판정작업을 31

45 국어기초어휘선정및어휘등급화를위한기초연구 거침으로써양적분석과질적분석을함께사용하였다. 국어교육용어휘목록과관련한연구는한국어교육용어휘목록에비해그수가적으며, 기존어휘목록을거듭활용하는방법을주로사용하였다는특징이있다. 그리고구체적어휘목록을제시한연구보다는기초조사성격의연구가많다. 국어어휘에대한기초조사는문교부 (1956) 를시초로한다. 문교부 (1956) 에서는 우리말말수 ( 어휘 ) 가사용되는잦기 ( 빈도 ) 의실태를조사하여, 과학적인국어의기본형태를파악하고, 우리말의합리적인사용을꾀하며, 국어의정상적인발달및정화운동을목표하는교과서편집이나계몽을활용하고, 나아가서는국어학연구의참고자료로제공하려함 이라고조사목적을밝히고있다 ( 이삼형외, 2017). 이후국립국어원연구등의기초조사가시행되었으나연구대상이교과서등의출판물, 학생작문자료등문어를주대상으로하여언어사용실태를오롯이반영하지못하였다는한계가있다. 국어교육용어휘선정의직접적활용영역인학령기학습자에대한기초조사는국립국어원 (2009) 의초등학교, 그것도교과서나글쓰기에서의어휘조사에한정되어있고, 초중고를모두포괄한연구는구어만을대상으로하고있어 ( 장경희외, 2012) 국어교육용어휘선정을위한전면적인조사는아직이루어지지않은실정이다 ( 이삼형외, 2017). 국어교육용어휘목록의주요성과로는김광해 (2003) 를들수있다. 김광해 (2003) 는제1언어, 제2언어교육의영역모두에적용할수있는등급으로평정한어휘목록을선정하여제시하였다. 어휘선정및평정작업에서메타계량방법을활용하였다. 이연구에서선정한총어휘의양은모두 237,990어이며, 이들을교육적중요도에따라총 7등급의집합으로묶어제시하였다. 한편, 교육적활용을주된목적으로두지않고어휘목록을선정한연구로는송철의외 (2008) 의한국근대초기의어휘연구와한유석 (2010) 의일한분류어휘비교연구등이있다. 송철의외 (2008) 는한국근대초기에해당하는 1901년부터 1910 년사이의신문, 잡지, 소설, 교과서, 문법서등을바탕으로말뭉치를구축한뒤, 당시의시대상을보여주는어휘를선정하여제시하였다. 한유석 (2010) 은일본국립국어연구소의 分類語彙表 에입각하여 < 연세한국어사전 > 의표제어와부표제어를분류한뒤, 양언어를서로비교하기쉽도록병렬적으로배치하여제시하였다. 한편전문용어와관련된어휘연구로는최기선 (2000), 유현경외 (2010) 등을찾아볼수있다. 이처럼국내연구가특정영역에치우친경향이있기는하지만어휘목록선정과관련된국내연구들은기초어휘선정을목적으로하는본연구와밀접한관련성을가지므로각연구의내용과성과를세밀히살펴보도록한다. 먼저국내에서수행된어휘선정연구의주요성과의목록을간략히제시하면다음과같다. 32

46 Ⅱ. 기초연구 < 표 12> 국내어휘선정연구성과 ( 연도순 ) 연구자 연구 년도 연구제목 ( 성과 ) 문교부 1956 우리말말수사용의잦기조사 임지룡 1991 국어의기초어휘에대한연구 임홍빈 1993 국어어휘의분류목록에대한연구 이충우 1994 한국어어휘교육을위한대표어휘선정 한국어능력평가위원회 1997 한국어능력평가용기본어휘표 최길시 1998 외국인을위한한국어교육의실제 서상규외 1998 한국어교육을위한기초어휘선정-기초어휘빈도조사결과 연세대언어정보연구원 1998 연세한국어사전 서상규외 2000 한국어교육기초어휘의미빈도사전개발 조현용 2000 한국어어휘교육연구 임칠성 2002 초급한국어교육용어휘선정연구 이익환 2002 기본어휘선정및사용실태조사를위한기초연구 김광해 2003 등급별국어교육용어휘 김한샘 2003 한국현대소설의어휘조사연구 조남호 2003 한국어학습용어휘선정결과보고서 최기선 2004 (21세기세종계획 ) 전문용어의정비 김한샘 2005 현대국어사용빈도조사 서상규외 2006 한국어학습사전편찬과기본어휘의선정을위한기초연구 서지영 2007 말뭉치를활용한중학교국어과학습사전편찬을위한기초연구 서정미 2008 말뭉치를활용한고등학교국어사전의편찬을위한기초연구 이진영 2008 국어초등학습용어사전 편찬을위한국어교과기본어휘연구 송철의외 2008 한국근대초기의어휘 김한샘 2009 초등학생교과서어휘조사연구 배주채 2010 한국어기초어휘집 국립국어원 2010 초등학생글쓰기어휘조사연구 한유석 2010 일한분류어휘비교 장경희외 2012 초중고등학생의구어어휘조사 이상의연구사례를국어교육분야와한국어교육분야로나누어그개요를살펴 보면다음과같다. 6) 6) 연구사례의목록은김광해 (2003), 조남호 (2003), 서상규외 (2006), 이삼형 김정선 김시정 (2017) 에서주로참조하였다. 33

47 국어기초어휘선정및어휘등급화를위한기초연구 (1) 국어교육영역 문교부 1956 우리말말수사용의잦기조사 Ÿ 우리말말수 ( 어휘 ) 가사용되는잦기 ( 빈도 ) 의실태를조사하여, 과학적인국어의기본형태를파악하고, 우리말의합리적인사용을 연구목적 꾀하며, 국어의정상적인발달및정화운동을목표하는교과서 편집이나계몽을활용하고, 나아가서는국어학연구의참고자료 로제공하려함. Ÿ 한글의경우 1,259음절, 19만 2,463 빈도의글자를조사하였고, 음절에따른잦기조사의결과표, 단자에따른잦기조사집계표를 주요내용 제시하였음. Ÿ 한자의경우 5만 6,485어, 221만 8,727 빈도의글자를조사하였 고, 한자사용의잦기차례표, 한자사용의부수차례표, 한자조 사집계표를제시하였음. 임지룡 1991 국어의기초어휘에대한연구 Ÿ 일상생활에서사용되는어휘가운데가장기초적이고도핵심적인연구목적어휘의목록을작성하고현실적인문제로서어휘교육을위한기초적인목록을작성하고자함 Ÿ 기초어휘는언어생활에서빈도가높고, 분포가넓으며, 파생이나합성등이차조어의근간이되는최소한의필수어를의미함. 기본어휘는어떤목적에따라인위적으로선정되며공리성을지닌어휘의집단을의미함. Ÿ 기존어휘빈도조사의고빈도어를참조하여필자의주관적판정을가미하여어휘를선정하는 절충적방법 을사용하였음. 참조한기존어휘빈도조사로는문교부 (1956) 의 우리말말수사용의주요내용잦기조사, 서연국 (1969) 의 국어기본어휘의연구, 이응백 (1972) 의 국민학교학습용기본어휘, 이연변외 (1980) 의 한국아동의어휘발달연구, 정우산 (1987) 의 국민학교교과서어휘연구, 국어연구소 (1988) 의 중학교교과서어휘 ( 국어 ), 임지룡의 제5차국민학교국어교과서어휘빈도조사 가있음. Ÿ 최근 8종분류어휘집을참조하여사람, 의식주, 사회생활, 교육및예체능, 자연계, 감각및인식, 동작, 상태, 기타의 9가지의미분야를정하였음. 34

48 Ⅱ. 기초연구 임홍빈 1993 국어어휘의분류목록에대한연구 Ÿ 국어사전편찬및집필을위한필요도구의하나로서, 국어의어휘에대한분류목록을작성하는것을목적으로함. 연구목적 Ÿ 첫째, 어휘분류의개념을분명히함. 둘째, 분류원리와분류방법론의확립을위하여어휘분류의역사적인측면에주의를기울 이기로함. 셋째, 본연구에서채택될분류의방법론을제시하고 그분류목록을보이기로함. Ÿ 어휘분류의조건 - 대상조건 : 어휘분류의대상은 단어 이다. 주요내용 - 귀속조건 : 분류의대상이되는 단어 는동일언어체계에속해야한다. - 동질조건 : 하나의부류에포함된단어는동질적이어야한다. - 기준조건 : 분류의원리는일정해야한다. 이익환 2002 기본어휘선정및사용실태조사를위한기초연구 Ÿ 한국어의기본어휘를선정하고그사용실태를조사 하기위한연구목적기초자료로서의말뭉치를실제적으로구축하기위한연구를목적으로함. Ÿ 쓸모있는말뭉치의요건 - 말뭉치를만들기위해텍스트를수집하거나입력하는과정에서, 원래의내용이나형태가고의로든실수로든달라지거나누락되지않아야함. - 말뭉치는관찰하고자하는분야의언어사용의축소판으로서주요내용언어의변이가최대한반영되도록설계되는것이바람직함. - 말뭉치를분석한결과가그분야의언어사용에대한분석으로서타당성을가지기위해서는, 해당분야언어의다양한특성을고루보여줄수있을만큼충분한양의텍스트가수집되어야함. 35

49 국어기초어휘선정및어휘등급화를위한기초연구 김광해 2003 등급별국어교육용어휘 연구목적 주요내용 Ÿ 우리말에서사용되는실제어휘에가장근접하는목록확보 Ÿ 어휘선정이란우리가원하는어휘집합을구성할것이라고판단되는어휘소들의목록을확정하는작업을말하며, 어휘평정은어휘소들을그중요한정도에따라등급을매겨배열하는작업을말함. Ÿ 이연구에서어휘평정을위해채택한자료처리방법은 메타계량방법 임. 더높은객관성을확보하기위해구상된것으로서, 직접말뭉치를계량하는것이아니라기존에계량처리된자료들을충분히구하여그분포상황과자료의타당도를함께고려하면서비교함으로써중요도를정하는방법을말함. 개별적인계량연구하나하나는그빈도순목록을신뢰하는데문제가있는경우가있지만, 이러한개별연구들을충분히모은뒤기본적으로분포의폭을고려하되타당도를함께고려하여단어의중요도를정하는것이현재의역량으로써할수있는가장객관적인중요도판정방법이라할수있음. Ÿ 어휘평정단계에서주요하게고려된변인은분포와자료의타당도두가지임. Ÿ 이연구에서선정한총어휘의양은모두 237,990어이며, 이들은교육적중요도에따라총 7등급의집합으로묶임. 김한샘 2003 한국현대소설의어휘조사연구 Ÿ 국어교육용어휘의단계별선정사업의일환. 이사업의최종목표는국어교육현장에서이용할수있는신뢰도있는국어교육용기본어휘목록을단계별로확정하는것임. 이는대량의문헌자연구목적료를대상으로한어휘사용실태조사결과와기존연구검토결과, 전문가자문을종합하는매우방대한작업임. Ÿ 어휘분석이완료된소설문헌약 100만어절을대상으로하여국어사용빈도조사결과를제시하고자함. Ÿ 연구대상은초판이 1900년이후출판된소설임. Ÿ 표본추출방법으로확률통계적방법과판단추출법을사용했음. 표본후보를형태분석하여빈도를구하고, 1,000만어절말뭉치에서누적빈도 90% 인, 상위 5,000여개의목록과비교하여그사용률을지표로활용하였음. Ÿ 표본선정원칙주요내용 - 번역자료는조사대상에포함하지않는다. - 외국어, 방언, 전문용어등이많이섞인문헌은배제한다. - 한문체이거나고어문체인것은배제한다. - 다양한표본이포함되도록하기위해서한작가의작품이 3편을초과하지않도록선정한다. - 입력오류가적고파일의수집이용이한 21세기세종계획 의자료를최대한활용한다. 36

50 Ⅱ. 기초연구 최기선 2005 (21세기세종계획 ) 전문용어의정비 Ÿ 전문용어의정비는지식정보화사회에서요구되는효율적인정보의교환, 확산을목적으로함. 정보의기본단위인용어의사용에대한사회적약속이투명할때정확한정보의유통이가능함. 현재와같은다원화된지식공급의체계하에서는용어들의난립현상이더욱두드러지고있음. Ÿ 연구의필요성 - 유럽, 일본을비롯한선진국은오랜전통속에서전문용어의중요성을인식하고용어정비작업에대한기술을축적함에비해 연구목적 우리나라는전문용어연구에대한전통이일천함. - 현재의지식정보화사회를맞이하여정보의효율적유통을위해 용어의정비는국가산업의인프라로인식됨. - 용어의정비는물론새로운용어의생성과확장을위한전문용어 관리시스템의확립과개발공정의체제구축이필요함. - 전문분야정보의대중화로인한용어정보의서비스필요성이증 대됨. - 전문분야별용어학적특성연구를바탕으로정보산업응용기술 개발에기여 Ÿ 전문용어기초자료데이터베이스구축 Ÿ 전문용어의표준화 주요내용 Ÿ 전문용어표준화를위한통합검색시스템의확립및전문용어관 련응용툴개발 Ÿ 전문용어학적연구를위한국내외활동강화 김한샘 2005 현대국어사용빈도조사 Ÿ 국어교육용어휘의단계별선정사업의일환연구목적 Ÿ 1900년이후출판된문헌을대상으로한현대국어사용빈도조사 Ÿ 되도록다양한문헌을포함하여조사결과가편중되지않도록하기위하여표본으로선정된문헌의앞부분부터약 5,000 어절씩끊어 300만어절을목표로문헌자료를구성했음. 크기가 5,000 어절에못미치는표본이상당수포함되어있어최종적으로 672 주요내용개의표본, 300만어절의문헌자료를수집하여어휘조사를진행했음. Ÿ 결과적으로 300만어절의어휘분석말뭉치를분석하여자모, 음절, 일반어휘, 조사, 어미, 어절구성, 구, 어휘범주, 활용형, 규범오류형등의빈도를조사하였음. 37

51 국어기초어휘선정및어휘등급화를위한기초연구 서지영 2007 말뭉치를활용한중학교국어과학습사전편찬을위한기초연구 Ÿ 중학교국어교과서말뭉치를활용하여중학교국어과학습사전 연구목적 을편찬하는데필요한표제어의선정과정보기술방법을알아보고, 그예를제시하여학습자들의국어과학습에도움이되는 국어과학습사전편찬의기반을제공함. Ÿ 제7차교육과정의 7, 8, 9학년국어교과서 6권을대상으로교과 서말뭉치를구축하고, 깜짝새 를이용하여품사별, 어절별색인, 주요내용 어절별용례사전을작성하였음. 학년별, 빈도별, 품사별어휘를분석하여표제어를선정하고, 국어과학습사전을편찬하기위한 지침을마련하였음. Ÿ 최종결과물로 15,431개어휘를제시하였음. 서정미 2008 말뭉치를활용한고등학교국어사전의편찬을위한기초연구 Ÿ 고등학교국어사전편찬에필요한사전의형식과내용을마련하고자함. 연구목적 Ÿ 고등학생이고등학교교과서를공부하는중에반드시이해해야 할어휘에관한정보를찾고자할때, 고등학생학습자가학습을 할때유용하게활용할수있는사전을만드는데목표를둠. Ÿ 7차교육과정국정교과서 22책, 검정교과서 56책도합 78권의 주요내용 본문내용을중심으로말뭉치를구축하였음. 색인프로그램 ( 글잡이Ⅱ) 을이용하여표제항을선정하고, 개별단어의쓰임을보였 음. 깜짝새를이용하여어절색인과용례사전을작성하였음. 송철의외 2008 한국근대초기의어휘 Ÿ 이연구의목적은시대상과사회상을잘보여주는어휘들을고찰하는데있음. 개항기이후특히 20세기초기는우리사회가급 연구목적 속히근대사회적면모를갖추어나아가는시기로, 이시기에는급격한외래문화수용과더불어새로운단어들도급속히유입되 기시작했는데, 이러한새로운어휘들의유입은당시시대상과사 회상을잘반영하고있음. Ÿ 어휘조사는 20세기의첫 10년, 즉 1901년부터 1910년사이의 신문, 잡지, 소설, 교과서, 문법서등을바탕으로말뭉치를구축한 주요내용 뒤이를대상으로집필대상이되는표제어를선정하는방식을취하였음. Ÿ 선정된어휘에대해서는각각표제기본형, 원어, 이표기, 품사, 의미, 예문을제시하였음. 38

52 Ⅱ. 기초연구 김한샘 2009 초등학교교과서어휘조사연구 연구목적 Ÿ 국어교육용어휘의단계별선정사업의일환 Ÿ 초등학교교과서어휘조사연구 주요내용 Ÿ 초등학교전학년교과서말뭉치를분석하여어휘빈도를조사하 였음. 목록에서순위, 학년별 과목별빈도, 항목, 풀이, 품사등의 범주등을제시하였음. 유현경외 2010 전문용어자료구축및정비를위한연구 연구목적 Ÿ 전문용어검색시스템탑재를위한풍부한양의자료구축과전문용어에대한어문정비연구의기틀마련 Ÿ 구체적인목표는다음과같음. - 기존전문용어자료보완및신규행정용전문용어자료수집을통한통합적자료구축 - 행정용전문용어의사용양상분석을통해전문용어정비및개선촉구 - 기구축및신규수집된행정용전문용어의어문정비를통한일관성있는전문용어형태보급방안모색 - 전문용어검색시스템탑재를위한구축자료들의형식정제및변환 - 구축자료의탑재를통한향후전문용어통합검색시스템활용방안모색 주요내용 Ÿ 기구축및신규수집된행정용전문용어를수합하여통합적으로구축하고, 구축된자료를정비하여 전문용어통합검색시스템 에탑재하였음. Ÿ 행정용전문용어를수집하여신규자료를구축한방법은크게네가지가있음. 첫째, 해당기관에요청하여자료집을제공받음. 둘째, 해당기관홈페이지를통해목록을내려받음. 셋째, 해당기관홈페이지를통해크롤링함. 넷째, 해당기관홈페이지에서용어개별목록들을수작업으로복사하여구축함. 39

53 국어기초어휘선정및어휘등급화를위한기초연구 한유석 2010 일한분류어휘비교 연구목적 Ÿ 일본국립국어연구서의 分類語彙表 의분류체계에입각하여한 국어를분류한뒤, 양언어를서로비교하기쉽도록병렬적으로 배치하였음. 주요내용 Ÿ 분류어휘표는 류, 부문, 중항목, 분류항목, 단락, 행, 분류어 의 7 단계의구조를가짐. Ÿ 한국어의분류는 < 연세한국어사전 > 의표제어와부표제어전체를대상으로삼았음. Ÿ 본연구의의의는다음과같음. - 한국어시소러스구축을위한기반데이터로서의역할 - 양언어어휘비교는물론, 언어학의제분야의비교연구의용이 - 다언어정보검색, 자동통번역등의정보처리분야응용 - 대역사전의대응어선정및국어사전의의미기술정교화에기여 - 일본어교육, 한국어교육응용 장경희외 2012 초 중 고등학생의구어어휘조사 연구목적 Ÿ 한국초 중 고등학생들이실제사용하고있는구어어휘를형태 적, 의미적측면에서심층적으로살펴보는것을목적으로함. 주요내용 Ÿ 분석대상은한양대학교한국교육문제연구소의 연령별구어말뭉치 임. 분석대상자료의화자수는총 478명 ( 남 230명, 여 248 명 ), 학년별남녀각 20명임. 녹음은학교교실등빈공간에서조사대상자둘또는세명이짝이어자유롭게일상적인대화를나누도록하였고, 조사분량은각대화세트별로 1회에 1시간동안연속으로녹음하는것을원칙으로하였음. Ÿ 녹음조사후음성자료를문자로전사하여기계가독형말뭉치로전환하였음. 그후형태정보주석, 의미정보주석을하여분석할자료형태로가공하였음. Ÿ 학생들의어휘사용특징이파악될수있도록단순사용빈도외에도사용화자수, 형태 의미의하위유형등여러차원에서분석을수행하였음. 특히고빈도어휘를중심으로학교급별로그사용추이를분석하여학교급에따른변화양상을구체적으로살펴보았음. Ÿ 초 중 고등학생이라는특정집단의언어를대상으로한다는점에서언어학적의의가큼. 또한어휘사용에대한관찰을통하여그사용자의인지특성이나그들이속한집단의문화적특성등을가늠할수있다는점에서국어교육적의의가큼. 40

54 Ⅱ. 기초연구 (2) 한국어교육영역 이충우 1994 한국어어휘교육을위한대표어휘선정 연구목적 Ÿ 어휘능력을신장시키기위한일환으로교육용어휘를구성하는 대표어휘라할수있는어휘소의선정기준수립과어휘선정을 목적으로함. 주요내용 Ÿ 기초어휘는한정된소수의어휘자료에의해서가장기본이되는일상생활각영역에서의필요가충족될수있도록계획적으로선정된것을의미함. 기본어휘는일상생활에서일반적으로사용하고사용빈도가높은어휘가운데모든사람들에게공통되는어휘중그사회의구성원으로서정상적인기본생활을하는데필요하다고간주되는것임. 학습용기본어휘와기본어휘를구별하지않음. Ÿ 어휘선정기준으로는다음 8가지를사용하였음. - 사용빈도가높아야한다. - 사용범위가넓은어휘여야한다. - 교육에기초적인어휘여야한다. - 조어력이높은어휘여야한다. - 학습자의발달단계에맞는어휘여야한다. - 적용성이큰어휘여야한다. - 시대가요구하는어휘여야한다. - 고유명사, 계급명, 의성어, 의태어, 은어, 비속어, 유행어, 방언, 고어등은한정된범위에서선정해야한다. Ÿ 교과서어휘연구를참조하여한국어학습용어휘를선정하였으며, 선정결과로는대표어근 65어, 대표접사 175어, 대표한자어형성소 175어를제시하였음. 41

55 국어기초어휘선정및어휘등급화를위한기초연구 한국어능력 평가위원회 1997 한국어능력평가용기본어휘표 연구목적 Ÿ 한국어교육및한국어능력평가의모형수립에서의기초적자료 로서작성된현대한국어의기본어휘목록제시 주요내용 Ÿ 연세대학교한국어사전편찬실에서만든 현대한국어총어휘빈도표 를사용하여기본어휘표를작성하였음. 이연구소에비치된약 4,300만어절의말뭉치를형태소분석하여얻어낸자료임. Ÿ 형태소분석기의정확도가대체로 90% 전후로일컬어지고있으나, 실제언어자료를분석하였을경우적지않은오류를포함하는것으로확인되어사후처리를통해오류를제거하였음. Ÿ 총 10,740개어휘를제시하고있으며, 품사에따라그비율을보면명사가약 57%, 동사가약 20%, 형용사가약 7%, 부사가 6% 순으로높은비율을차지하고있었음. 최길시 1998 외국인을위한한국어교육의실제 연구목적 Ÿ 외국인을위한효율적인한국어교육을위해교육용기초어휘와, 외국인이한국에서언어생활을하는데있어서필수적으로습득 해야할기본어휘를선정하고자함. 주요내용 Ÿ 최길시 (1994) 의일본어를모어로하는사람들을위한한국어교육방법연구에서발표한 1,000개기초어휘와, 각종어휘빈도조사자료를참고하여한국어교육현장경험을바탕으로기본어휘를선정하였음. Ÿ 어휘빈도조사자료에서사용빈도가높은것을기본으로, 요즘일상생활어로자주쓰이는신생어, 외래어들은빈도조사자료와상관없이선정하는방식으로 2,000개어휘를선정하여제시하였음. 42

56 Ⅱ. 기초연구 서상규외 1998 연구목적 주요내용 외국어로서의한국어교육을위한기초어휘선정 -기초어휘빈도조사결과 Ÿ 외국어로서의한국어교육을위한교육용기초어휘를대규모의실제언어자료에대한국어학적, 정보학적, 계량적분석을통하여선정하는것을목적으로함. Ÿ 대규모연세말뭉치와교육분야텍스트의어휘빈도를조사하여두결과의상관성을분석하고, < 조선어빈도수사전 > 의어휘빈도의분포와대조하였음. 어휘사용률과어휘증가율을고려하여어휘분포와단계를분석하고기본어휘후보목록을확정하였음. 어휘목록의검증과보완과정을거쳐기본어휘구간과목록을확정하였음. Ÿ 어휘선정시누적빈도율이 90% 인지점인약 5,000개어휘를 기초어휘후보군 으로추출한후, 교과서, 조선어빈도수사전, 한국어교재에중복하여등장한어휘목록과비교하여최종어휘를선정하였음. 서상규외 2000 한국어교육기초어휘의미빈도사전개발 Ÿ 교재개발, 학습사전편찬, 교과과정의개발등한국어교육분 연구목적 야에서응용될수있는기반정보인, 한국어기초어휘의미빈도 제시 Ÿ 서상규외 (1998) 에서구성된 한국어교육용말뭉치 를더욱보완 주요내용 하여 1999년에는총 100만어절의표준적한국어교육용말뭉치구성을완료하고, 이말뭉치를대상으로 2년간의미주석작업을 수행하였음. 조현용 2000 한국어어휘교육연구 Ÿ 제7차교육과정의초등학교국어교과서어휘를조사하고분석함. 연구목적 분석결과는이후기초어휘선정이나교육과정편찬에이용될 수있으리라생각됨. Ÿ 객관적말뭉치에근거한자료와교육전문가의경험적방법을절 충한방법을택하였음. 먼저기존자료 ( 서상규외 (1998) 의어휘 주요내용 빈도자료, 최길시 (1998) 의어휘목록, 연세대한국어학당교재편찬위원의기본어휘자료 ) 의공통된어휘 543개를추출하였음. 그리고누락된어휘등 182개어휘를추가하여총 725개의한국 어교육용기본어휘목록을선정하여제시하였음. 43

57 국어기초어휘선정및어휘등급화를위한기초연구 임칠성 2002 초급한국어교육용어휘선정연구 연구목적 주요내용 Ÿ 초급한국어교육용어휘선정 Ÿ 연구의목표는다음과같음. - 빈도와분산을함께고려하는계량의방법을사용하여객관성을유지한다. - 가능한한직관에일치하는결과가나오도록한다. - 어휘의체계를고려한다. - 1,000개상당의어휘를추출한다. Ÿ 초급한국어교육용어휘는한국어를외국어로서배우고자하는초급단계의학습자들이익혀야하는, 교육의대상이되는어휘를의미함. Ÿ 먼저연세말뭉치에서빈도 5,000 이상인어휘 500~600개정도를추출하였고, 다음으로국내초급용한국어교육용교재들에등장하는어휘에대한계량분석을실시하여어휘를추출하였음. 두방법을통해얻어진어휘를바탕으로연구자의직관과연세빈도를고려하여어휘를조정하여총 1,038개어휘를선정, 제시하였음. 조남호 2003 한국어학습용어휘선정결과보고서 연구목적 주요내용 Ÿ 우리말을배우고자하는외국어화자가우리말을잘익히도록하기위해서는한국어교육에필요한어휘를선정하는일이먼저이루어져야하므로한국어학습용어휘목록을선정하고자함. Ÿ 2000~2002년에는 150만어절규모의말뭉치에대한빈도조사를수행하였음. 2002~2003년에는한국어교육전문가 6인에게주관적인어휘평정을의뢰하고결과를종합하여어휘등급을결정하였음. Ÿ 현대국어사용빈도조사목록 59,000여개중출현빈도 15회이상인단어 10,352개를추리고, 이를대상으로등급판정을한목록을선정위원에게배포하였음. 선정위원들이단계별로 A, B, C, D( 후보단어 ), E( 배제할단어 ) 로판정한결과를기준으로약 6,000여개의어휘목록을선정하였음. Ÿ 어휘목록에서조사, 어미는제외하였으며, 복합어와품사통용어는전부개별단어로처리하였음. Ÿ 최종결과물은 5,965개단어로등급별로보면 A등급 982개, B등급 2,111개, C등급 2,872개였음. 어휘목록에는순위, 단어형태, 품사, 동음이의어구별을위한풀이, 등급등의정보를함께제공하였음. 44

58 Ⅱ. 기초연구 서상규외 2006 한국어학습사전편찬과기본어휘의선정을위한기초연구 Ÿ 말뭉치를분석함으로써얻을수있는여러가지기초적언어정보가한국어교육을위한기본어휘의선정을위한연구, 한국어연구목적학습사전의기본어휘표제어나중요어휘의선별과정에과연도움을줄수있는지, 어떠한방법으로이를활용할수있는지를모색함. Ÿ 한국어교육기본어휘는제2언어로한국어를학습하는이들이익혀야할기본적단어로, 생활을위한필수어휘와한국어학습에기본이되는어휘를아울러포괄하는것을의미함. Ÿ 5개말뭉치 ( 연세말뭉치, 한국어교육표준말뭉치, 한국어교재말뭉치, 초등학교전체교과서말뭉치, < 연세한국어사전 > 뜻풀이말뭉치 ) 에서중복도 3이상인어휘중고유명사와복합수사를제외주요내용한 2,028개어휘를중요어휘 1로선정하였음. 한국어교재사용어휘에서중복도와어휘빈도를고려하여 2,025개중요어휘 2를선정하였음. 10종기본어휘목록과학습사전의중복도를고려하여 1,977개중요어휘 3을선정하였음. 이세종류의어휘목록을대조, 통합하여최종적으로총 2,995개어휘목록을제시하였음. 배주채 2010 한국어기초어휘집 연구목적 Ÿ 한국어능력 1 급부터 4 급까지배우기에알맞은기초어휘제시 주요내용 Ÿ 1급단어 300개, 2급단어 600개, 3급단어 800개, 4급단어 1,000개로총 2,700개단어를제시하였음. Ÿ 동철이의어를구별할때국어사전에서는어깨번호를사용하지만여기서는확인어를사용했음. 3) 어휘등급화단위설정 국내어휘선정연구중어휘의등급화를시도한것은국어교육영역의김광해 (2003) 와한국어교육영역의조남호 (2003) 등이있다. 두연구에서등급화단위를어떻게설정하고있는지에주목하여살펴보겠다. 김광해 (2003) 에서는우리말에서사용되는실제어휘에가장근접한목록확보를목표로, 이른바 메타계량방법 을사용하여어휘평정작업을하였다. 메타계량방법은더높은객관성을확보하기위해구상된것으로서, 직접말뭉치를계량하는것이아니라기존에계량처리된자료들을충분히수집하여그분포상황과자료의 45

59 국어기초어휘선정및어휘등급화를위한기초연구 타당도를함께고려하면서상호비교함으로써중요도를결정하는방법이다. 메타계량방법을사용하며고려된변인은 분포 와 자료의타당도 두가지이다. 분포란매우자명한것으로하나의단어가얼마나많은자료들에서등장하고있는가하는양적인측면을중요도판정의변인으로고려한것이다. 그리고자료의타당도란입수한연구물에나타난어휘목록이얼마나보편타당성을지니고있는가하는질적인측면의변인으로고려한것이다. 이연구에서메타계량의대상은조현용 (2000), 임지룡 (1991), 이충우 (1992) 등의연구와 < 연세한국어사전 >, 고려대의국어사전표제어자료, 21세기세종계획의전자사전개발자료등사전자료총 14건으로개별어휘소합계는약 9만 8천여개이다. 이연구에서는등급별어휘의양을결정하기위해일본, 러시아, 미국, 독일어의사례를참고하였으며최종적으로선정한어휘의양은 23만 8,010어로어휘를모두 7등급으로분류하였다. < 표 13> 등급별어휘의상황 ( 김광해, 2003: 27 수정인용 ) 어휘량 누계 국어교육용한국어교육용등급개념 4구분 6구분개념 1,845 1,845 1 기초어휘 초급 1 4,245 6,090 2 정규교육이전 중급 2 정규교육개시 - 3 자국인과어휘량 8,358 14,448 3 사춘기이전, 사고상급을일치시키는방도구어일부포함 4 향으로조절함사춘기이후 ,377 33,825 4 급격한지적성장, 고급 사고도구어포함 6 32,946 66,771 5 전문화된지적성장단계, 다량의전문어포함 45, ,340 6 저빈도어 : 대학이상, 전문어 ( 기존계량자료등장어휘 + 누락어 14,424어추가 ) 125, ,010 7 누락어 : 분야별전문어, 기존계량자료누락어휘 비고소사중전사전 이연구의성과중하나는그간학계에서확정되어있지않은등급별어휘량을결정하여제시하였다는점이다. 이때국어교육용등급별어휘량과한국어교육용등급별어휘량이반드시일치한다고보기는어려우나이를일치시킨다는방침아래작업을수행하였다. 7등급으로등급화된김광해 (2003) 의연구성과는이후 낱말에서 9등급체계로보완하였는데, 이는기존의 3, 4등급을 3, 4, 5, 6등급으로세분화하는과정을거친것이다. 46

60 Ⅱ. 기초연구 한편조남호 (2003) 에서는한국어학습단계를 3단계로나누어 1, 2, 3단계의한국어학습용어휘를선정하는방식으로제시하였다. 이연구의어휘선정및등급화과정은다음과같다. 2000~2002년에는 150만어절규모의말뭉치에대한빈도조사를수행하고, 2002~2003년에는한국어교육전문가 6인에게주관적인어휘평정을의뢰하고결과를종합하여어휘등급을결정하였다. 구체적으로는현대국어사용빈도조사목록 59,000여개중출현빈도 15회이상인어휘 10,352개를추리고, 이를대상으로등급판정을한목록을선정위원에게배포하였다. 선정위원들은 1단계, 2단계, 3단계에속할수있다고생각되는어휘를각각 A, B, C로, 3단계에속할수있다고생각되는후보단어를 D로, 배제할단어를 E로판정하였다. 이결과를수합하여약 5,965개어휘를최종선정하였다. 최종결과물인어휘목록에는순위, 단어형태, 품사, 동음이의어구별을위한풀이, 등급등의정보를함께제공하였다. 최종적으로선정된한국어학습용어휘의등급별개수를품사를구분하여정리하면다음과같다. < 표 14> 한국어학습용어휘목록품사별분포 ( 조남호, 2003: 11) 품사 등급 A B C 계 명사 497 1,199 1,708 3,404 고유명사 의존명사 대명사 수사 동사 ,345 형용사 보조용언 관형사 부사 감탄사 분석불능 계 982 2,111 2,872 5,965 47

61 국어기초어휘선정및어휘등급화를위한기초연구 어휘목록의선정과어휘등급화작업은어휘목록의목적이무엇인지와밀접한관련이있다. 위에서살펴본두사례에서도국어교육용어휘와한국어교육용어휘의목적이다른만큼선정되는어휘의양과등급의기준등이차이가나는것을확인할수있다. 위의사례에서는학습단계를기준으로등급을분류하고그에맞추어어휘를판정한결과물을보이고있는데, 반대로등급별어휘수를우선적으로결정하고계량적으로등급을판정하는방법도가능할것이다. 이처럼국내어휘연구에서어휘등급화와직접적인관련이있는연구가아직미진한편이고, 충분한연구성과가축적되지못했으므로어휘선정및등급화관련해외사례를적극활용해방법론을수립하여야할것이다 해외말뭉치및어휘목록 1) 해외말뭉치의구축현황 영어권에서는일찍이어휘교육의효율성을위해말뭉치분석을다양한방식으로교수 학습에활용하였다. 초기말뭉치의활용은말뭉치로부터유용한표현을추출하거나사전의예문발췌에주로적용되었다. 이런작업은컴퓨터를바탕으로한말뭉치분석기술이활성화되면서가능하게되었으며이와같은초기말뭉치활용기법을소위 Behind the Scenes Approach 라고한다. 이접근법은말그대로현장에서한걸음물러나미리준비한다는의미로온라인으로말뭉치를실시간활용하는것이아니라오프라인으로말뭉치를분석하여빈도가높은어휘같은학습내용을선정하거나이를바탕으로교재를개발하는데활용하는것이다. 그러나말뭉치활용에관한연구가가속화되고웹기반인프라가급격히발전함에따라말뭉치활용에대한새로운요구들이생겨나기시작했다. 이새로운접근법은말뭉치의샘플을온라인으로직접연결하여그예를학생들에게즉각적으로제시하거나말뭉치를바탕으로예시문항을현장에서바로제작하여활용하는것으로소위 On Stage Approach 라한다. 이접근법은 Johns(1986, 1988, 1991) 가제안한 Data- Driven Learning(DDL) 으로더널리알려져있다. 이는말그대로언어데이터인말뭉치에서자료를끌어와교수 학습에활용하는것으로학습자들은많은샘플을보면서특정표현의의미를유추해보거나그실제적쓰임을직접접하면서문법또는어휘를귀납적으로습득하는발견식학습을그원리로하고있다. 본연구는국어과기본어휘개발을목표로하고있는바, 말뭉치분석을바탕으로어휘목록개발에활용하는 Behind the Scenes Approach 에기반하고있다고말할수있다. 48

62 Ⅱ. 기초연구 미국에서는 1964년브라운대학 (Brown University) 에서프란시스 (Francis) 와쿠세라 (Kučera) 의주도로 Brown Corpus 라는컴퓨터로분석가능한최초의전자말뭉치 (electronic corpus) 를구축하였다. Brown Corpus는언어의대표성을확보하기위해다음의 < 표 15> 와같이 15개의영역에서데이터를수집하였다. 이는각 2,000 단어로구성된 500개의문서로총 100만단어의말뭉치이다. 최근의말뭉치구축추세는말뭉치가거대화되는추세이기는하지만 Brown Corpus는이후말뭉치구축의모델이되어온바, 90년대까지대부분의영어말뭉치는 100만단어의규모로구축되는것이일반적이었다 ( 예 : LOB, ACE, WSC, WWC). < 표 15> Brown Corpus 의주제영역및구성단어수 주제영역 규모 ( 단어수 ) 주제영역 규모 ( 단어수 ) 주제영역 규모 ( 단어수 ) 1. Press Reportage 89, Popular Lore 87, Fiction Mystery 48, Press Editorial 55, Biography & Memoirs 152, Fiction Humor 18, Press Reviews 35, Government & Industry 63, Fiction Sci-Fi 12, Religion 21, Learned 14. Fiction 163,000 & Academic Adventure 58, Skills & Hobbies 73, Fiction General 58, Fiction Romance 59,000 Brown Corpus와같이다양한주제영역에서데이터를구축할경우언어사용의대표성을확보할수있을뿐만아니라세부영역별로목적에따라활용하기에도용이하다는장점이있다. 실제 Brown Corpus의중요영역만을보면크게 Press(1, 2, 3)-179,000 단어, Academic(9)-163,000 단어, Fiction(10, 14, 15)-175,000 단어 로거의같은규모로균형있게구성되어있다. 1978년영국에서는 1964년에미국에서제작된위의 Brown Corpus에자극을받아 Brown Corpus와같은형식에, 같은크기로 Lancaster Oslo/Bergen(LOB) corpus를구축하였다. 이는 Brown Corpus와같은구성과규모라는점에서미국과영국영어를비교할때주요자료사용된다. 또한 London Lund Corpus(Survey of English Usage) 는 1959년에 University College London에서쿼크 (Quirk) 가주도하여구축한 Survey of English Usage(SEU) 의자료를디지털화한후 1975년에 Svartvik이 Lund University에서제작된 Survey of Spoken English(SSE) 자료와통합하여구축한대표적인영국말뭉치이다. 이말뭉치는 50만단어규모로 1953~1987년의구어자료를바탕으로구성되어있다. 49

63 국어기초어휘선정및어휘등급화를위한기초연구 말뭉치분석에기반한어휘연구중상업적성공과대중화에성공한사례는 Collins COBUILD English Language Dictionary가최초의사례이다. Birmingham University의 Sinclair(1987) 가주도한 COBUILD(Collins Birmingham University International Language Database) Project 는 Bank of English 라는대규모영어데이터베이스를구축하였고 1980년대말뭉치기반사전인 Collins COBUILD English Language Dictionary를출판하여큰성공을거두었다. 당시구축된 Bank of English의크기는 2억단어정도였지만현재는 4억 5천만단어가넘는대규모데이터베이스가되었다. 이말뭉치는 25% 가구어이며 75% 는문어로구성되어있으며 70% 는영국영어이고 20% 는미국영어그리고 10% 는그밖의영어권국가에서수집되었다. 또한 Collins COBUILD English Language Dictionary에수록된모든예문은이말뭉치에서발췌한대표성있는실제적표현이어서이것이상업적성공의이유가되었다. 또하나의대규모말뭉치는 British National Corpus(BNC) 로, 이는가장보편적으로사용되고있는 1억단어의영국말뭉치이다. 1991~1994년사이에수집된데이터로 10% 는구어이고 90% 는문어로 4,049개의문서로구성되어있다. BNC를구성하는주제별비율은다음의 < 표 16> 과같으며말뭉치의대부분을차지하는문어자료의세부주제영역은 < 표 17> 과같다. < 표 16> BNC의대 ( 大 ) 주제영역및구성단어수 주제영역 문서수 규모 ( 단어수 ) % Spoken demographic 153 4,233, Spoken context-governed 755 6,175, Written books and periodicals 2,685 79,238, Written-to-be-spoken 35 1,278, Written miscellaneous 421 7,437, < 표 17> BNC 문어자료의세부주제영역및구성단어수 주제영역 문서수 규모 ( 단어수 ) % Imaginative ,496, Informative: natural & pure science 146 3,821, Informative: applied science 370 7,174, Informative: social science ,025, Informative: world affairs ,244, Informative: commerce & finance 295 7,341, Informative: arts 261 6,574, Informative: belief & thought 146 3,037, Informative: leisure ,237,

64 Ⅱ. 기초연구 전세계적으로구어말뭉치자료는수집뿐아니라녹음및전사그리고데이터클리닝같은추가적인작업으로인하여, 시간및비용소요가문어말뭉치구축에비해상대적으로크기때문에규모가작고구축된사례도많지않다. Cambridge Nottingham Corpus of the Discourse of English(CANCODE) 는구어말뭉치로 1995~2000년사이수집된 500만단어의영국말뭉치이다. 현재는제작사인 Cambridge University Press와매카시 (McCarthy) 나슈미트 (Schmitt) 와같은참여연구자들이독점하고있으며일반연구자에게는공개가되지않는자료이다. 이밖에도 International Corpus of English(ICE) 는영국, 미국, 홍콩, 싱가포르, 남아공, 인도, 필리핀등여러영어권국가에서 1990년부터수집이시작된말뭉치세트로 Brown Corpus와같이각 2,000단어로구성된 500개의문서로구성되어있다. 구어와문어의구성비율은 60% 가구어이고 40% 는문어자료가차지하고이다. 상대적으로말뭉치연구에소극적이었던미국은최근에이르러세계최대의말뭉치를구축하였다. 1990~2015년사이에 Brigham Young University의 Mark Davies가최신의자료로구축한이말뭉치는 Corpus of Contemporary American English(COCA) 이며총 5개의대영역으로구성되어있고 2015년기준으로총 5억 3천만단어규모에이른다. 그주제영역과규모는다음과같다. < 표 18> COCA 주제영역별단어수 주제영역 규모 ( 단어수 ) Spoken TV 및라디오프로그램대본 109,391,643 Fiction 단편소설및문학잡지 104,900,827 Popular Magazines 다양한영역의잡지 110,110,637 Newspapers 다양한주제의신문기사 105,963,844 Academic Journals 다양한영역의학술지 103,421,981 말뭉치의구축에는상당한인력과시간이소요되는만큼 COCA를구축한마크데이비스 (Mark Davies) 는기존의말뭉치구축방식과는달리인터넷자료를바탕으로 COCA를구축하였다. 단시간에세계최대규모의말뭉치를구축할수있었던이유도여기에있다. COCA는최대규모의최신자료를바탕으로구축되었다는장점이있는반면인터넷자료라는한계로인해주로인터넷상의신문이나 TV 방송대본등언론매체의자료에지나치게의존한나머지일반영어사용의대표성에는다소문제가있는것으로나타났다 ( 신동광 전유아 이신웅 박명수, 2017). 지금까지는특정목적을가지고구축된말뭉치가아니라하나의언중 ( 言衆 ) 의언어사용을대표하기위해구축된영어말뭉치에대해살펴보았다. 최근의말뭉치 51

65 국어기초어휘선정및어휘등급화를위한기초연구 연구의추세는특정한목적에최적화된 ESP(English for Specific Purposes) 말뭉치를구축하거나기존의말뭉치를원하는목적에맞는비율로재구성하여대규모말뭉치를구성하는방식을채택하고있다. 이러한말뭉치구축방식은최신의어휘개발프로젝트에폭넓게적용되고있다. 현존영어어휘목록가운데가장타당성이높다 ( 신동광, 2014) 고판단되는 BNC-COCA 25000(Nation & Webb, 2011) 은기존의어휘목록개발에서는적용되지않은차별화된방식의말뭉치구축을채택하였다. 사실하나의위계등급으로아동과성인의어휘학습을모두포괄하는어휘목록을개발하는것은쉽지않다. 그이유는지금까지구축된대부분의말뭉치는연구윤리나편의상성인의언어사용데이터를기반으로구축되었기때문에아무리빈도와같은객관적인어휘선정기준을적용해도아동의관심과학습의실제성을모두반영하는데는한계가있기때문이다. 아동은보통이미지형상화가가능하고의미가구체적인명사와같은내용어를쉽게습득 (Morrison, Chappell & Ellis, 1997; Sandhofer, Smith & Luo, 2000) 하지만성인말뭉치를구성하는어휘를빈도에따라정렬하면상위빈도는대부분은관사나전치사와같은기능어이기때문에이들어휘를위주로아동이학습할기초어휘를선정하는것은현실적으로문제가많다. Nation & Webb(2011) 은이러한문제를해결하기위해기초어휘를위한말뭉치를별도로구성하였다. 즉총 25,000개의어휘군목록을개발하면서기초핵심어휘라고일컫는상위 2,000개의어휘선정에는구어자료나일상적인내용이풍부한문어자료로말뭉치를구축하고 3,000~25,000 단어즉 23,000개의어휘군의선정에는영국의대표말뭉치 BNC와미국의대표말뭉치 COCA를합한초대형말뭉치 (mega-corpus) 에서추출한어휘정보를사용하였다. 여기서상위 2,000 단어선정을위해구축된말뭉치는구어자료가 6, 문어자료가 4의비율로구어자료의비율이더많고총말뭉치의규모는 1,000만단어에이른다 < 표 19> BNC-COCA 상위 2,000 단어선정을위한말뭉치구성 미국자료 영국 / 뉴질랜드자료 구어 규모 ( 단어수 ) 구어 규모 ( 단어수 ) 1. AmNC spoken face to face, telephone 1 1,107, BNC 1 1,036, AmNC spoken face to face, telephone 2 1,029, BNC 2 1,125, Movies and TV 1.000, BNC Plus half of WSC 1,132,620 문어 규모 ( 단어수 ) 문어 규모 ( 단어수 ) 7. AmNC written fiction, letters 1 1,145, School journals 1,028, AmNC written fiction, letters 2 939, BNC fiction 1,040,204 52

66 Ⅱ. 기초연구 위의 < 표 19> 에서보듯 BNC-COCA 상위 2,000 단어선정을위한말뭉치구성에는총 10개의하위말뭉치가사용되었고각하위말뭉치의규모는약 100만단어로균일한것을알수있다. 미국과영국 7) 의자료비율도구어나문어모두에서 5:5로균형을이루고있다. 문어의경우에도학습자들의학교과제물을바탕으로구성된말뭉치를포함하여기초수준을유지하고자하였다. 이를통해기존상위 1,000 단어수준에서는볼수없었던 alright, pardon, hello, dad, bye 등의일상적인단어들이상위 1,000 단어에포함될수있게되었다. 끝으로동일한문제를해결하기위해이와는다소다른방식을채택한 2015 영어과교육과정기본어휘목록개발의사례도참조된다 영어과교육과정기본어휘는영어의다양성을인정하되기본어휘의경우유용성과일반성을강조하여미국과영국, 호주와뉴질랜드말뭉치를모두포함하는구성을채택하였고대입시험을준비하는과정까지활용할수있도록문어의비율을높이면서도구어에포함된일상적인표현을최대한선정하기위해구어와문어의비율을 5:3으로설정하였다. < 표 20> 2015 영어과교육과정기본어휘목록개발을위한말뭉치구성 말뭉치종류 문어 / 구어 말뭉치규모 Freiburg-Brown Corpus 미국문어 100만단어 Freiburg-LOB Corpus 영국문어 100만단어 Australian Corpus of English 호주문어 100만단어 British National Corpus Written Sampler 영국문어 100만단어 Wellington Written Corpus 뉴질랜드문어 100만단어 Corpus of Contemporary American English Spoken Sampler 미국구어 100만단어 British National Corpus Spoken Sampler 영국구어 100만단어 Wellington Spoken Corpus 뉴질랜드구어 100만단어 < 표 20> 에서보듯모든하위말뭉치의규모는 100만단어로동일하며총 800만단어로구성된말뭉치를구성하였다. 그러나이러한말뭉치구성이 BNC-COCA 25000의개발사례와마찬가지로아동을위한기초어휘선정의모든문제를해결할수는없다. 따라서이러한기초어휘선정을위해 2015 영어과교육과정기본어휘선정에는빈도와사용범위와같은객관적인기준외에도친숙도와초등추천어휘라는기준을추가적용하였다. 하지만원어민과의의사소통시유용성을고려하여영어과교육과정어휘 3,000개의선정에앞서빈도와사용범위라는객관적 7) 뉴질랜드영어는영국영어와매우유사하기때문에영국자료와동일하게간주한다. 53

67 국어기초어휘선정및어휘등급화를위한기초연구 기준을통해 3,500 단어를먼저선정하였다. 그리고 3,500개의어휘군풀안에서친숙도와초등추천기준을우선적용하여상위 3,000 단어수준을넘어서더라도친숙도와초등추천기준에서높은수치를보여그순위가 3,000 단어내에포함되면기본어휘로선정하였다 ( 이문복 신동광, 2015). 이는 BNC-COCA 25000의개발시이원화된말뭉치구축과는차별되는대안이라고할수있다. BNC-COCA 25000과 2015 영어과교육과정기본어휘목록개발사례는초등과중등영어어휘더나아가성인국어기본어휘선정에필요한말뭉치구축은물론어휘선정방식에중요한시사를제공하고있다. 2) 어휘목록 어휘목록의기원은기원전 년현재의이라크지역에자리잡았던수메르인의문자체계로거슬러올라간다. 이문명의유물중쐐기문자가세겨진경판에기록된문자중 15% 가어휘목록이었다 (Gnanadesikan, 2009: 15). 그리고나머지 85% 는행정과회계에관련한문자였다. 지금까지알려진최초의핵심어휘에초점을둔어휘목록은 16세기에들어서면서나타난다. 런던에서불어를가르치던클라디우스홀리밴드 (Claudius Holyband) 는 The Schoolmaster와 The Littleton이라는대표적인외국어서적을집필한다. 두권의책모두에는주제별로정리된상당한양의어휘목록이포함되어있었다 (Howatt & Widdowson, 2004: 27). 이어휘들은주로상황중심의대화내용에초점을두고있었다. 이책들은현대의언어교재와마찬가지로학교, 가정, 여행, 비즈니스등의주제로구성되어있다. 비즈니스에관련한어휘는어린학습자에게는부적절할수있다. 사실 Nation(1990: 20~21) 은이와같은직관적인어휘목록은실제빈도기반으로제작된어휘목록과비교할때상당한문제가있다고지적한바있다. 하지만홀리밴드의수업을듣던학생들은대부분상인들의자제들로그의책이나어휘목록은수요자의요구를충족시켰다. 즉 ESP의입장에서수요자의요구에부합하는어휘목록이었다. 1588년에는티모데브라이트 (Timothe Bright) 가속기에관련한도서를영어로출판하였는데이책에는 559개어휘로구성된목록이포함되어있었다. 그리고이어휘들은핵심어휘의의미에초점을두고개발되었다. 웨스트파머 (West Palmer) 와오그덴 (Ogden) 은후에이러한주요의미를커버하는것을핵심어휘선정기준으로제안하기도하였다 (Richards, 1974: 73~75). 17세기에는혁신적인라틴어교사였던요한아모스코메니우스 (Jan Amos Comenius) 가외국어학습에있어 4단계의교육과정을개발 제안하였다 (Howatt & Widdowson, 2004: 47). 코메니우스교육과정개발의첫번째단계는일상생활의 54

68 Ⅱ. 기초연구 간단한대화에서활용하기에충분한몇백개의어휘로구성된목록을개발하여야한다는것이다. 두번째단계는교육적으로가치가있고학습자의자발적인관심을이끌어낼수있는수준별교재에포함된 8,000개정도의어휘를초점을두고지도해야한다는것이다. 세번째와네번째단계를위한교재는스타일, 어법, 번역등을위한것이었지만코메니우스는이교재들을완성하지는못했다. 대신그는 Orbis Sensualium Pictus라는이중언어 (bilingual) 그림사전을출간하였다. 요즘과는달리이러한그림사전은이시기에매우독창적인발상이었다. 코메니우스는이교재를토론수업중심으로개발하고그핵심어휘에학습의우선순위를두었다. 그는어휘를나름대로등급화하였고가급적불필요한저빈도어휘는사용하지않으려했다. 이는핵심적인어휘에먼저초점을두고어휘학습의양을몇천단어까지확대해나가는현대의어휘교육과도일맥상통한다. 1755년에는사무엘존슨 (Samuel Johnson) 이 Dictionary of the English Language 을제작하는데이는일종의어휘목록으로이해될수있다. 그는 1750대의실제적문어표현을그대로발췌하려고하였다. 그당시만해도구어적표현은단어의발음정도만정리하는데머물고있었다. 그는말뭉치를기반으로하지는않았지만실제적표현을그대로발췌함으로써사전에수록된표현의실제성을확보하였다 (Howatt & Widdowson, 2004: 110~116). 존슨의사전은 45,000개의기본형을수록하였고 19세기에이르러 1828년에는노아웹스터 (Noah Webster) 가존슨의사전을 70,000단어까지확대수록하였다. 이후문법번역식교수법이 18세기후반부터 19세기초독일에서주요교수법으로자리를잡으로면서어휘목록활용도가함께증대되었다. 그러나문법번역식교수법에서는어휘선정에있어의사소통의유용성보다는문법구조의설명에필요한어휘를보다중요하게고려하였다 (Zimmerman, 1997: 6). 이에따라 1870년대 Berlitz가직접식교수법을전파하기전까지의사소통을위한구어표현이나어휘는경시되는경향을보였다. 그러나 19세기후반토마스프렌더개스트 (Thomas Prendergast) 는광범위한의사소통기능을커버할수있는한정된수의어휘목록을구성하였다. 그가구성한 214개의핵심어휘중 82% 는 Thorndike- Lorge(1944) 의어휘목록중가장빈도가높은어휘에포함되어있다. 나머지 14% 또한상위빈도 1,000단어안에포함되어있다 (Howatt & Widdowson, 2004: 176). 토마스프렌더개스트는독어, 불어, 스페인어, 라틴어, 희랍어에도동일한기준을적용하여언어별어휘목록을개발하였다. 그러나 19세기까지의어휘목록은개발자의직관에바탕을두고개발되었다. 당시에는여전히어휘의빈도를산출하여어휘를선정하는것이쉽지않았다. 실제객관적인기준을적용하여어휘를선정하는방법은당시의교육자들에게는생각하기도힘든아이디어였다. 그럼에도불구하고몇몇연구자들은작은규모이기는하 55

69 국어기초어휘선정및어휘등급화를위한기초연구 지만빈도를산출하여어휘를선정하는프로젝트를시작하였다. 1837년에피트먼 (Pitman) 는속기시스템을개발하면서 10,000개의어휘로구성된목록을만들었고바로직전인 1820년에는프리먼 (Freeman) 이성인학습자들위한 20,000개의단어로구성된어휘목록을말뭉치를기반으로개발하였다 (McArthur, 1998: 51~52). 1904년, 영국에서는놀스 (Knowles) 가맹인들을위한읽기시스템을개발하기위해 10만개단어의어휘목록을구축하였고이중 353개단어는전체영어읽기의 75% 를커버한다고주장하기도하였다 (McArthur, 1998: 52). 19세기말에는교육개혁운동과함께언어교육에서구어교육의중요성이증대되었다. 이는앞에서언급한듣기, 말하기와같은기본적인의사소통에초점을둔직접식교수법출현의계기가되었다 (Schmitt, 2000: 12). 1902년벨기에에서직접식교수법에기반한영어교육을시작하면서영어교육의효율성을위해빈도가가장높은어휘를먼저학습하는방법이헤롤드파머 (Herold Palmer) 에의해제안되었다 (Palmer, 1936: 371). 하지만어휘선별시활용되는말뭉치구성의불균형또는주관성의논란으로인해그의어휘선정은비판을받기도하였다. 이러한문제는 20세기 Thorndike & Lorge(1944) 의어휘집 The Teacher s Wordbook of 30,000 Words 개정판에서도여전히문제로지적되었다. 1930년에오그덴은소위 British American Scientific International Commercial(BASIC) English라는 850개로구성된어휘목록을출간하였다. 오그덴은 BASIC이국제적인의사소통의수단으로그역할을충분히수행할수있다고주장하였다. 그러나 West, Swenson, Fawkes, Russell과 de Magellanes Wilf(1934) 는 BASIC에대하여오그덴은 BASIC이일주일또는최대한달이면모두학습할수있는제한된수의어휘목록이라고강조했지만그것은어휘목록에포함된많은다의어를고려한지않은것이라고지적하였다. 실제 Fries & Traver(1960) 의분석에따르면오그덴의 BASIC은 850개의어휘로구성되어있지만그어휘들은무려 12,425개의다양한의미를지닌것으로나타났다. 따라서 850개의어휘형태는한달안에학습할수있을지는모르지만그어휘의모든의미를그시간안에학습하는것은불가능하다고주장하였다. 20세기중후반에이르러말뭉치분석을활용한어휘목록개발의시도가지속적으로나타난다. 기존의시행착오를거쳐 1953년에는드디어웨스트에의해영어권말뭉치기반어휘목록의고전이라고할수있는가장대표적인어휘목록인 General Service List(GSL) 이개발되었다. 다음의 < 표 21> 은 GSL을포함하여최근까지개발된대표적인말뭉치분석기반영어어휘목록을정리한것이다. 56

70 Ⅱ. 기초연구 < 표 21> 말뭉치분석기반영어어휘목록 어휘목록 / 개발자 ( 연도 ) GSL(General Service List)/ West(1953) AWL/Coxhead(1998, 2000) BNC 14000/Nation(2004) BNC-COCA 25000/Nation & Webb(2011) NGSL(New General Service List)/Browne(2013) NGSL/Brezina & Gablasova(2013) 어휘목록 규모및단위 2,000 어휘군 어휘선정기준 활용말뭉치 빈도 어휘군 빈도, 사용범위, 산포도 14,000 사용범위, 빈도, 어휘군 산포도 25,000 빈도, 어휘군 사용범위 2,818 산포도, 사전등재형 표준빈도지표 2,494 사전등재형 빈도, 평균압축빈도 Academic Corpus BNC Spoken BNC COCA CEC LOB BNC BE06 EnTenTen12 GSL은최초로말뭉치의어휘빈도를체계적으로분석하여개발한어휘목록이다. 총 2,000단어로구성된 GSL은 Thorndike & Lorge(1944) 가분석한말뭉치의어휘빈도정보를활용하여개발하였으며 2009 영어과교육과정기본어휘까지우리나라영어교육과정기본어휘의주축을이룰정도로오랜역사와함께가장보편적으로활용되던어휘목록이다. 일반적으로 GSL을기준으로할때영어의 2,000단어 ( 어휘군 ) 는문어에서 80%, 구어에서 90% 이상을커버하는학습효율성을담보하는핵심어휘라고말한다 (Nation, 2001). 이러한이유로최근까지도이 GSL을개정하려는여러시도가있었다. Dickins(n.d.) 는웨스트의 GSL를바탕으로 Longman Lexicon of Contemporary English(LLCE, McArthur, 1981) 의의미분류기준을적용하였다. 의미의분류는품사변화를기준 ( 사전등재형기준, 문법적변화형을모두포괄하는대표형 ) 으로하였으며 [ 그림 5] 과같이 2,000단어를각세부의미로나누고그빈도비율의정보를제시하였다. [ 그림 5] Dickins 의 GSL 예시 57

71 국어기초어휘선정및어휘등급화를위한기초연구 [ 그림 5] 에서보듯 'able [Y]' 은어휘군의표제어 ( 기본형, 대표형 ) 를의미하고이어휘군은 'able x' 과 'ability x' 라는사전등재형 (lemma) 으로구분되며각어휘의전체사용정도를 100% 라고할때세부의미별사용비율은 89% 와 11% 그리고 58%, 40%, 2% 라는것을의미한다. K열은각분류항목에따른세부의미를제시하고있다. 이밖에도소위 New General Service List(NGSL) 라는이름으로두개의어휘목록이추가로개발되었다. 2013년브라운 (Browne) 는 Cambridge English Corpus(CEC) 의하위말뭉치에서여러영역을균형있게선별하여총 2억 7천만단어의말뭉치에서 2,818개의사전등재형을추출하고이를 NGSL이라명명하였다. 이 NGSL 개발에는여러말뭉치의크기를균일하게하여특정영역의말뭉치가가지는언어적특성을최대한배제하려고노력하였다. 하지만언어적으로오류가많은학습자말뭉치를어휘목록개발에포함한것은보편타당한기초어휘를선정하고자한 NGSL의개발취지에는부적절하다고판단된다. NGSL의어휘의선정에는 100만단어별어휘의추정빈도 (/million) 즉, 산포도와 Carroll, Davies & Richman(1971) 이제시한표준빈도지표 (Standard Frequency Index) 를적용하였고이후고유명사, 약어, 은어, 요일, 달, 숫자등은제외시킨뒤, 전문가그룹과의토의를거쳐기존의주요어휘목록과비교하여추가할어휘와제외할어휘를최종결정하였다. 같은해인 2013년에는또다른 NGSL이브레지나 (Brezina) 와가블라소바 (Gablasova) 에의해개발되었다. 이 NGSL의개발에는 4개의말뭉치가사용되었고이들말뭉치의총크기는 121억단어의말뭉치자료가사용되었다. 전체말뭉치에서구어자료의양은미미하여문어적인색채가다소짙고어휘선정의기준에는 4개의말뭉치에각각나타는품사별어휘의빈도와평균압축빈도 (Average Reduced Frequency, ARF) 8) 를사용하였다. ARF는크기가다양한말뭉치에서어휘의보편성을고려하여어휘를선정할때효과적인기준이다. 그리고어휘목록개발에서고유명사와알파벳은제외되었다. 지금까지는 GSL에기반한어휘목록을살펴보았고 2,000단어수준을넘어서는대규모의어휘목록으로는 Nation(2004) 의 BNC 14000을들수있다. 1억단어로구성된 British National Corpus(BNC) 의 10% 는구어자료인바, 네이션은 1000만단어의구어말뭉치에서 14,000개의어휘군 9) 을추출하였다. 그리고이를 1,000개의어휘군단위로나누어 14개등급으로세분화하여제시하였다. Nation(2001) 에따르면영어원어민화자는자연스러운언어노출을통해 1년에 8) ARF 는특정단어의출현빈도로말뭉치를구성하는단어수를나누고그값을구간수로하여그구간중그특정단어를포함한구간의숫자를산출한후그평균값을구한수치이다. 이는비교하고자하는말뭉치간규모의차이가클때사용되는절대빈도이다 (Hlaváčová, 2006). 9) 에서다운로드가능하다. 58

72 Ⅱ. 기초연구 약 1,000개의어휘군을습득한다고한다. 이러한이유로어휘목록은 1,000개의단어를한개등급으로구분되었으며한개의등급은동일한수준으로간주된다. BNC 14000의특징으로는국가명과그나라의국민이나언어를가리키는어휘는어휘목록에포함되어있으나사람의고유한이름과도시이름, 로마자, 감탄사등은예외적인어휘목록으로 14,000단어와는별도로구성하였다. 이어휘목록이주목받는주요이유중하나는어휘목록개발에가장우선하여적용된어휘선정기준이빈도가아니라여러말뭉치를적용할경우하나의어휘가얼마나다양한말뭉치에서사용되고있는지를측정하는수치인사용범위이기때문이다. 대부분의어휘목록은빈도를첫번째어휘선정기준으로적용한다 (Nation, 2001). 그것은빈도가가지는노출의기회와높은빈도가말해주는유용성에대한전통적인믿음에서비롯되었다. 실제로, 빈도를최우선순위로두었을때텍스트포괄범위는가장높게나타난다 ( 신동광, 2011). 그럼에도불구하고네이션은 BNC 어휘목록개발시에한어휘가얼마나다양한텍스트에서사용되는지를측정하는사용범위를총사용빈도보다우선하여적용하였고마지막으로한단어가각텍스트에서얼마나일정빈도이상으로사용되는지를측정하는산포도 (dispersion, spread frequency) 를추가하여적용하였다. 이는단순한텍스트포괄범위의수치보다는특정영역에국한되지않고보편적으로사용될수있는어휘를우선하여선정하고자했기때문이다. 하지만네이션은 BNC 14000이영국말뭉치만을사용하여개발하였기때문에미국영어와는다소차이가있다는것을인식하고있었다. 이러한 BNC 14000의한계를극복하기위해 2011년네이션과웹 (Webb) 은영국영어를대표하는 1억단어의 BNC와미국영어를대표하는개발당시 4억 5천단어의 COCA에나타난어휘빈도와분포통계를통합하여 25,000개의어휘군목록 10) 을개발하였다. 이는미국영어와영국영어자료를모두적용하여개발하였다는점에서의미가있다. 그리고 1,000단어단위의등급으로구성된 25개의어휘목록중상위 2개등급즉, 상위 2,000개의어휘군은 BNC-COCA가아닌별도의말뭉치를구축하여개발하였다. GSL의소개에서도언급한바와상위 2,000단어는학습의기본이되기때문에중요한의미를가진다. 하지만두개의대규모말뭉치를합친다는것이기초어휘의대표성을보장하는것은아니다. 좀더기초적인일상적인 2,000개의어휘를산출하기위해네이션과웹은이 2,000개의어휘목록개발을위해구어와문어를 6:4 로구성한총 1,000만단어의말뭉치를새로구축한다. 이말뭉치에는전화표현이나영화및 TV와같이일반적이고쉬운구어자료를문어자료에비해상대적으로더많이포함시켰다. 또한문어자료의경우에도아이들을위한쉬운언어자료를 10) 에서다운로드가가능하다. 59

73 국어기초어휘선정및어휘등급화를위한기초연구 포함시켰다. 따라서순수한 BNC-COCA 어휘는 3,000단어수준부터라고할수있다. 또한 BNC-COCA 25000은 25,000단어외에 3,000개의합성어, 로마자, 고유명사등을별도의어휘목록으로구성하였다. 결과적으로 BNC-COCA 25000은가장최근에개발된대규모의등급화된일반영어어휘목록이라고할수있다. 일반적인영어어휘의사용을대표하는목록이 BNC-COCA 25000이라면특수목적을위해개발된, 특히학술목적을위해개발된어휘목록의대표는 Coxhead(1998, 2000) 가개발한 Academic Word List(AWL) 를들수있다. 콕스헤드 (Coxhead) 는 AWL을개발하기위해약 3백 5천만단어의 Academic Corpus 를구축하였다. Academic Corpus는크게 4개대영역 (Arts, Commerce, Law, Science) 으로세분화되고각대영역은 7개의대학전공 ( 예-Arts: Education, History, Linguistics, Philosophy, Politics, Psychology, Sociology) 으로다시구분된다. 즉 AWL 개발에는 28개의대학전공자료가사용되었다. 이자료는학술지저널, 전공교재, 실험매뉴얼, 학생노트등을포함하고있다. 어휘선정기준으로는빈도, 사용범위, 산포도를적용하였다. 먼저일반영어어휘를제외하기위해 GSL에포함된최상위 2,000단어는목록에서삭제한후 Academic Corpus에서나타나는최상위빈도의단어를추출하였다. 또한 AWL은 Academic Corpus에포함된 28개의대학전공중최소 15개의교과목에서사용되는어휘이며끝으로 4개의대영역모두에서각 10번이상의빈도를가지는단어라는조건을충족해야한다. 이러한과정을통해콕스헤드는 570개어휘군목록을개발하였다. Nation(2001) 은 GSL이일상생활의기초영어학습에유용한반면 AWL은학술적인영역을보완한다는면에서이상적인조합이라고말한다. 3) 어휘학습량및어휘등급화단위설정 어휘목록개발에서는지금까지살펴본여러요인외에도크게두가지핵심요인을고려할필요가있다. 첫번째는원어민또는외국인학습자의입장에서도달해야할학습의목표, 다시말해총어휘학습량을어느정도로설정하고어휘목록을개발한것인가의문제이다. 두번째는어휘목록을여러등급으로세분화할경우등급의규모를어느정도로설정해야등급별적당한학습량이될것인가에대한문제이다. 다음의두절에서는이러한두가지요인을고찰해볼것이다. (1) 어휘학습량설정 현재까지체계적인연구가부족하기는하지만일반적으로 20 세까지적절한교육 을받은 (well-educated) 영어원어민화자는 20,000 개의어휘군에대한어휘지식 60

74 Ⅱ. 기초연구 을가지고있다고한다 (Nation, 2001). 하지만원어민화자도 20여년에걸쳐원어민의언어환경에서습득할수있는 20,000 단어를학습목표로설정한사례는찾아보기힘들며대개는언어학습에있어어떤목적을가지고있는가가중요한학습목표설정의기준의된다. Hu & Nation(2000) 은언어사용에있어최소한으로알아야할기본어휘량을텍스트의 80% 로보고있으며 98% 이상을알아야사전 (dictionary) 과같은외부의어떠한자료를참고하지않고도문맥에서단어의뜻을유추하며독립적으로글을읽을수있다고주장한다. Francis & Kucera(1982) 는 2,000개의어휘가문어자료 (written text) 에서약 80% 를커버한다고하였고 Schonell, Meddleton과 Shaw(1956) 는 2,000 단어가비공식적인구어자료 (informal spoken text) 에서무려 96% 를포괄할수있다고주장하기도하였다. Nation(2006) 은 British National Corpus(BNC) 에기반한 14 개등급총 14,000개어휘목록을활용하여다양한자료의텍스트포괄범위를분석하였다. 예를들어 슈렉 (Shreck) 이라는애니메이션대본을분석하면텍스트의 98% 이상을커버하기위해서는고유명사를제외하고총 7,000 단어정도가필요하고일반소설에서는 8,000-9,000 단어의지식이요구된다는결과를보여주었다. 이뿐만아니라 Nation은일반적인구어자료에서는 98% 의텍스트포괄범위를확보하기위해 6,000~7,000 단어가필요하다고주장하기도하였다. 아래표에서보듯 98% 의텍스트포괄범위를안정적으로확보하기위해서는문어자료에서 8,000~9,000개의어휘가필요하고구어에서는 6,000~7,000개의어휘를요구된다는것을알수있다. < 표 22> 문자및음성언어에서의텍스트포괄범위비교 (Nation, 2006: 79) 어휘등급 등급수 텍스트 ( 구어 ) 포괄범위 (%) 텍스트 ( 문어 ) 포괄범위 (%) 1st 1, nd 1, rd 1, th-5th 1, th-9th 1, th-14th 1,000 5 < 고유명사 그외 하지만위의분석은영어권원어민화자의언어사용데이터에기반한결과이며 영어를외국어로학습하는한국인의기준에는도달하기쉽지않은학습량이라고볼 61

75 국어기초어휘선정및어휘등급화를위한기초연구 수있다. 현재보편적으로제안되는텍스트포괄범위는 95% 이다 (Read, 2004). 위의표를기준으로하면 5,000 단어 ( 어휘군 ) 수준으로추정할수있다 ( 구어 : 92~98%, 문어 : 89.5~96%). Laufer(1992) 또한영어로강의가진행되는대학교육에서요구되는어휘수는 5,000개로대학교재의개발이나일상적인의사소통, 학문적인과제를해결하기위해반드시필요하다고주장하였다. 그러나우리나라영어과교육과정의기본어휘수는이보다도적은 3,000 단어로설정되어있기도하다. Nation(2001) 에따르면영어를외국어로배우는학습자가일주일에매 50분으로구성된 4시간의영어수업을 5~6년간받을경우약 1,000 시간안팎의영어노출시간이주어지고 1,000 시간의영어수업을통해습득될수있는어휘는약 3,000 단어정도라고한다. 이러한주장에근거한다면우리나라영어과교육과정에서설정한 3,000 단어정도의기본어휘는시간대비학습량으로는적당하다고도볼수있다. 위의사례를국어어휘에그대로적용해보면한국어원어민인우리나라국민의어휘학습목표는어휘군기준으로 9,000 단어, 외국인학습자는 3000~5000 단어정도가될수있을것이다. 국어에서는파생과굴절형을모두포함하는어휘군단위가아닌보통품사가다르면별개의어휘로산정하는사전등재형을어휘단위로보고일반적으로사용하기때문에위의수치는사전등재형수로재산정할필요가있다. 대략한개어휘군이평균적으로 4개의품사즉, 명사, 동사, 형용사, 부사로구성되어있다고가정하고 4배의수를산출하면우리나라국민의어휘학습목표는 28,000개의사전등재형, 외국인학습자는 12,000~20,000개의사전등재형을학습해야구어와문어를포함하여 98% 이상의텍스트포괄범위를확보할수있을것으로추정된다. 다만이또한대표성이있는국어말뭉치의텍스트포괄범위 (95~98%) 를분석해야만정확한어휘학습량설정이가능할것이다. (3) 어휘등급화단위설정 최근에개발된영어어휘목록 ( 예, BNC-COCA 25000) 의등급은 1,000개 ( 어휘군 ) 를한등급의단위로설정하고있다. 그이유는영어원어민의경우, 자연스러운언어노출에따라 1년에약 1,000개단어를습득한다고보고이 1,000개단어는동일한수준으로간주하기때문이다 (Nation, 2001). 하지만연간어휘습득량과교육을목적으로한어휘등급규모가항상일치하는것은아니다. 이는개인별발달차이나여러변인들을고려해야하기때문에실제학습을목표로하는어휘등급의규모는실제이론으로제시된기준보다는작게설정되는것이일반적이다. 대체로학습자의연령이낮을수록학습량은적게설정한다. Stemach & Williams(1988) 은기존에구축된다양한아동말뭉치연구 (Hopkins, 1979; 62

76 Ⅱ. 기초연구 Murphy, 1957; Moe, Hopkins & Rush, 1982; Wepman & Hass, 1969) 데이터를활용하여 2,500개의아동용어휘목록을개발하였다. 이어휘목록은어휘의빈도정보를바탕으로 10개의등급으로구분되었고각등급은 250개의어휘로구성되어있다. 스테마치 (Stemach) 와윌리엄스 (Williams) 는이중상위 2개등급즉 500개의어휘는초등 1학년학생의구어사용에서 85% 를차지한다고주장하였다. 이는현재우리나라초등영어과교육과정에서제시하고있는교과서개발어휘사용지침과도거의일치한다. Gyllstad, Vilkaité & Schmitt(2015) 또한실제출판사들의수준별교재 (graded reader) 의등급구분이 500개미만의어휘단위로되어있으며이는학습수준을구분짓는어휘등급의단위로서 1,000개의어휘는너무많다는점을지적하였다. Gyllstad, Vilkaité & Schmitt(2015) 에따르면 Cambridge Discovery Reader 시리즈의경우, Starter: 250개어휘, Grade 1: 400개어휘, Grade 2,800개어휘, Grade 3: 1,300개어휘, Grade 4: 1,900개어휘, Grade 5: 2,800개어휘, Grade 6: 3,800개어휘로등급을구분하고있다. 우리나라의 2015 영어과개정교육과정기본어휘는크게 3개등급으로구분되어있다. 그 3개의등급은 800개의초등권장어휘, 1,800개의중등일반선택권장어휘 ( 누적 2,600개 ), 400개의진로 전문교과Ⅰ 권장어휘로총 3,000개의어휘가기본어휘로설정되어있으며학년별또는학년군별로다음의표와같이사용어휘수를통제하고있다 ( 이문복 신동광, 2015). 또한교과서개발시에는지정된어휘제한수에따라 3개의등급의권장어휘풀에서해당등급어휘의 90% 이상을사용하도록규제하고있다. 다만고등학교진로선택및전문교과Ⅰ부터는학년별권장어휘중 80% 이상을사용하여교과서를개발하도록일부완화하여적용하고있다. 고등학교 < 표 23> 2015 영어과교육과정과목별어휘수 학년군 / 과목명 어휘수 초등학교 초등학교 3 4 학년군 240 내외초등학교 5 6 학년군 500 내외 중학교 중학교 1 3 학년군 1,250 내외 공통 영어 1,800 내외영어회화 1,500 이내 영어 2,000 이내 일반선택 영어독해와작문 2,200 이내 영어Ⅱ 2,500 이내 실용영어 2,000 이내 진로선택 전문교과 Ⅰ 영어권문화진로영어영미문학읽기심화영어회화Ⅰ 심화영어회화 Ⅱ 심화영어Ⅰ 심화영어Ⅱ 심화영어독해 I 심화영어독해 II 심화영어작문 I 심화영어작문 II 2,200 이내 2,500 이내 3,000 이내 1,800 이내 2,000 이내 2,500 이내 2,800 이내 3,300 이내 3,500 이내 2,000 이내 2,300 이내 63

77 국어기초어휘선정및어휘등급화를위한기초연구 위의표에서볼수있듯이교과서간의어휘차이는 500개미만으로 Gyllstad, Vilkaité & Schmitt(2015) 의조사와일치하는것을확인할수있다. 끝으로다독재단 (Extensive Reading Foundation, ERF) 에서제공하는다독교재의어휘등급을보면다음과같다 (ERF, n.d.). [ 그림 6] ERF 의어휘등급척도 ERF는영어원어민화자의수준을최상위수준의단계로하여총 7개의등급으로구분하고각등급을다시수준별로 3~4개 ( 예, Early, Mid, High) 까지세분화하고있다. 7개등급의총누적어휘수는 ,500-2,400-4,500-12,000-18,000이며등급간어휘수증가는 ,100-7,500-6,000로점진적으로확대되는것을볼수있다. 지금까지살펴본어휘등급규모의사례를종합하면 250~500개의어휘가현실적인어휘등급의단위로적당하다고판단되며사전등재형으로어휘단위를변환하여추정하면 500개어휘군을기준으로할때 2,000개의사전등재형, 250개의어휘군으로기준으로하면 1,000개의사전등재형으로등급을구분할수있을것으로판단된다. 그러나실제우리나라국민의어휘지식의규모를연령별로측정해야연간한국어원어민학습자의어휘습득량을확인할수있고이를바탕으로최종적인어휘등급의규모등도확정될것이다. 64

78 Ⅲ. 말뭉치구축 이장에서는기초어휘선정및어휘등급화에사용되는어휘목록을추출하기위한말뭉치의고려사항을제시하고, 현재구축한현황및보완계획을제시한다. 먼저, 말뭉치를실제구축하는과정에서얻게된실험결과를토대로장르에대한고려와시간 / 연대에대한고려사항을파악하였다. 다음으로, 당해연도에구축한말뭉치의현황을보이고이말뭉치의어휘목록추출의신뢰도와타당도를높이기위한보완계획을마련하였다. 1. 장르에대한고려 기초어휘에포함되는단어는다음의 3 가지조건을충족시켜야한다. 1 빈도 : 자주쓰여야한다. 2 범위 : 장르면에서널리쓰여야한다. 다양한장르에서쓰여야한다. 3 산포도 : 장르면에서골고루쓰여야한다. 특정장르에만편중되지않고, 여러장르에서고른빈도를보여야한다. 1의조건을충족시키는단어들을알아내기위해서는대규모말뭉치가필요하다. 단어뿐아니라어떤것이든통계적으로신뢰할만한수치를얻을수있으려면, 연구대상이되는사건이일정수준이상의빈도로출현해야한다. 너무낮은빈도는통계적으로신뢰할수없다. 문제는단어의빈도분포가극도로편중되어있어서, 극소수의단어가말뭉치의대부분을차지하고, 나머지단어들은매우낮은빈도로만나타난다는사실이다. 본사업에서사용한말뭉치에서빈도 1위부터 100위까지의단어에대해, 순위를가로축에, 상대빈도를세로축에표시하면다음그래프와같이된다. [ 그림 7] 순위 - 빈도그래프 65

79 국어기초어휘선정및어휘등급화를위한기초연구 1위에비해 2위는빈도값이거의절반으로떨어지고, 순위가내려갈수록비슷한식으로빈도가급격히낮아져서, 금세수평선에가까운형태가된다. 어느말뭉치든순위-빈도그래프를그려보면대개이와비슷한모양이된다. 이것은 Zipf의법칙으로잘알려져있다. 이렇게말뭉치에나타나는단어의대다수가저빈도어이므로, 이런저빈도어에대해서도통계적으로신뢰할만한수치를얻기위해서는말뭉치의규모가엄청나게커야한다. 그러려면말뭉치의규모가도대체어느정도되어야하는가하는질문에대해서는아직뚜렷한정답이나와있지않고연구목적에따라대답이달라질수있으나, 1억어절정도의말뭉치로도부족하다는것이중론이다. 최근연구경향은최소한 10억어절이상의말뭉치를사용하는추세이다. 그런데말뭉치의크기가단순히큰것만으로는부족하고, 2와 3의조건을충족시키는단어들을알아내기위해서는말뭉치가다양한장르로구성되어있어야한다. 장르를몇개로어떻게나눌것인가에대해서도논란이많고아직정설이확립되어있지는않다. 이상적으로는, 전국민의언어사용실태를조사하여, 일상생활에서면대면대화가몇퍼센트, 일방향적인강의 연설등을듣는것이몇퍼센트, 신문을읽는것이몇퍼센트, 소설을읽는것이몇퍼센트, 텔레비전드라마를시청하는것이몇퍼센트, 하는식으로장르의비중을조사하여이에맞게말뭉치의장르의비중을정하면좋을것이다. 그러나그러한조사가제대로시행되지않았을뿐더러, 그런장르비중을객관적으로조사할수있는지조차도의문이다. 이런상황에서말뭉치의장르비율이어떠해야한다는원칙을미리정해놓고이에따라말뭉치를구축하는방법론 [ 하향식접근 (top-down approach)] 보다는, 우선쉽게사용 접근 수집할수있는자료들을모아서말뭉치를구축하고이로부터얻어진결과를바탕으로말뭉치의장르비율을조정하는방법론 [ 상향식접근 (bottom-up approach)] 이더현실적이라고생각된다. 본연구에서는이러한상향식접근법에따라우선가용자원부터수집하여정리하였다. 가장먼저이용할수있는대표적인말뭉치는세종말뭉치이다. 세종말뭉치가운데서도가장규모가크고다양한장르로구성되어있는현대문어말뭉치를사용하였다. 그다음으로는출판사에서편집용으로제작한도서자료들을수집하였다. 셋째로는인터넷을통해신문, 잡지, 드라마, 블로그, 위키백과등의자료를수집하였다. 잡지와블로그는다양한분야의것들이있기때문에, 그자체로서장르의다양성을확보하는데크게기여할수있다. 이렇게해서총 100개장르로이루어진약 20억어절규모의말뭉치를구축하였다. (Ⅲ. 3. 참조 ) 66

80 Ⅲ. 말뭉치구축 2. 시간 / 연대에대한고려 말뭉치를구성하는텍스트들이어느시기의것인가도중요한고려사항이다. 시기에따라단어의사용빈도에차이가있다면더더욱시기에대한고려가필요하다. 신문말뭉치는 1990년부터 2015년까지연도별로구분되어있어, 이시기동안의시간적빈도추이를살펴볼수있다. 빈도순위가시기에따라달라질수도있기때문에시기별변화추이에대한고찰이필요하다. 이를위해신문말뭉치에서총빈도가 1,000,000 이상인단어 118개를뽑아서연도별빈도를추출하였다. 1위단어인지정사 이다 의경우만표로제시하면다음과같다. < 표 24> 신문말뭉치연도별빈도통계 : 지정사 이다 의경우 연도 절대빈도 말뭉치크기 상대빈도 위부터 5 위까지에해당하는지정사 이다, 의존명사 것 01, 복수접미사 들 09, 보조용언 있다 01, 의존명사 등 05 만을대상으로하여연도별빈도추이를그래프 로그려보면다음과같다. 67

81 국어기초어휘선정및어휘등급화를위한기초연구 절대빈도든상대빈도든순위를알아보는데에큰차이는없다. 1위와 2위는순위변동이거의없지만, 3위와 4위는시기에따른순위변동이있다. 초기에는보조용언 있다01 이접미사 들09 보다빈도가높다가, 후기로가면서이둘의순위가뒤집힘을볼수있다. 2위 것01 과 3위 들09 의경우, 순위가뒤집히는정도까지는아니지만, 최근으로올수록둘사이의격차가좁혀짐을볼수있다. [ 그림 8] 연도별빈도최상위 5 개단어의절대빈도추이 [ 그림 9] 연도별빈도최상위 5 개단어의상대빈도추이 68

82 Ⅲ. 말뭉치구축 일정한시간적범위를설정해놓고그시기전체에서의빈도를바탕으로하여어휘를선정할때와, 그범위중특히최근에해당하는짧은기간을바탕으로하여어휘를선정할때결과가달라질수있다는사실을알수있다. 이는기초어휘선정작업에도시사하는바가크다. 기초어휘선정의목적에따라선정작업의기초가되는말뭉치도상당히달라야한다. 만약 20세기초부터지금까지의꽤넓은시간폭을갖는현대국어를대상으로하여기초어휘를선정한다고하면, 20세기전반기나중반기의자료를말뭉치에포함하는것이타당할것이다. 반면에미래지향적으로앞으로의국어정책, 국어교육등의목적을위해기초어휘를선정한다고하면, 20세기전 중반기의자료는현재의언어사실과사뭇다를가능성이있기때문에말뭉치에포함하지않는편이나을것이다. 후자의목적을중시한다면현재에가까운자료를가능한한많이넣고, 현재로부터시간적으로거리가있는자료일수록아예안넣거나넣더라도적은양을신중하게넣어야할것이다. 이런점을고려하면세종말뭉치를그대로사용하는것은문제가있을수있다. 세종말뭉치에포함된텍스트는 1990년대의신문, 잡지, 도서가주종을이루고있으나, 소설같은경우시대가훨씬올라가는작품들도꽤수록되어있다. 본사업에서사용한도서말뭉치도 1980~90년대자료가주종을이루고있다. 1980~90년대자료를말뭉치에서아예빼지는않더라도시기별균형을맞추려면최신자료의양 / 비중을대폭늘릴필요가있다. 본사업에서최근의신문과잡지를대량수집한것도그런취지에서긍정적인역할을할것으로기대된다. 신문의경우한국언론재단에서구축한자료및이를바탕으로한본사업의신문말뭉치가 1990년부터최근까지두루있기는하지만, 최근자료의양이비교적많다. 앞으로신문, 잡지뿐아니라최신자료를보다폭넓게수집할수있는방안을강구할필요가있다. 69

83 국어기초어휘선정및어휘등급화를위한기초연구 3. 말뭉치구축현황 등급화된어휘목록을추출하기위해서는실제언어생활의다양한측면을포착할수있는말뭉치가필요하다. 이말뭉치는고빈도어뿐아니라저빈도어도포함할수있도록규모가커야하고, 다양한주제 분야의어휘를포괄할수있기위해여러장르를망라해야한다. 이러한목적을달성하기위해가장이상적인방법은, 상당수의국어화자들을대상으로하여일상생활에서어떠한방식으로의사소통하고어떤매체를얼마나오랫동안 / 자주접하는지, 즉언어사용실태를광범위하게조사하여한국인의언어생활에서각장르가어느정도의비중을차지하는지알아낸뒤, 이장르비율을바탕으로말뭉치를구축하는것이다. 그러나이러한조사를체계적이고정확하게수행하는데에도시간과비용이많이들고, 그러한조사가이루어진다하더라도그조사결과얻어진장르비율을충실히반영하는말뭉치를구축하는데에도많은시간과비용이소요될것이다. 따라서, 실행가능한차선책은, 우선시간과비용을많이들이지않고수집할수있는여러장르의텍스트자료를가능한한폭넓게수집하여이를바탕으로등급화된어휘목록을추출한뒤, 이어휘목록이질적방법으로구축된기존어휘목록과비교하여어떤문제점이있는지파악하여, 그문제점을보완할수있도록말뭉치를보완하는것이다. 이러한전제하에, 본연구에서는아래와같이말뭉치자료를수집하고정리하였다. ➀ 이미구축되어공개된대규모말뭉치를최대한이용하였다. 21세기세종계획에서구축된현대문어원시말뭉치가이에해당한다. 현대구어말뭉치, 형태분석말뭉치등은규모가작아서일단제외하였으나, 1차년도의결과를검토한뒤차년도의작업에서포함시킬수있다. ➁ 인터넷에서웹크롤링기법을이용하여자동수집할수있는자료를폭넓게수집하였다. 드라마 시나리오, 신문, 잡지, 블로그등이이에해당한다. ➂ 출판사에서출판과정에서만든편집용파일, PC 통신등에서연재된소설등의각종도서자료를폭넓게수집하였다. 70

84 Ⅲ. 말뭉치구축 수집된자료를장르별로정리하여규모를제시하면아래와같다. 종류내용비고 세종말뭉치 21세기세종계획현대문어원시말뭉치 < 표 25> 말뭉치전체통계 장르 수 어절수 용량 (MB) 신문, 소설제외 10 32,407, 도서말뭉치 국내출판각종도서 세종말뭉치의소설을여기의소설에합침 ,730,053 1,640 잡지말뭉치 인터넷서비스되는잡지 34종 성격이비슷하고분량이작은것은한데묶음 ,273,167 3,344 블로그말뭉치 네이버, 알라딘, LG CNS 네이버 : 35 개장르 222 개파워블로그알라딘 : 72 개블로그 ,628,059 2,642 드라마말뭉치 드라마대본, 영화시나리오 1 39,314, 신문말뭉치 한국언론재단에서제공하는신문기사 11 개신문 1990~2015 년기사, 세종말뭉치의신문을여기에합침 1 961,256,124 17,849 위키백과한국어위키피디아 1 166,040,163 1,775 방송뉴스 SBS 뉴스 ~10 월 1 18,919, 계 100 2,045,568,303 29,197 신문말뭉치에포함된 11개신문은경향신문, 국민일보, 내일신문, 동아일보, 문화일보, 서울신문, 세계일보, 조선일보, 중앙일보, 한겨레신문, 한국일보이다. 세종말뭉치, 도서말뭉치, 잡지말뭉치, 블로그말뭉치는장르별로세분할수있다. 이네말뭉치의장르별통계는다음과같다. < 표 26> 세종말뭉치장르별통계 코드 장르 어절수 12 잡지 7,060, 책-총류 1,855, 책-교육 4,240, 책-체험 3,142, 책-인문 5,032, 책-사회 2,526, 책-자연 1,391, 책-예술 2,840, ,14,15,19 기타출판물 1,813,490 21~29 대화 ( 희곡, 회의 ) 2,494,383 계 32,397,263 71

85 국어기초어휘선정및어휘등급화를위한기초연구 < 표 27> 도서말뭉치장르별통계 장르 어절수 장르 어절수 건강의학 13,520,110 시집 1,643,696 과학 3,923,733 신화 769,919 교양 8,495,989 심리 534,116 기독교 822,506 역사 10,933,587 기타 54,348,232 영어 843,123 문화 6,027,327 영화 344,617 법률 839,672 요리 1,324,929 불교 1,380,352 음악 814,238 소설 _ 역사 8,745,935 잡지 372,444 소설 _ 일반 45,703,533 지식 4,705,155 수필 1,667,516 지혜 4,621,911 시공디스커버리총서 1,032,816 컴퓨터 314,668 계 173,730,124 대학학보 28,665,696 지방지 11) 19,123,996 < 표 28> 잡지말뭉치장르별통계 제목 어절수 제목 어절수 프레시안 90,976,514 우먼센스 6,603,139 매경이코노미 70,107,812 ㅍㅍㅅㅅ 6,320,907 시사저널 46,314,682 기독교잡지 기독교사상 5,895,114 씨네21 29,524,004 6,115,736 청어람매거진 220,622 서울대대학신문 5,224,946 트레비 5,725,496 연세대연세춘추 7,450,907 행복이가득한집 5,380,007 고려대고대신문 6,829,818 레디앙 3,411,282 한양대한대신문 2,971,524 1,058,782 좌파매체시민교육센터이대이대학보 6,188, ,372 4,941,436 인천일보 18,660,211 3,813,572 토마토 463,785 민중의소리 1,683,046 딴지일보 14,954,069 컴퓨터월드 3,813,572 과학잡지 과학동아 13,859,979 객석 1,683,046 14,290,268 어린이과학동아 430,289 뉴스위크 1,292,360 이코노미스트 13,980,607 르몽드디플로마티크 1,187,661 시사인 13,901,344 문학신문 1,098,865 월간중앙 13,686,395 쎄씨 698,304 레이디경향 7,307,010 올리브 580,241 계 413,769,785 11) 대학학보와지방지는관점에따라잡지가아니라신문에포함시켜야한다고볼수도있다. 그러나본연구의신문말뭉치에포함된 11 개신문은전국적으로발행되는일간지여서, 대학학보와지방지를여기에포함시키기에는이질적이라고판단된다. 본연구의잡지말뭉치에포함된것들은그종류가매우다양하여, 대학학보나지방지의성격에매우가까운것들도포함되어있다. 이러한성격및발행주기등을고려하여잡지말뭉치에포함시켜둔다. 통계수치를뽑을때는대학학보가하나의장르로간주되고지방지도하나의장르로간주되므로, 이둘이잡지말뭉치에포함 72

86 Ⅲ. 말뭉치구축 < 표 29> 블로그말뭉치장르별통계 장르 어절수 장르 어절수 장르 어절수 영화 9,305,123 원예, 재배 4,761,881 생활공예 3,841,037 음향, 영상 9,141,098 가구, 인테리어 4,642,122 캠핑 3,836,286 네이 버블 로그 스포츠 6,258,676 자필문학, 에세이 4,634,411 네사진 3,814,408 요리 6,247,570 지역, 해외생활 4,622,894 이 공연, 전시, 문화 3,804,911 여행 5,787,029 자동차 4,436,957 버블 차, 커피, 디저트 3,796,392 게임토이, 모형, 수집책 5,526,043 5,515,000 5,465,840 네이버블로그 육아등산, 낚시, 레저일상 4,334,085 4,294,118 4,199,011 로그 웹툰, 일러스트미술, 디자인와인, 술 3,787,565 3,782,002 3,770,214 만화, 애니 5,375,365 교육, 외국어 4,142,060 패션, 뷰티 3,768,092 맛집 5,329,475 애완, 반려동물 3,991,474 시사, 인문, 경제 5,219,988 철도, 항공, 교통 3,940,012 드라마, 방송 5,214,048 과학, 자연관찰 3,899,150 음악 4,834,591 IT, 웹, 프로그램 3,855,726 알라딘 75,370,881 LG CNS 1,082,524 계 245,628,059 본연구에서구축하여어휘등급화에사용한말뭉치의특징은다음과같이정리 할수있다. 1 규모 : 기존의어떤말뭉치보다규모가월등히크다. 2 구성 : 주로문어에한정되어있기는하나, 문어의매우다양한장르를포함한다. 3 시대적성격 : 현대정보화사회에서의국민들의언어생활상의특징을반영하여, 블로그, 인터넷잡지등인터넷매체의최근의텍스트들이대폭포함되어있다. 되어있다는사실은큰의미가없다. 73

87 국어기초어휘선정및어휘등급화를위한기초연구 4. 말뭉치보완계획 본연구에서는이미확보한말뭉치를바탕으로각단어의빈도, 범위, 산포도를산출하고이들변수를바탕으로단어의순위를정한뒤, < 연세한국어사전 > 등의기존어휘목록과비교하는식으로연구를진행하였다. (Ⅳ.1. 참조 ) 특히기존어휘목록과의비교작업을통해현재확보하고있는말뭉치의문제점을알아볼수있었다. 최근에만들어진어휘목록은대개말뭉치를기반으로한것인데, 모든말뭉치는한국어라는모집단을완벽하게대표할수는없고선정된텍스트가무엇인가에따라편향성을가질수밖에없다. 따라서기존어휘목록들이완벽하다고할수는없으나, 여러기존어휘목록을비교함으로써이러한편향성을어느정도는극복할수있다. 또한기존어휘목록중정성적인방법으로만들어진것은, 정량적인방법에의해추출된어휘목록을보완하는역할을할수있다. 즉여러기존어휘목록들에는공통적으로높은순위로들어있는단어가우리의말뭉치에서는나타나지않는다거나나타나더라도매우낮은순위로나타난다면, 우리의말뭉치에심각한결함이있다는증거가될것이다. 그런단어가일정한의미범주에서많이나타난다면, 그의미범주의단어들이흔히나타나는장르가현재말뭉치에서빠져있거나매우과소평가 (under-represented) 되어있다는뜻이될것이다. 그런장르가발견된다면해당장르를보완해야할것이다. 당해연도에는실험을위한기존어휘목록으로서 < 연세한국어사전 > 만을이용했는데, 그외에도다양한어휘목록을사용할필요가있다. < 초등국어사전 >( 두산동아 ), 국립국어원의기초어휘통계조사, 낱말의등급화된어휘목록등을생각할수있다. 질적 양적방법론을함께사용하여구축된이들기존어휘목록과의일치율을높일수있도록노력하고, 일치하지않는부분을찾아서그원인을규명함으로써기존말뭉치의한계와문제점을발견하고보완해나아갈것이다. 현재말뭉치의장르구성도더다듬을필요가있다. 규모가너무작은장르들을비슷한것들끼리묶어서하나의장르로통합할만한것들도있고, 반대로규모가매우크고이질적인것들이섞여있어서나눌만한것들도있을것이다. 규모나내용면에서두개이상의장르로나눌만하다고판단된것들가운데에도, 단어의빈도분포는상당히비슷하게나오는경우가있을수있다. 다변량통계분석을통해단어빈도분포가일정정도이상으로비슷한패턴을보이는장르들을찾아내어하나로통합하는작업을할필요가있다. 현재의말뭉치는문어에매우편중되어있으므로, 앞으로구어장르를대폭보완할필요가있다. 완전한구어의성격을지니는대화는말뭉치로구축하는데시간과비용이많이소요되므로, 대안으로서구어적성격을상당히지니는자료를수집할수도있다. 영화 드라마대사, 인터뷰, 인터넷게시판, 속기록등이그러한예들 74

88 Ⅲ. 말뭉치구축 이다. 이러한점을감안하여말뭉치를 < 표 30> 과같이보완하였다. 12) 아래의보완말뭉치에는구어적성격을어느정도띤텍스트들이많이포함되어있어, 내년도사업에서이것을말뭉치에반영해다시통계작업을할경우, 단어들의순위변동이기대된다. 내년도에는말뭉치의규모를확장하기보다는, 기존 20억어절규모말뭉치로부터얻은어휘목록, 약 9억어절규모의보완말뭉치로부터얻은어휘목록, 그리고기존말뭉치와보완말뭉치를합친 29억어절규모말뭉치로부터얻은어휘목록이 3자을비교하는데초점을맞출것이다. 기존 20억어절규모말뭉치는구어가미미하고문어에치중되어있는반면에, 9억어절규모의보완말뭉치는구어적성격을상당히띠고있는자료이므로, 이것을포함했을때어휘등급에상당한변동이생길수있다. 기존말뭉치를바탕으로한결과에서는낮은등위를차지했던단어가보완말뭉치를바탕으로얻은결과에서는그보다훨씬높은등위로나타난다면, 이들단어는문어보다구어자료에서고빈도로나타나는단어, 즉구어적성격이강한단어임을알수있다. 기존말뭉치와보완말뭉치를합친말뭉치를바탕으로어휘등급화를시행하면, 그결과는문어와구어를적절히아우른결과가될수있을것이다. 이러한작업을거친뒤에도다시정성적으로구축된어휘목록과의비교도할필요가있고연구자들의직관을동원한정성적검토작업을해야한다. 그결과일부단어들이과대평가 (over-represent) 되었다든지일부단어들이과소평가 (underrepresent) 되어있다고판단된다면, 과소평가된단어들의반영비중이높아질수있는방향에서말뭉치보완계획이수립되어야할것이다. 현재까지는인터넷등에서손쉽게구할수있는지여부를바탕으로말뭉치의규모를늘리는작업을해왔으나, 제2차년도의연구결과를바탕으로하여그후에는과소반영된장르를보완하는방향으로작업이진행되어야하며, 이를위해서는말뭉치기반어휘목록에대한정성적검토가향후작업에서이루어져야하는것이다. 12) 통계작업을마친뒤여서, Ⅳ.1. 의통계에는반영되어있지않다. 75

89 국어기초어휘선정및어휘등급화를위한기초연구 < 표 30> 보완말뭉치의구성 대부류 소부류 어절수 비고 블로그 효성 1,808,330 pitchone 407,271 잡지 insight 17,393,051 교수신문 12,417,961 CBS 뉴스쇼 9,274,808 CBS 시사자키 8,431,664 YTN 뉴스투데이 3,702,902 YTN 뉴스정면승부 5,020,996 YTN 당신의전성기 1,059,081 YTN 생생경제 3,325,544 YTN 수도권투데이 1,817,856 YTN 열린라디오 102,093 YTN 출발새아침 7,792,344 MBC 뉴스의광장 826,989 인터뷰 MBC 시선집중 8,536,501 MBC 세계는우리는 6,965,041 SBS 시사전망대 3,981,014 TBS 뉴스공장 1,059,747 TBS 색다른시선 1,274,939 KBS 윤준호입니다 2,992,345 불교방송아침저널 6,147,149 평화방송열린세상오늘 12,276,471 경인방송세상을연다 160,486 YES24 만나고싶었어요 3,263,644 폴리뉴스김능구의정국진단 846,316 위클리피플 1,258,702 국회속기록 최근회의록 7,261,047 다음아고라-정치 382,642,212 클리앙-모두의공원 53,386,055 루리웹 20,081,251 인터넷게시판 보배드림-베스트글 11,109,313 디시인사이드-초개념 9,035,067 mlbpark-today best-불펜추천 4,746,331 뽐뿌 53,548,664 오유 36,392,355 라디오드라마 KBS 한민족방송라디오극장 5,870,321 씨네스트영화 154,743,546 영화 드라마씨네스트드라마 3,388,610 자막곰TV 드라마 26,570,174 신문 동아일보한중대역기사 10,353,263 중국어부분은띄어쓰기가없으므로, 한국어부분만계산해도 1천만어절에가까움 계 901,271,454 기존말뭉치와합치면 29억어절을상회함. 76

90 Ⅳ. 기초어휘선정및어휘등급화 이장에서는말뭉치를기반으로하여기초어휘추출을위한어휘목록선정및등급화에대해논의한다. 이장의구성은크게두부분으로나뉘는데, 먼저 Ⅲ장에서구축한말뭉치를토대로어휘목록을추출하는과정을전반적으로수행한내용을제시한다. 이러한과정에서는어휘목록선정에관여하는변수들간의관계분석, 기존어휘목록과의비교등을통해어휘목록선정에필요한요소들을점검하고파악하였다. 다음으로기초어휘목록선정과등급화를위해구체적논의를진행한다. 본연구에서는등급화대상어휘를일단은기초어휘와비기초어휘라명명하고논의를진행하였다. 특히 1등급기초어휘목록은이론연구와연구진회의를통해말뭉치구축이별도로이루어져야한다는점이지적된바있으므로이에대한과정에대해설명하였다. 그리고 2등급이상어휘목록은 Ⅳ장 1절에서논의한결과를토대로어휘목록수를정하고이를대상으로검증하는절차를제시하였다. 1. 말뭉치기반어휘목록의추출 본연구에서는사전등재형을어휘추출단위로정하고일차로형태소분석작업을거친후, 장르별빈도, 범위, 산포도를추출하고변수들사이의관계에대한통계적고찰을실시한다. 이후변수들에가중치를부여하여단어순위를결정하고그결과를다른어휘목록과비교하고텍스트포괄범위를조사하여검증하였다. 이는샘플말뭉치를활용하여구체적인절차를실행해본것으로, 각각의절차를실제로수행해봄으로써실제기초어휘선정및어휘등급화사업을진행할때의유의점이나시사점을도출하였다. 이러한절차를도식화하면다음과같다. [ 그림 10] 말뭉치기반어휘목록의추출절차 77

91 국어기초어휘선정및어휘등급화를위한기초연구 1.1. 형태소분석 1) 형태소분석기사용 원시말뭉치만으로는각단어의빈도를정확히낼수없다. 각어절을체언과조사, 용언어간과어미로분석하고, 동형어가있는경우동형어의구분도해야한다. 대규모말뭉치에대해서이것을수작업으로할수는없다. 울산대학교한국어처리연구실에서개발한 UTagger가형태소분석과동형어구분을자동으로해주기때문에, 이작업에이용하기에적합하다. 한국어자동형태소분석기가여럿개발되어있으나, UTagger가정확도가가장우수하고, 13) 게다가동형어구분까지해주는것은 UTagger밖에없기때문에, 현재로서다른대안은없다고할수있다. UTagger는형태소분석을한뒤, 동형어가있을경우 < 표준국어대사전 ( 종이사전 )> 의어깨번호를붙여준다. UTagger의형태소분석결과를예시하면다음과같다. 입력 경제난이새로운한반도불안정요소로떠오르고있는실정이다. 하지만자 력회복이어려운상태여서남북경제교류. 협력이가장현실적이고효과적인 경제난회복방법이다. 출력 경제난 /NNG+ 이 /JKS 새롭 /VA+ ㄴ /ETM 한반도 /NNP 불안정 /NNG 요소 04/NNG+ 로 /JKB 떠오르 /VV+ 고 /EC 있 01/VX+ 는 /ETM 실정 04/NNG+ 이 /VCP+ 다 /EF+./SF 하지만 /MAJ 자력 01/NNG+ 회복 /NNG+ 이 /JKS 어렵 /VA+ ㄴ /ETM 상태 01/NNG+ 이 /VCP+ 어서 /EC 남북 /NNP 경제 04/NNG 교류 01/NNG+./SF+ 협력 /NNG+ 이 /JKS 가장 01/MAG 현실적 /NNG+ 이 /VCP+ 고 /EC 효과적 /NNG+ 이 /VCP+ ㄴ /ETM 경제난 /NNG 회복 /NNG+ 방법 /NNG+ 이 /VCP+ 다 /EF+./SF 13) 본연구에서는 UTagger, 한나눔형태소분석기 (KAIST 개발 ), 꼬꼬마 ( 서울대 Intelligent Database System 연구실개발 ), Komoran(Shineware 개발 ), Twitter 분석기 ( 트위터개발 ), 은전한닢 ( 일명 Mecab. Atlassian 개발 ) 의성능을비교분석하였으며, UTagger 의성능이가장우수함을확인하였다. 78

92 Ⅳ. 기초어휘선정및어휘등급화 2) 형태소분석기오류검토 (1) 형태소분석기오류검토의필요성 기초어휘는대규모말뭉치를구축하고형태소분석기를통해빈도와분포등을고려하여선정되므로형태소분석기의오류를사전에검토하여예상되는문제점을검토할필요가있다. 이를위해동음이의어분석이가능한 UTagger를활용하여문어 10,000어절, 구어 6,000어절규모를분석하여오류유형을살펴보기로한다. 문어와구어는모두세종균형말뭉치의분야별자료로서그구체적인내용은다음과같다. 14) 구분영역매체제목출판연도책 : 상상적텍스트-일반날마다축제 2004 책책 : 자연-기초자연과학유전자가세상을바꾼다 2004 문어신문신문 : 보도해설-사회조선일보 2003년기사 : 사회 2003 잡지 : 사회-일반주간조선 1770호 2003 잡지잡지 : 생활여성중앙21, 전자파일 2000 강연강연아이발달 구어 < 표 31> 검토대상자료 토론토론세계화세미나 회의회의총학생회전체회의 (2) 오류유형결과분석 문어, 구어자료의형태소분석오류유형별사례는 < 부록 2> 에서제시하는것으로대신하고, 이를종합적으로분석한내용을정리하면다음과같다. 먼저문어와구어에따른오류유형의차이를살펴보면다음과같다. 말뭉치를분석한결과문어의오류유형은크게동음이의어분석오류, 품사분석오류, 품사통용관련오류, 오분석에따른오류, 직접성분분석에따른오류로나눌수있다. 그리고구어의오류유형은크게동음이의어분석오류, 품사분석오류, 오분석에따른오류, 직접성분분석에따른오류, 구어적특성에따른오류로나눌수있다. 전체적으로오류가나타나는경우는표본말뭉치의수가더적은구어에서보이는오류항목이표본말뭉치의수가더많은문어에서보이는오류항목보다훨씬많았다. 이는기본적으로형태소분석기가한글맞춤법에기반한문어지향적속성을띠기때문이다. 그러나구어의경우는동일한항목오류가반복되는경우가적 14) UTagger 는프로그램의특성상세종태그셋을활용하여품사태그를부착한다. 세종태그셋은 < 부록 1> 에제시되어있다. 79

93 국어기초어휘선정및어휘등급화를위한기초연구 지않아전체오류항목수가늘어난것임을염두에둘필요가있다. 문어에서도구어적특성에따른오류가간간이발견되기는하였지만이를따로오류의유형으로구분할정도는아니다. 이것은표본이되는문어말뭉치의특성이라할수있고앞으로문어가운데대화와같은구어적특성이풍부한자료가포함될경우따로오류유형으로나눌가능성이있다. 표본으로삼은말뭉치를분석한결과구어에서는문어에서보이는품사통용관련오류가발견되지않았는데이것은표본이되는구어말뭉치의특성일뿐이므로보다대규모의말뭉치를대상으로할경우충분히발견될수있는오류에해당한다. 따라서문어와구어를모두염두에둘때오류유형은동음이의어분석오류, 품사분석오류, 품사통용관련오류, 오분석에따른오류, 직접성분분석에따른오류, 구어적특성에따른오류등으로그범위를확대할가능성이높다. 다음으로, 오류유형과기초어휘선정및등급과의관계를살펴보면다음과같다. 조사된오류는형태소분석기측면에서는모두동일한가치를지니는오류이지만기초어휘선정및등급선정과관련해서는그가치가각각다르다. 즉형태소분석오류가운데는기초어휘선정및선정된어휘의등급과관련해주목해야할오류와무시해도좋을오류가포함되어있다. 동음이의어분석오류는구어뿐만아니라문어에서도가장높은비중을차지하고있는데이는기초어휘선정및선정된어휘의등급에가장큰영향을미치는오류유형이라고할수있다. 전술한바와같이여러형태소분석기가운데 UTagger를활용하려는가장큰이유도이동음이의어분석기능에있음을상기할때동음이의어분석오류를집중적으로검토할필요가있다. UTagger를통한동음이의어는고유한어깨번호를가지고있으므로일차적으로형태소분석기를거쳐기초어휘로선정된어휘들가운데어깨번호를가지고있는것들을대상으로그오류양상을분석하고반영하는절차를거칠필요가있다. 품사분석오류는문어에만한정되는것도있고구어에만한정되는경우도있지만보다중요한것은기초어휘선정및선정된어휘의등급과관련하여주목해야할것들을선별하는것이다. 우선조사와어미는그것이결합한선행어휘의분석에필요한정보이고그자체가기초어휘에해당하지는않으므로조사나어미와관련된품사분석오류는중요성을가지지않는다. 이에따라부사격조사와접속조사사이의오류는무시해도된다. 특히문어와구어모두에서종결어미와연결어미사이의오류가적지않은데이역시기초어휘선정에영향을미치지못하므로무시해도되는오류에해당한다. 한편구어의경우감탄사와관련된오류가문어의경우에비해압도적으로높지만감탄사는소리를임의적으로전사한경우가대부분이므로기초어휘에서는배제 80

94 Ⅳ. 기초어휘선정및어휘등급화 되는일이일반적이라는사실을감안하면이오류도크게신경쓸필요는없어보인다. 반면나머지품사분석오류는구어와문어사이에차이를보이기는하지만결과적으로앞의동음이의어분석오류와동일한효과를가진다는점에서선정된기초어휘의구분및등급산정때이를검토하여반영할필요가있다. 품사통용오류는한어휘의다의어적쓰임에다른것이므로기초어휘선정및등급을부여할때큰중요성을가지지않는다. 다만동일한어휘의다른품사는이를합산해서기초어휘선정및등급부여에반영해야한다는점에주의할필요가있다. 가령표본말뭉치분석에서두드러진품사통용오류는부사와명사사이에서나타났는데이것이동음이의어로처리되어서로다른어휘로간주되지않도록주의할필요가있다. 오분석에따른오류는다시과분석에따른오류와미분석에따른오류로나누었는데과분석은하나의어휘를지나치게분석한것이고미분석은둘이상의어휘로나눌수있는것을분석하지않은것이다. 표본말뭉치분석결과이들각각에해당하는경우가적지않았는데과분석이나미분석모두기초어휘선정및등급결정에영향을미칠수있다. 따라서선정된기초어휘에서과분석이나미분석에해당하는어휘가존재하는지여부를확인할필요가있다. 직접성분분석에따른오류는그경우의수가많지않으나특히전사된자료가띄어쓰기측면에서오류를가질경우에직접성분분석에따른오류가발생하는경우가많다. 방대한양의말뭉치를처리하는과정에서이를바로잡기는매우어려운일이지만기초어휘선정에서고려해야하는부분에해당한다. 전술한바와같이표본말뭉치분석에서드러난구어적특성에따른오류는특히주로구어말뭉치에한정되는속성을갖는다. 먼저더듬거림에따른오류는그경우도많지않을뿐만아니라한어휘의일부에품사를부여하게되므로기초어휘선정과정에서크게문제가되지않아보인다. 또한조사나어미가구어적특성에따라변형되는경우도앞서언급한바와같이기초어휘선정에서문제될것이없다. 그러나준말을포함하여체언이나용언혹은수식언이구어적변형을거치는경우에는이를문어로환원하여분석해야하므로기초어휘선정및등급판정에영향을미칠수있다. 따라서이들에대해서는기초어휘선정및등급판정과정에서주목할필요가있다. 향후기초어휘산정을위해처리하게될말뭉치규모는오류유형분석을위해선정한것과는비교가되지않을정도로크기때문에이들각각에대한오류를일일이바로잡는것은불가능하다. 따라서유형별오류들을바로잡을수있도록별도의조치를강구할필요가있다. 이는두가지측면에서가능할것으로보이는바한가지방법은오류유형을반영하여현행 UTagger의성능을업그레이드하는것이다. 그러나이는 UTagger 개발자와의협력이필요하다는문제가있다. 따라서가 81

95 국어기초어휘선정및어휘등급화를위한기초연구 능한대안은연구팀이오류유형을보다정밀하게분류하여기초어휘로선정가능 한단어들을대상으로오류유형을바로잡을수있는프로그램을자체적으로개발 하는것이다 장르별단어빈도, 범위, 산포도추출 세종말뭉치의장르들중분량이적은 21~29는 대화 라는하나의장르로묶어서처리하였다. 그결과본연구의분석말뭉치는세종말뭉치장르 10개, 도서말뭉치장르 24개, 잡지말뭉치장르 25개, 블로그말뭉치장르 37개, 드라마말뭉치 신문말뭉치 위키백과 방송뉴스각장르 1개로, 총 100개장르로구성되었다. 15) 이 100개장르각각에대해각단어 ( 형태소 ) 의빈도를추출한다음, 이 100개의파일을하나의파일로통합하였다. 이파일의한부분을보이면다음과같다. [ 그림 11] 100 개장르에서의단어별절대빈도 이파일에기록되어있는수치는절대빈도이다. 그런데각장르의규모가천차만별이므로이절대빈도를그대로사용할수는없고, 각장르의규모가동일하다고전제했을때의빈도로환산해야한다. 본작업에서는각장르가 1000만어절규모라고전제했을때의빈도로환산한뒤, 각단어에대해이환산된빈도의합, 범위, 산포도를구하였다. 이를빈도순대로소팅한결과의첫부분을보이면다음과같다. 15) Ⅲ.3. 에말뭉치전체통계및장르별통계를자세히수록하였다. 82

96 Ⅳ. 기초어휘선정및어휘등급화 [ 그림 12] 단어별빈도, 범위, 산포도 ( 빈도순소팅결과의첫부분 ) 83

97 국어기초어휘선정및어휘등급화를위한기초연구 1.3. 세변수사이의관계에대한통계적고찰 앞의결과에서빈도가최상위인단어들은범위가대체로만점이 100에가깝고산포도도만점인 100에가까움을볼수있다. 그러나이세변수가완전히일치하는것은아니기때문에, 빈도 범위 산포도중어느것에어느정도의가중치를두느냐에따라단어의순위가달라질수있다. 예컨대위의그림에서산포도에가장큰가중치를준다면단어들의순위가상당히달라질것이다. 변수들사이의상관관계의강도를나타내는상관계수는다음과같다. - 빈도 범위 : 범위 산포도 : 빈도 산포도 : 위의상관계수를통해빈도와범위사이에, 그리고빈도와산포도사이에는유의미한상관관계가없으나범위와산포도사이에는유의미한양의상관관계가있음을알수있다. 세변수들중각각의두변수들사이의관계를좀더자세히알아보기위해그래프를그려보면다음과같다. [ 그림 13] 범위 ( 가로축 ) 와산포도 ( 세로축 ) 의관계 ( 청색선 : 회귀곡선 ) 84

98 Ⅳ. 기초어휘선정및어휘등급화 [ 그림 13] 에서보듯이, 산포도의편차가상당히크기는하나, 범위수치가큰단어들은산포도가높으면서편차가적은편이고 ( 막대가위로치우쳐있으면서짧음 ), 범위수치가작은단어는산포도의편차가큰편이다 ( 막대의길이가긺 ). 범위와산포도가정말양의상관관계를보이는지는위의그래프의회귀곡선을보면더잘알수있다. 회귀곡선을보면, 범위수치가중간쯤되는구간에서아래위로출렁이는부분이있기는하나, 전체적으로는좌하에서우상으로향하고있음을알수있다. 국소적으로좌상에서우하로향하는구간때문에상관계수를낮추기는했지만, 그럼에도불구하고상관계수가높게나왔다는것은이두변수사이의관계가긴밀함을말해준다. 두변수가전체적으로양의상관관계를보이는것은분명한사실이지만, 범위가낮은구간 ( 좌측부분 ) 에서의회귀곡선의기울기와범위가높은구간 ( 우측부분 ) 에서의회귀곡선의기울기가큰차이가있음에도유의할필요가있다. 즉범위가 0~12 정도되는구간에서는범위점수의증가에따라산포도점수도가파르게증가하는반면에, 범위점수가 12 이상되는단어들의경우에는범위점수가증가한다고해서산포도점수가반드시증가하는것도아니고 ( 회귀곡선의출렁임 ), 증가한다고해도매우완만하게증가하는것이다. 즉범위점수가 12 이하인단어들의경우에는범위보다는산포도가변별력이있지만, 범위점수가일정수준이상인단어들의경우에는산포도보다는범위가변별력이있다고할수있다. 다음으로빈도와산포도의관계를살펴보자. [ 그림 14] 빈도 ( 가로축, 로그변환 ) 와산포도 ( 세로축 ) 의관계 ( 청색선 : 회귀곡선 ) 85

99 국어기초어휘선정및어휘등급화를위한기초연구 빈도에대해아무런조치를취하지않고그냥그래프를그리면빈도가낮은단어들이매우많고고빈도단어들은매우적어서, 관측점들이왼쪽가장자리에밀집되어나오게된다. 자료의더자세한패턴을알아보기위해서는밀집된관측점들을분산시킬필요가있다. 이를위해빈도에로그변형을하여그래프를그렸다. [ 그림 14] 를보면, 빈도와산포도가양의상관관계를보이는패턴 ( 산포도 0~100에서좌하 ~ 우상으로향하는선들 ) 과 빈도와산포도가음의상관관계를보이는패턴 ( 산포도 40 이하에서좌상 ~ 우하로향하는선들 ) 이공존하고있음을볼수있다. 즉산포도의전구간에서두변수사이에양의상관관계가있지만, 산포도가일정수준이하인단어들중일부에서는오히려두변수사이에음의상관관계가있는것이다. 특히산포도가거의 0인단어들가운데는빈도가낮은것부터높은것까지골고루나타나고있다. 또한오른쪽으로갈수록회귀곡선의기울기가완만해지기는하지만, 전반적으로좌하에서우상으로향하고있음을알수있다. 위의범위와산포도의관계그래프와마찬가지로, 빈도점수가높아질수록 ( 우측으로갈수록 ) 회귀곡선의기울기가급격히완만해지므로, 빈도가매우높은단어들의경우에는산포도가별로변별력이없다고할수있다. 산포도 40 이하인단어들의패턴은더자세히살펴볼필요가있다. 이구간에서도음의상관관계를보이는패턴 ( 좌상에서우하로향하는선들 ) 이눈에분명히보이기는하나, 그에못지않게양의상관관계를보이는패턴 ( 좌하에서우상으로향하는선들 ) 도꽤강하게존재하기때문에, 전체적인회귀곡선은좌하에서우상으로향하는형태로나타난다. 그리고위의그래프에비해기울기가훨씬완만함에주목할필요가있다. 산포도와빈도가일정수준이하인단어들에서빈도와산포도사이에음의상관관계의패턴이나타나는원인은, 특정장르에서만엄청나게고빈도로나타나서말뭉치전체의빈도도어느정도는되지만특정장르에편중되어있기때문에산포도점수는낮은단어들 ( 편중단어 ) 이꽤있기때문이다. 예컨대 하나님, 교회, 예수 와같은단어는잡지 기독교사상 에서매우높은순위를차지하며 ( 각각 12위, 19위, 23위 ) 이로인해전체말뭉치에서의순위도어느정도되지만 ( 각각 521위, 641위, 1095위 ) 산포도는그리높지않다 ( 각각 43.41, 56.12, 49.45). 기초어휘선정시빈도에매우높은가중치를부여하고산포도에매우낮은가중치를부여한다면, 이러한편중단어들이높은순위를차지할가능성이생기고, 가중치를반대로부여한다면편중단어들의순위가매우낮아지게된다. 둘중어느쪽이항상옳다고하기는어렵고, 편중단어들을얼마나중요시할것인가에따라선택이달라질수있다. 특정장르에편중되어있는단어라도빈도가매우높고사고도구어로서중요한기능을한다면중시할수도있다. 고학년에올라갈수록교육에 86

100 Ⅳ. 기초어휘선정및어휘등급화 서이런단어가중요한기능을하게된다. 반면에그런편중단어는일상생활에서 흔히쓰이는기초단어는아닐가능성이높다. 범위와빈도의관계를그래프로그리면다음과같다. [ 그림 15] 범위 ( 가로축 ) 와빈도 ( 세로축, 로그변형 ) 의관계 ( 청색선 : 회귀곡선 ) 대부분의단어가저빈도에너무몰려있으므로, 빈도에아무런조치를취하지않으면관측점들이아래쪽에극단적으로몰리게된다. 그래서관측점들을분산시키기위해로그변형을하였다. 두변수가음의상관관계를보이는구간이있기는하나, 전반적으로는회귀곡선이좌하에서우상으로향하고있다. 전자의구간때문에상관계수를많이까먹어서두변수사이의상관계수가매우낮게나온것으로보인다. 범위 0~12 구간에서는회귀곡선의기울기가가파르다. 즉범위가증가함에따라빈도도가파르게증가한다. 반면에범위가 12 이상인구간에서는회귀곡선이하강하는구간도있고, 상승한다하더라도그기울기가매우완만하다. 즉범위 12 이하의단어들의경우에는빈도가매우변별력이높은변수이지만, 범위 12 이상인단어들의경우에는빈도보다는범위가더변별력이높다고할수있다. 그러나범위가 85를넘어서면다시회귀곡선의기울기가가팔라져서, 빈도의변별력이다시높아짐을알수있다. 세변수사이의상관관계가매우높다면셋중어느하나만조사해도되겠지만, 이들사이의상관관계가낮다는것은이세변수가서로상당히독립적이며이들 87

101 국어기초어휘선정및어휘등급화를위한기초연구 변수를모두조사할필요가있음을의미한다. 만약어떤사정에의해 2개의변수만고려해야한다면, 나머지두변수와상관관계가별로없는빈도는반드시포함되어야하며서로상관관계가비교적높은범위와산포도중하나를선택하면될것이다. 물론세변수를모두고려하는것이가장이상적이다. 또한위의고찰은빈도 범위 산포도세변수에가중치를어떻게부여할것인지에대해서도시사하는바가있다. 가중치를모든구간에대해일률적으로부여하기보다는, 변별력을고려하여차별적으로부여할필요가있음을보여준다. 세변수의값이낮은구간과높은구간에서변별력에차이가있기때문이다 변수들에가중치를부여하여단어순위결정 세변수에가중치를어떻게부여하는것이가장좋을지알아보려면, 가중치를다양하게부여해서점수를산출해보고이점수에따라단어들을배열하여, 이들중어느것이가장이상적인지알아보아야할것이다. 이를위해서는세변수에가중치를부여하여얻은점수에따른배열결과를비교할기준이필요하다. 이기준을마련하는방법에대해서도많은논의가필요하겠으나, 가장손쉽게생각하면일반인들의직관을바탕으로각단어의기본성 (basicness) 을판단하여배열한단어목록을생각할수있다. 이기준단어목록을만들기위해, 우선빈도 1위 ~50500위사이의단어 100개를 random하게추출하였다. 이 100개의단어를추출할때, 각구간의크기는, 등위가내려갈수록점점더크게하였다. 사람이직관에의해단어의기본성을판단할때 ( 즉이단어가저단어보다더기본적인단어라고판단할때 ), 등위가높은단어들끼리판단하는것이낮은단어들끼리판단하는것에비해상대적으로쉬울것이라고생각하기때문이다. 각구간 (1~10위, 11~30위, 31~60위, 61~100위, 101~150위, 48511~49500위, 49501~50500위 ) 에서 1개씩 random하게추출하였다. 이런 random한 100 단어목록은얼마든지추출할수있으나, 일단 3개의목록만추출하였다. 이 3개의목록의앞부분을보이면다음과같다. 1: 연번 2: 하한 3: 구간크기 4: 상한 5: 빈도등위 6: 단어 88

102 Ⅳ. 기초어휘선정및어휘등급화 [ 그림 16] random 100 단어목록 1 89

103 국어기초어휘선정및어휘등급화를위한기초연구 [ 그림 17] random 100 단어목록 2 90

104 Ⅳ. 기초어휘선정및어휘등급화 [ 그림 18] random 100 단어목록 3 91

105 국어기초어휘선정및어휘등급화를위한기초연구 이가운데목록 1 에대해, 연구진중 1 명이직관을바탕으로중요도 / 기본성순서에 따라배열해보도록하였다. 100 개단어에대해산출한이러한직관등위와기타변 수를통합하여다음과같은자료를만들었다. 1: 단어 2: 빈도등위 3: 직관에따라매긴등위 4: 빈도 5: 범위 6: 산포도 [ 그림 19] 100 단어목록 1 에대한정보통합결과 92

106 Ⅳ. 기초어휘선정및어휘등급화 이순위표의단어등위와세변수에적절히가중치를부여하여얻어지는 weighted sum 에따른단어등위를비교하여, 가중치를어떻게부여하면직관등위 와가장일치하는지를알아보려는것이다. 이러한조사의결과는다음과같다. < 표 32> 1명의직관에따른등위와가중치부여점수의비교 변수1 변수2 Spearman 상관계수 직관등위 빈도등위 직관등위 빈도 직관등위 범위 직관등위 산포도 직관등위 0.4* 빈도 + 0.3* 범위 + 0.3* 산포도 직관등위 0.5* 빈도 * 범위 * 산포도 직관등위 0.6* 빈도 + 0.2* 범위 + 0.2* 산포도 직관등위 0.3* 빈도 + 0.4* 범위 + 0.3* 산포도 직관등위 0.25* 빈도 + 0.5* 범위 * 산포도 직관등위 0.2* 빈도 + 0.6* 범위 + 0.2* 산포도 직관등위 0.2* 빈도 + 0.7* 범위 + 0.1* 산포도 직관등위 0.1* 빈도 + 0.8* 범위 + 0.1* 산포도 직관등위 0.15* 빈도 + 0.7* 범위 * 산포도 Spearman 상관계수는변수의실제값이아니라등위만고려한다. 그리고세변수들의 weighted sum( 변수2) 을구할때, 세변수의규모가다르므로 R의 scale 함수를이용하여 normalize한뒤에 weighted sum을계산하였다. 빈도 범위 산포도의세변수를단순히직관에따른등위와비교하였을때, 세변수중범위와의상관관계가가장높게나타났다. 이에따라세변수중범위에가장큰가중치를부여하고나머지두변수에는작은가중치를부여하여얻어지는 weighted sum이직관등위와높은상관관계를보인다. 다양한가중치부여결과를비교하여, [0.2* 빈도 + 0.7* 범위 + 0.1* 산포도 ] 가직관등위와가장높은상관관계를보임을알수있었다. 그런데위의결과는 1명의직관을바탕으로하여얻어진결과이므로객관성을갖추었다고하기어렵다. 이에연구진 6명이 3개의단어목록에대해직관을바탕으로등위를부여하여위와같은실험을다시실시하였다. 6명이부여한등위를평균하여이평균값에따라 100개의단어를배열하는것이다. 단어목록 1에대해이렇게배열한결과는다음과같다. 93

107 국어기초어휘선정및어휘등급화를위한기초연구 [ 그림 20] 100 단어목록 1 에대한 6 인이부여한등위통합결과 94

108 Ⅳ. 기초어휘선정및어휘등급화 단어목록 3 개에대해다양한가중치를실험한결과는다음과같다. < 표 33> 100 단어목록 1 에대한실험결과 변수 1 변수 2 Spearman 상관계수 직관등위 빈도 직관등위 범위 직관등위 산포도 직관등위 0.4* 빈도 + 0.3* 범위 + 0.3* 산포도 직관등위 0.5* 빈도 * 범위 * 산포도 직관등위 0.6* 빈도 + 0.2* 범위 + 0.2* 산포도 직관등위 0.3* 빈도 + 0.4* 범위 + 0.3* 산포도 직관등위 0.25* 빈도 + 0.5* 범위 * 산포도 직관등위 0.2* 빈도 + 0.6* 범위 + 0.2* 산포도 직관등위 0.2* 빈도 + 0.7* 범위 + 0.1* 산포도 직관등위 0.1* 빈도 + 0.8* 범위 + 0.1* 산포도 직관등위 0.15* 빈도 + 0.7* 범위 * 산포도 < 표 34> 100 단어목록 2 에대한실험결과 변수 1 변수 2 Spearman 상관계수 직관등위 빈도 직관등위 범위 직관등위 산포도 직관등위 0.4* 빈도 + 0.3* 범위 + 0.3* 산포도 직관등위 0.5* 빈도 * 범위 * 산포도 직관등위 0.6* 빈도 + 0.2* 범위 + 0.2* 산포도 직관등위 0.3* 빈도 + 0.4* 범위 + 0.3* 산포도 직관등위 0.25* 빈도 + 0.5* 범위 * 산포도 직관등위 0.2* 빈도 + 0.6* 범위 + 0.2* 산포도 직관등위 0.2* 빈도 + 0.7* 범위 + 0.1* 산포도 직관등위 0.1* 빈도 + 0.8* 범위 + 0.1* 산포도 직관등위 0.15* 빈도 + 0.7* 범위 * 산포도

109 국어기초어휘선정및어휘등급화를위한기초연구 < 표 35> 100 단어목록 3 에대한실험결과 변수 1 변수 2 Spearman 상관계수 직관등위 빈도 직관등위 범위 직관등위 산포도 직관등위 0.4* 빈도 + 0.3* 범위 + 0.3* 산포도 직관등위 0.5* 빈도 * 범위 * 산포도 직관등위 0.6* 빈도 + 0.2* 범위 + 0.2* 산포도 직관등위 0.3* 빈도 + 0.4* 범위 + 0.3* 산포도 직관등위 0.25* 빈도 + 0.5* 범위 * 산포도 직관등위 0.2* 빈도 + 0.6* 범위 + 0.2* 산포도 직관등위 0.2* 빈도 + 0.7* 범위 + 0.1* 산포도 직관등위 0.1* 빈도 + 0.8* 범위 + 0.1* 산포도 직관등위 0.15* 빈도 + 0.7* 범위 * 산포도 각실험에서구체적인수치는약간의차이는있으나, 모두일관되게세변수중범위와의상관관계가가장높게나왔고. 다양한 weighted sum 가운데 [0.2* 빈도 + 0.7* 범위 + 0.1* 산포도 ] 와같은가중치가직관등위와가장높은상관관계를보였다. 따라서단어등급화에이 weighted sum을이용하기로결정하였다. 이식에따라각단어의점수를구하여이점수에따라정렬한결과는다음과같다. [ 그림 21] weighted sum(=0.2* 빈도 +0.7* 범위 +0.1* 산포도 ) 에따른소팅결과 96

110 Ⅳ. 기초어휘선정및어휘등급화 이 weighted sum, 빈도, 범위, 산포도사이의관계는다음과같다. < 표 36> 점수 ( 결정된 weighted sum), 빈도, 범위, 산포도사이의관계 변수1 변수2 Person 상관계수 점수 빈도 점수 범위 점수 산포도 빈도 범위 빈도 산포도 범위 산포도 점수를산출할때세변수중범위에가장큰가중치를부여했으므로점수와범 위사이의상관관계가가장높게나오는것이당연하다. 세변수와점수사이의관 계를그래프로그려보면다음과같다. [ 그림 22] 범위와점수 ( 로그변형 ) 의관계 97

111 국어기초어휘선정및어휘등급화를위한기초연구 [ 그림 23] 산포도와점수 ( 로그변형 ) 의관계 [ 그림 24] 빈도 ( 로그변형 ) 와점수 ( 로그변형 ) 의관계 빈도-점수그래프에서관측점들이일정한선을상한선으로하여그아래로는넓게분포해있으나, 이선위로는넘어가지못하는양상을보인다. 이는빈도에 0.2 라는낮은가중치를부여했기때문에, 빈도가아무리높아도점수에반영되는데한계가있게된것이다. 98

112 Ⅳ. 기초어휘선정및어휘등급화 1.5. 다른어휘목록과의비교 지금까지의작업은순전히말뭉치에서추출한통계를바탕으로하였기때문에, 기반말뭉치가가진편향성이나기타문제를고스란히반영하고있을것이고, 말뭉치로부터얻은수량적속성외의다른속성은제대로반영하지못할가능성이높다. 따라서말뭉치를바탕으로양적방법에의해얻어진단어목록을질적방법에의해얻어진다른단어목록과비교할필요가있다. 이목적을위해본작업에서는 < 연세한국어사전 > 의표제어목록과비교하였다. < 연세한국어사전 > 도기본적으로말뭉치의빈도를바탕으로하였으나, 이를그대로사용하지않고사전편찬자들의직관을동원하여빠진단어를보충하는등질적방법을혼용하여표제어목록을선정하였다. 16) 따라서본작업에서비교대상으로삼기에어느정도적합하다고할수있다. < 연세한국어사전 > 에는약 5만개의표제어가실려있으나, 본작업과별로상관이없는조사, 어미등의문법요소를제외하고 47,299개의단어목록을추출하였다. < 연세한국어사전 > 의품사표시는말뭉치와의비교를위해 UTagger에서부여되는세종말뭉치방식의품사태그로교체하였다. 그다음에두목록의비교에있어서큰걸림돌은동형어번호이다. UTagger에서부여되는동형어번호는 < 표준국어대사전 > 의어깨번호이나, < 연세한국어사전 > 의동형어번호는이와상관없이독자적으로붙여진번호이다. 본작업을위해서는, 동형어들중말뭉치빈도순에따라 < 연세한국어사전 > 의어깨번호와대응시켰다. 즉 < 연세한국어사전 > 에 가격1 과 가격2 라는동형의명사가 2개실려있는데, 두단어중말뭉치에서빈도가더높은것을 가격1 에대응시키고, 빈도가그다음인것을 가격2 에대응시킨것이다. 17) 이렇게대응시킨결과의일부를보이면다음과같다. 1: < 연세한국어사전 > 표제어, 어깨번호, 품사 2: 점수등위 3: 말뭉치에서 UTagger가부여한동형어번호, 품사태그 4: 빈도 5: 범위 6: 산포도 7: 점수 16) 당시기술수준의한계로동형어를구별하여빈도를추출한것은아니라고한다. 그러나정성적방법으로그러한한계와문제점을어느정도는극복한것으로판단된다. 17) < 연세한국어사전 > 에서동형어들을배열할때사용빈도를어느정도고려하여순서를정한것으로보인다. 그래서본연구에서말뭉치로부터추출한동형어들의사용빈도순위와대체로일치한다. 99

113 국어기초어휘선정및어휘등급화를위한기초연구 [ 그림 25] < 연세한국어사전 > 표제어와말뭉치통계결과의비교 100

114 Ⅳ. 기초어휘선정및어휘등급화 비교대상이된 < 연세한국어사전 > 의 47,299 개표제어중, 말뭉치빈도순위몇 위안에드는것이몇개인지를살펴보면다음과같다. < 표 37> < 연세한국어사전 > 표제어와의말뭉치등위비교 말뭉치등위 표제어수 말뭉치등위 표제어수 말뭉치등위 표제어수 < 10,000 11,256 < 90,000 41,220 < 170,000 44,510 < 20,000 19,312 < 100,000 42,051 < 180,000 44,688 < 30,000 25,849 < 110,000 41,618 < 190,000 44,843 < 40,000 30,721 < 120,000 43,066 < 200,000 44,976 < 50,000 34,336 < 130,000 43,487 < 300,000 45,661 < 60,000 36,945 < 140,000 43,818 < 400,000 45,929 < 70,000 38,872 < 150,000 44,080 < 1,000,000 46,352 < 80,000 40,252 < 160,000 44,323 등외 2,274 < 표 37> 에서볼수있듯이, 말뭉치순위 4만등안에드는것이약 3만개, 8만등안에드는것이약 4만개있고, 나머지가 1만개가까이있음을알수있다. < 연세한국어사전 > 에실려있으나말뭉치에서는포착되지않은것도 2,274개나타났다. 이들중일부는어깨번호부여방식에있어서 < 표준국어대사전 > 과 < 연세한국어사전 > 이다른경우이다. 가격표 에대해 < 표준국어대사전 > 에서는하나의표제어만실려있으나, < 연세한국어사전 > 에는어깨번호 1과 2가달린 2개의표제어가실려있다. 이에따라 UTagger는 가격표 에어깨번호를부여하지않았고, < 연세한국어사전 > 의 가격표2 는말뭉치에대응단어가없는것으로나타난것이다. 이러한비교결과를면밀히검토하여, < 연세한국어사전 > 에실려있는데도말뭉치에서순위가지나치게하위로나타난단어들이어떤것들인지알아보고, 이단어들이실제로는보다높은순위를부여받아야마땅하다고판단된다면, 이를위해말뭉치를어떻게보완해야할지에대한단서를얻을수있다 텍스트포괄범위조사 위에서설명한방법에따라각단어의점수를산출하고이점수에따라배열함으로써각단어의등위가부여된다. Zipf의법칙에따라등위가높은단어는빈도가매우높으므로, 상위의소수의단어들이텍스트의 token 중대다수를차지하게된다. 이러한양상을표로정리하면다음과같다. 101

115 국어기초어휘선정및어휘등급화를위한기초연구 < 표 38> 텍스트포괄범위 Text Coverage 점수상위단어수 90% 26,912 95% 49,426 97% 75,454 98% 103,503 99% 174, % 289, % 750, % 1,691, % 1,872, % 1,893,569 말뭉치의어휘형태소 type 수는 1,895,946개이고, 말뭉치의어휘형태소 token 수는 2,377,114,012개이다. 상위 26,912개단어가말뭉치전체 token의 90% 를 cover하고, 상위 49,426개단어가말뭉치전체 token의 95% 를 cover하며, 상위 174,659개단어가말뭉치전체 token의 99% 를 cover한다. 대략텍스트의 token 의 95% 정도를차지하는약 5만개의상위빈도단어가어휘등급화의주된대상이된다 향후과제 1) 실험의기반이되는단어목록보완 우선실험을더욱객관화할필요가있다. 6명보다훨씬더많은사람의판단을종합할필요가있다. 실험대상이된단어목록의단어수도보완할필요가있다. 100개보다더많은단어를추출하여실험하면신뢰도가더높아질수있다. 단어목록도다양화할필요가있다. 3개의단어목록이아니라보다많은수의목록을만들어서실험하면더좋을것이다. 102

116 Ⅳ. 기초어휘선정및어휘등급화 2) 점수산출방식의다양한실험 세변수 ( 빈도, 범위, 산포도 ) 에다양한가중치를부여하여얻어지는점수등위와직관에바탕을둔단어등위사이의상관관계고찰하였는데, 가중치부여방식을가급적다양하게하여실험하기는하였으나, 이를좀더체계적으로실시할수있는방법론을모색할필요가있다. 미처시도해보지않은가중치부여패턴이의외의결과를낳을지도모르기때문이다. 3) 점수최상위단어들에대한정성적검토 통계적방법으로부여된점수에따라배열된단어들을최상위부터검토하여, 혹시부당하게높은등위를부여받은단어들이없는지알아볼필요가있다. 그런단어가발견되면장르별빈도를검토하여, 특정장르가부당하게과대평가 (overrepresent) 되지는않았는지점검할필요가있다. 4) 기존기본어휘목록에대한정성적검토 기존기본어휘목록에는높은등위로올라있는데, 통계적방법으로는낮은점 수 / 등위를부여받은단어들이혹시있는지검토할필요가있다. 103

117 국어기초어휘선정및어휘등급화를위한기초연구 2. 어휘등급화절차 지금까지의검토결과를바탕으로할때에어휘등급화작업시기초어휘와나머지단어들의선정절차는달라야한다. 이는첫째기초어휘가갖는중요성때문이고둘째는기초어휘가갖는독특한성격때문이다. 기초어휘는아동언어발달의첫시작을알리는단어들로서국어교육적중요성이크다. 또한한국어교육시에도첫교육대상이되는단어들이다. 한국어전체를대상으로어휘론적입장에서기초어휘를살펴보면기초어휘는독특한특성을갖는다. 비유컨대기초어휘는한국어의뿌리이거나기반에해당하는단어들이다. 한국어전체집합이일정한층을형성하고있다면기초어휘는그가장아래에서한국어언어생활의심연을담당한다. 18) 기초어휘가갖는이러한성격을고려할때에기초어휘선정은신중해야한다. 이러한점을고려하여기초어휘선정및검증절차와나머지단어들의선정및검증절차를차별화할필요가있다. 본연구에서기초어휘는등급구간을나누어숫자를매긴다면 1등급에해당한다. 따라서나머지단어들은 2등급이상단어들에해당한다. 편의상 1등급어휘와 2등급이상어휘로칭하도록한다. 19) 등급어휘선정절차 1) 1 등급어휘선정용말뭉치의별도구축 1등급어휘는대개구어의사소통상황에서사용되며범위나산포도가높다. 만일특정분야에서만집중적으로사용된다면 1등급어휘가아닐가능성이높다. 따라서 1등급어휘추출을위해서는말뭉치구성시다음과같은몇가지점에유의해야한다. 18) 기초어휘의성격은기초어휘가가져야할다음과같은조건을통해명료하게드러난다. 1 그어휘를사용하지않고다른단어를대용하는일이불가능하여문장을작성하는일이불가능해지며다른단어를대용한다고하더라도오히려그것이더불편해진다. 2 그단어들을서로조합하여다른복잡한개념이나새로운명명이필요한개념등을나타내는단어를쉽게만들수있다. 3 기초어휘에속하지않은단어를설명하는경우결국에는기초어휘의범위에들어있는단어들에의지하는일이대개가능하다. 4 그단어들의많은것은오랜옛날부터사용되어오던것이며앞으로도계속사용될가능성이크다. 5 여러방면의화제에흔하게사용된다. ( 田中章夫, 1988:79, 김광해, 1993:48 에서재인용 ) 19) 등급구간에따른어휘구분을할때각구간별단어집단을지칭하는용어는신중하게검토하여결정하여야한다. 이연구에서는잠정적으로 1 등급어휘와 2 등급이상어휘로구분하여사용하며, 추후연구진행에따라보다적확한용어로수정할것이다. 104

118 Ⅳ. 기초어휘선정및어휘등급화 첫째, 현존하는말뭉치들이문어적성격이농후하다는점을고려할때에구어말뭉치의보강이요구된다. 앞서기술한것처럼우리는인터넷이나잡지자료등을첨가하여구어적성격이높은말뭉치를대거보강하였다. 그러나추후실제구어자료 ( 일상대화나전화통화자료등 ) 의보강이요구된다. 1등급어휘선정을위한말뭉치는구어와문어의비율을 6:4나 7:3 정도로하여문어보다구어의비율을더높게하는것이타당하다. 참고로네이션과웹은기초어휘선정을위해구어와문어비율을 6:4로한바있다 ( 관련내용은본보고서의 Ⅱ장참조 ). 둘째, 다양한국어생활자료를포함하여국어장르가골고루들어가도록해야한다. 이는범위나산포도가높은단어를선택해야만 1등급어휘의성격을지니기때문이다. 영어의 BNC 14000의경우어휘목록개발시빈도가아니라범위를제 1기준으로선정한바있다. 특정자료에서만집중적으로사용되는단어들을제외하기위해서는빈도와산포도를적극고려할필요가있다. 물론빈도가높은단어들이텍스트포괄범위가높다는점에서빈도에대한고려도필요하다. 빈도, 범위, 산포도중어디에우선순위를두어야하는지는실제말뭉치통계자료에대한검토를통해결정될것이다. 분명한것은 1등급어휘선정시에는범위와산포도의비중을크게늘려야한다는점이다. 셋째, 1등급어휘는대개사용빈도가매우높아말뭉치규모와상관없이등장한다는점을고려할필요가있다. 영어의 Basic English가 850 단어에불과하며 GSL(General Service List) 이나기선정된한국어기초어휘들이 2000여단어밖에안되는점을생각하면이단어들은대개의일상생활에서자주사용되는단어들이다. 이는바꿔말하면 1등급어휘선정을위한말뭉치의규모는그리클필요가없음을보여준다. 20) 따라서 1등급어휘선정을위한말뭉치는적은규모여도상관없으나구어의비율을높이고다양한장르가들어가있는균형말뭉치의형태여야한다. 본연구는이러한점을고려하여 1등급어휘선정을위한말뭉치를따로구축하고자한다. 20) 중간보고회의와이후의연구진회의를통해기초어휘선정만을위한말뭉치의규모는클필요가없으나, 균형말뭉치의형태여야함을결정하였다. 105

119 국어기초어휘선정및어휘등급화를위한기초연구 2) 1 등급어휘선정용말뭉치구축후절차 1 등급어휘선정을위한말뭉치를따로구축한후에는다음과같은절차를거쳐 1 등급어휘를선정하고자한다. [ 그림 26] 기초어휘선정용말뭉치구축후절차 (1) 양적분석 먼저 1등급어휘선정용말뭉치를기반으로양적인분석을통하여단어를추출한다. 이때에는빈도, 범위, 산포도를종합적으로고려할것이며이들세기준의적용순서와적용비율은실제말뭉치통계자료에대한검토를통해추후결정될것이다. 다음, 선정된단어들의텍스트포괄범위를대규모말뭉치를통해양적으로분석할것이다. 1등급어휘선정용말뭉치와별도로우리는 2등급이상어휘선정용말뭉치를구축할예정이며후자의경우전자에비해대규모로구축될예정이다. 우선선정된단어들의텍스트포괄범위를조사할것이다. 1등급어휘는대개텍스트포괄범위가매우높다. Nation(2001) 은기초어휘의텍스트포괄범위가 80% 를넘는다고보고한바있다. 한국어 1등급어휘의텍스트포괄범위에대한명확한조사는없지만최소 60~70% 이상은확보되어야 1등급어휘라고부를수있을것이다. 따라서이에해당하는어휘를대상으로단어들의텍스트포괄범위를조사하여이것이낮은단어는제외한다. 다시빈도, 범위, 산포도를조사하여텍스트포괄범위가높은단어를선정하는작업을반복하도록한다. 106

120 Ⅳ. 기초어휘선정및어휘등급화 (2) 질적분석 1단계양적분석을통해선정한단어들을대상으로질적분석을수행한다. 이것은크게이론적타당성검토와실제적타당성검토로나누어진행한다. 먼저이론적타당성검토를위해시소러스검토와기존기초어휘와의비교작업을수행하고자한다. 이중전자는현실적으로어려움이많은것이사실이다. 현재한국어전체어휘를대상으로하는체계적인시소러스구축작업은이루어지지못했기때문이다. Basic English의경우사물어 600개, 성질어 150개, 작용어 100개로구성된것으로알려져있다. 국어기초어휘가타당성을확보하기위해서는기초어휘자체가일정한체계를지닐필요가있을것이며이를위해서는한국어시소러스에대한검토가요구된다. 다음한국어교육용기초어휘나국어교육용기초어휘형태로제시된기존기초어휘목록과의비교검토작업을수행하고자한다. 이러한작업은이연구에서선정한 1등급어휘의특징을드러내고그한계와장점을부각시키기위해서도필요할것으로사려된다. 이와같은작업을통해최종선정된단어들은 3000개이내가될것으로예상된다. 우리는이단어들을대상으로전문가의직관을바탕으로한질적검토작업을수행하고자한다. 연구자의직관뿐만아니라광범위한전문가들과의협의를통해어휘목록의직관적적합성을확보하고자한다. 그리고질적검토과정에서는다음과같은요소들도적극논의될것이다. 고유명사, 1,2,3,4와같은수, 요일명등의처리 Ÿ 대개고유명사는제외하는것이원칙이나문제가되는어휘가있는지검토가필요하다. Ÿ 1,2,3,4, 첫째, 둘째, 셋째 등과같은수는포함할것인지지여부를결정해야하며만일포함한다면어디까지포함할것인지검토해야한다. 만일뺀다면이들어휘들을어떻게처리할지도결정해야한다. Ÿ 요일명등기타문제가되는단어들의처리여부가검토되어야한다. 1등급어휘가갖는의미적특성검토 1등급어휘는대개다의성을지닌다. West의 Basic English의경우한단어가갖는의미의개수가 개로알려져있다. 김광해 (1993) 에서논의된것처럼 1등급어휘는비전문어적성격이강해해당단어의의미영역이넓다. 대개한국어의기초어휘들은고유어들일가능성이있다. 그런데한국어어휘는고유어와한자어가일대다대응현상을보이는만큼그의미영역이넓고비전문적이다. 따라서 1등급어휘목록검토시 1등급어휘가갖는이러한의미적특성이적극고려되어야할것이다. 107

121 국어기초어휘선정및어휘등급화를위한기초연구 질적분석이후에는다시양적분석으로돌아가선정된단어들의통계적특성을 검토하는작업이반복될것이다. 본연구는양적분석과질적분석을넘나듦으로써 최대한 1 등급어휘선정의타당성을높이고자한다. 3) 선정된기초어휘의검증절차 위와같은과정을통해선정된 1 등급어휘들은다시그타당성을다음과같은방 식으로검증할것이다. [ 그림 27] 선정된기초어휘의검증방향 기본핵어휘는원래언어연대학에서나온개념이다. 언어간친족관계를확인하기위해기초적인어휘목록 2백여개를정하고이단어들의소실과보존비율을통계적으로비교하기위해설정된개념이다. 그런데이때사용되는기본핵어휘목록은한언어의근간을이루는단어들이므로 1등급어휘이거나 1등급어휘와긴밀한관련을맺는다. 본연구에서는이개념을우리가선정한 1등급어휘목록의타당성검토시이용할수있다. 말뭉치확보의어려움을고려할때 100여년전의자료를구하기는쉽지않을것으로보인다. 현실적인대안으로몇십년전자료예컨대 20세기중반말뭉치자료를확보할수있다면이들자료에우리가선정한 1등급어휘가어느정도로 ( 빈도와범위 ) 등장하는지검토할수있다. 이는선정된 1등급어휘의특성을드러내기에도유용하다. 말뭉치확보가가능하다면우리가선정한 1등급어휘가통시적으로어느정도의텍스트포괄범위를보여주는지어느정도의빈도로사용되었는지조사할수있 108

122 Ⅳ. 기초어휘선정및어휘등급화 다. 가령 1960~80년대의말뭉치와 1980~2000년대의말뭉치에서우리가선정한기초어휘의빈도및범위를조사하여그추이를정리함으로써선정된 1등급어휘의특성을드러낼수있다. 위와같은작업을통해필요하다면어휘목록의수정도이루어질것이다. 1등급어휘선정의타당성을검토하기위해 1등급어휘가광범위하게사용될것으로예상되는자료를중심으로기초어휘의텍스트포괄범위를재조사할필요가있다. 그러한자료들로는한국어교육용초급교재, 유치원이나초등학교 1,2학년교재 ( 교과서, 동화, 보조자료등 ) 등이대표적이다. 이러한자료들에서 1등급어휘가어느정도의텍스트포괄범위를갖는지조사할필요가있다. 또구어말뭉치에서의텍스트포괄범위와문어말뭉치에서의텍스트포괄범위를비교하여구어말뭉치에서의텍스트포괄범위가더높은지확인할필요가있다. 가능하다면영어나일본어의 1등급어휘목록과의비교와대조도요구된다. 번역의한계는상존하지만, 기초어휘로제시된단어들의시소러스체계와제시된단어들의의미역검토가필요하다. 마지막으로 1등급어휘가갖는교육적사회적중요성을고려하여이목록의응용가능성을다방면으로조사할필요가있다. 이는이목록이타당한지여부를증명하는길이면서추후활용가능성을높이는길도된다. 한국어교육용초급교재나유치원용교재, 초등 1,2학년교재에서의텍스트포괄범위조사는이런관점에서도요구된다. 이부분에대해서는관련전문가들의폭넓은자문이필요하다. 109

123 국어기초어휘선정및어휘등급화를위한기초연구 등급이상어휘선정절차 1) 어휘등급화를위해결정해야할선행요소 2등급이상어휘의등급화를위해서는등급부여대상총단어수와등급의개수, 등급내단어수등을결정해야한다. 우리는국내외등급화사례를검토하고말뭉치분석결과를참조하되, 어휘등급화결과물의교육적사회적응용가능성도고려하고자한다. [ 그림 28] 어휘등급화를위한결정요소 올해사업에서정확한수치를제시하기는어려우나잠정적으로등급부여대상총어휘수는 5만여개일것으로예상된다. 이는일반성인의어휘량이대략 5만내외라는논의 ( 김광해, 1993: 309) 를참조한것이다. 또한, 이와관련하여앞서분석한결과에서텍스트포괄범위 95% 수준의어휘수가 49,426개임을확인한바있다. 국립국어원의 < 표준국어대사전 > 에수록되어있는어휘의수는대략 50여만에이르지만이중대다수는그사용빈도가매우적다. 저빈도어들의경우등급자체가무의미하다. 등급부여가유의미하기위해서는해당단어의활발한사용이전제되어야한다. 한편이들단어들을몇개의등급으로나누며각등급내몇개정도의단어를제시할것인가도어려운문제이다. 김광해 (2003) 의경우총어휘 237,990를교육적중요도에따라총 7등급으로나누었다. 이후 낱말은김광해 (2003) 의 7등급어휘체계를 9등급체계로보완하였는데이는교육적활용도를높이기위함이었다. 본연구의 Ⅱ장에서논의한것처럼 Nation(2001) 은영어원어민화자가자연스러운노출을통해 1년에약 1,000개의어휘군을습득한다고보고한개의등급내 110

124 Ⅳ. 기초어휘선정및어휘등급화 1,000개의단어를귀속시켰다. 그러나이작업은 BNC 작업의일환으로이루어진것으로서총단어수가 14,000 어휘군에불과하다는점을고려해야한다. 이작업의결과를우리연구에그대로적용하기는어렵다. 본연구에서는이와같은연구결과들을참조하되말뭉치분석을통해통계적으로유의미한지점을포착하여등급의수와등급내단어수결정의 1차적기준으로삼고자한다. 그다음어휘목록의교육적, 사회적활용도를고려하여이를최종결정하고자한다. 소사전, 중사전개발이나교과용교재개발, 아동의언어발달등을적극고려할것이다. 2) 어휘등급화의절차와검증 먼저어휘등급화의절차와검증단계를정리하여제시하면다음그림과같다. [ 그림 29] 어휘등급화절차 본보고서의앞장에서기술한바우리는대규모말뭉치를구축하여어휘등급화시이용하고자한다. 어휘등급화를위한 <1단계 > 작업은대규모말뭉치에대한분석으로시작할것이다. 이단계는양적분석작업으로 1차적검토대상이되는 5만여개의단어추출에집중될것이다. 앞장의실험적분석에서드러난것처럼빈도, 범위, 산포도의적용순서와그비율은 1차적으로는통계적수치에대한검토를통해결정될것이다. 말뭉치의규모와구성에따라선정단어가달라진다는점에서말뭉치구축의양적, 질적정교화가이루어질것이다. 말뭉치에기반하여 1차적으로 5만여개의단어를추출한뒤이들단어들의타당성검토작업을다방면으로진행할것이다 (<2단계 >). 우선기존소사전에수록된단어의수가대략 5만여개인점을고려하여소사전어휘목록과의비교 검토를수 111

125 국어기초어휘선정및어휘등급화를위한기초연구 행할것이다. 그리고이들목록의교육적사회적응용가능성을높이면서도어휘등급화의학년별수준별타당성을검토하기위해학년별, 수준별로나누어져있는교과용도서나권장도서의어휘목록을검토할것이다. 교과용도서의경우학년별학습자의수준을고려하여개발된다는점에서참고할가치가있다. 그러나이들교과용도서역시개발자의추정과어휘적직관에의해개발되었다는점에서 100% 신뢰하기는어렵다. 따라서최종판결은전문가의검토와합의에의해결정되는것이타당할것이다. 어휘등급화대상이되는단어에특수전문어나유행어, 신어등은제외하는것이타당하다. 그런데특수전문어나유행어, 신어여부의판단이쉽지않다. 전문가의검토와더불어인터넷사전과각종특수전문어사전을참고하여이를판단하고자한다. 만일학습자쓰기자료로된말뭉치가있다면등급별어휘의타당성검토가용이할것이다. 그러나현재학습자쓰기자료는학년별, 수준별, 지역별, 장르별등을고려하여체계적으로구축되어있지않다. 따라서대규모쓰기말뭉치를바탕으로한체계적인검토는불가능하다. 그러나우리가선정한어휘의타당성검토를위해일정부분학습자쓰기자료를참조하는방안은모색할수있을것이다. 대규모말뭉치를기반으로한 5만여어휘의선정과그타당성검토를위한소사전과교과용도서어휘와의비교작업은회귀적으로반복될것이다. 따라서 <1단계 > 작업과 <2단계 > 작업은순환적이다. <1단계 >, <2단계 > 작업이어느정도완료되면 2차어휘목록을확정한후전문가검토를받을예정이다. 그리고어휘능력검사지를개발하여이목록의타당성을실제적으로검증하고자한다. 학습자마다개인차는존재하겠지만연령의증가와더불어어휘량역시증가한다. 따라서우리가선정한어휘목록을바탕으로어휘검사지를만들어유치원부터초 중 고, 대학생을대상으로어휘능력검사를시행하면우리목록의타당성검토가일정부분가능하다. 지금까지의논의를통해드러난바우리는어휘등급화결과의타당성을높이기위해다양한검증장치를고려하고있다. 이를그림으로정리하면다음과같다. 112

126 Ⅳ. 기초어휘선정및어휘등급화 [ 그림 30] 등급별어휘의타당성검토방안 위그림과같이, 등급화된어휘목록은전문가들의개별적질적검토와협의회를통해최종결정하고자한다. 앞의 3단계작업결과를바탕으로선정된어휘목록을연구진내에서수정한후다시전문가자문을통해검토할예정이다. 따라서최종어휘결정은개별전문가들의숙고와전문가협의회를거쳐이루어지게된다. 이는전문가의어휘적직관뿐만아니라어휘등급화의교육적, 사회적응용가능성도충분히검토하여최종확정하는것이연구성과를높이는데기여할것이기때문이다. 113

127 Ⅴ. 기초어휘사업의중장기계획수립 1. 중장기계획수립의경위 1.1. 국민의국어능력과어문생활에기여하는정책적수단 기초어휘사업은국어기본법에서주창하고있는것과같이, 변화하는언어환경에능동적으로대응하고국민의국어능력을실효성있게향상할수있는방안으로마련된것이다. 기초어휘사업은국어의수십만어휘중에서도언어사용의근간을이루는부류로, 그것의목록과성격, 활용방안등을개발하여보급하면국민전체의어문생활을진작시키는데직접기여할수있을뿐만아니라, 국민의국어능력발전을위한언어자원으로서다방면에활용될여지가매우크므로시급한과제이다. 그러나기초어휘사업의성립을위해서는문자언어와음성언어를모두망라해야하고, 남성과여성, 성인과노년층등국민전체의언어사용양상을대표할수있는대규모말뭉치를구축, 분석, 관리하여야하므로국가수준의예산출연과정책적지원이뒷받침되어야한다. 2017년현재시점에이르기까지국립국어원에서이루어져온어휘관련사업은분야별전문용어정비등각종전문분야및직능 ( 職能 ) 등에기반한어휘사업이있었으나, 정작국민의국어능력발전과관련된어휘적토대에해당하는기초어휘사업이수행되지못한실정이다. 이에따라, 기초어휘의개념및성격, 국내외사례의심층조사등과같은이론연구에서부터기초어휘목록추출을위한말뭉치구축및관리방법론, 기초어휘의검증및타당화도구개발, 기초어휘의보급및활용체계, 향후말뭉치및기초어휘목록보완계획등장기간에걸친치밀하고체계적인계획이마련될필요가있다 국어사용의현황파악및정비사업수행 기초어휘사업의수행은국민의국어능력평가, 교과서및교육자료감수, 공무 원시험이나대학수학능력시험등의국가고사출제에기초자료로활용될수있는 목록및사용체계마련이필요하다. 국가공문서의전달어휘선정, 국가고사의타 114

128 Ⅴ. 기초어휘사업의중장기계획수립 당도등기초어휘를통해공공언어과업의효율성을제고할수있으며, 어휘의목록및사용체계를개발, 보급함으로써국민일반의언어생활향상에크게기여할수있다. 그런데기초어휘사업은그자체의성과물로서도큰가치를지니지만, 국민의국어사용양상변화를파악하고, 향후어문정책을수립하는근거로서체계적으로수집된어휘및그근거자료로서의말뭉치가마련된다는점에서국민언어의정비사업과긴밀히관련되므로체계화된중장기계획의마련이절실하다. 국어기본법에서도밝힌바, 국가와지방자치단체는변화하는언어사용환경에능동적으로대응하고, 국민의국어능력향상과국어의발전을위해노력 ( 국어기본법제4조참조 ) 해야하는데, 이는언어현실의변화를민감하게파악하고국가가이를긍정적인방향으로추동해야함을의미한다. 어휘는국어능력의기반이되며, 언어사용의변화양상을매우민감하게반영하는언어단위이다. 또한이가운데서기초어휘는국민의국어생활전반을기능적으로부담하므로국민의언어생활을파악하고향상시키는데매우긴요하게사용될수있다. 즉기초어휘의조사및분석을통하여당대국어를사용하는국민의어휘구성및사용양상전반을파악하는데도활용할수있고, 어휘를기반으로한국민의국어능력수준및향후발전방향등을가늠해보는도구로도기능할수있으며, 기초어휘평정을위해수집된말뭉치나언어자료는중장기적차원에서국민의국어능력변화추이를파악하는 DB( 데이터베이스 ) 로적재되는등다방면의사용이가능하다 언어발전계획의세계적수준도달 세계각국은자국의언어문화를발전시키고그보급을위해상당한투자를하고있을뿐만아니라, 국민의언어사용능력을발전시키기위한정책적노력을다각도로기울이고있다. 미국의경우, 일찍부터기초어휘및다양한용도의어휘목록이활발하게개발되어어문생활에서교육및각종사업분야에이르기까지이러한성과물이다용도로활용되고있으며, 영어의영향력및사용확대에적지않게기여하고있는것이사실이다. 각국의언어발전성과는곧그언어의위상과해당국가의경쟁력과도밀접한관련을맺고있기때문이다. 기초어휘사업을통해어휘및기초어휘와관련된선진각국의언어발전수준에근접하게되는중요한사명이있고, 국가고사, 출판, 교육등다방면에서국민이활용할수있는언어자원을제공하여국어의세계화및한국어교육등의발전 115

129 국어기초어휘선정및어휘등급화를위한기초연구 에도기여할여지가매우크므로체계화된계획마련이요구된다. 또한기초어휘사업의성과물이국어문화공동체전반에보급되고보다다방면에활용되도록하기위해서는단발성사업의일환으로추진되기보다는장기적관점에서그성과및향후활용계획, 전략등이포함된중장기형사업추진계획이필요하다. 116

130 Ⅴ. 기초어휘사업의중장기계획수립 2. 중장기계획수립 ( 향후 4 개년 ) 본연구는기초어휘사업의일환에서수행된연구로, 그명칭은 국어기초어휘 선정및어휘등급화를위한기초연구 이다. 이연구의수행결과를바탕으로향후 기초어휘사업전반의계획을중장기로드맵으로제시해보면다음과같다. [ 그림 31] 기초어휘사업의중장기로드맵 앞서본장의 1.1에서도논의한바와같이, 기초어휘사업은그사업의성격상중장기형으로추진함으로써국민의국어능력발전과언어환경개선에지속가능한사업으로자리매김할수있다. 위그림에서나타나는기초어휘사업계획의특징은 2+1+1의형태로사업계획을정교화함으로써토대확보단계 (2년) 에서부터발전및확장단계 (1년), 지속발전가능단계 (1년) 의순서로사업을심화, 확장할수있도록로드맵이마련되어있다는점이다. 다음은각단계에해당하는세부계획을단계별로살펴보도록한다. 117

국어 순화의 역사와 전망

국어 순화의 역사와 전망 전문용어의국어화 강현화 1. 들어가기 이해할 수 있는 쉬운 언어 사용의 전형을 만들고자 노력하고 있다. 따라서 본고는 전문 용어의 사용자가 전문가뿐만 아니라 일반인도 포 될 수 있다는 데에서 출발한다. 이러한 출발점을 시작으로 과연 전문 함 용어의 국어화가 어떻게 나아가야 하는지에 대해 고민해 보고자 한다. 2. 전문 용어 연구의 쟁점 2.1. 전문 용어

More information

<B3EDB9AEC0DBBCBAB9FD2E687770>

<B3EDB9AEC0DBBCBAB9FD2E687770> (1) 주제 의식의 원칙 논문은 주제 의식이 잘 드러나야 한다. 주제 의식은 논문을 쓰는 사람의 의도나 글의 목적 과 밀접한 관련이 있다. (2) 협력의 원칙 독자는 필자를 이해하려고 마음먹은 사람이다. 따라서 필자는 독자가 이해할 수 있는 말이 나 표현을 사용하여 독자의 노력에 협력해야 한다는 것이다. (3) 논리적 엄격성의 원칙 감정이나 독단적인 선언이

More information

학교교과교습학원 ( 예능계열 ) 및평생직업교육학원의시설 설비및교구기준적정성연구 A Study on the Curriculum, Facilities, and Equipment Analysis in Private Academy and It's Developmental Ta

학교교과교습학원 ( 예능계열 ) 및평생직업교육학원의시설 설비및교구기준적정성연구 A Study on the Curriculum, Facilities, and Equipment Analysis in Private Academy and It's Developmental Ta www.sen.go.kr 학교교과교습학원 ( 예능계열 ) 및평생직업교육학원의 시설 설비및교구기준연구 2012. 10. 학교교과교습학원 ( 예능계열 ) 및평생직업교육학원의시설 설비및교구기준적정성연구 A Study on the Curriculum, Facilities, and Equipment Analysis in Private Academy and It's Developmental

More information

ⅰ ⅱ ⅲ ⅳ ⅴ 1 Ⅰ. 서론 2 Ⅰ. 서론 3 4 1) 공공기관미술품구입실태조사 Ⅰ. 서론 5 2) 새예술정책미술은행 (Art Bank) 제도분석 3) 국내외사례조사를통한쟁점과시사점유추 4) 경기도내공공기관의미술품구입정책수립및활용방안을위 한단기및장기전략수립 6 7 Ⅱ. 경기도지역공공기관의미술품구입실태 및현황 1) 실태조사의목적 ž 2) 표본조사기관의범위

More information

2002report hwp

2002report hwp 2002 연구보고서 220-11 초 중등교육과정의성인지적개편을위한양성평등교육내용개발 한국여성개발원 발간사 양성평등교육내용개발진 연구요약 1. 연구목적 2. 연구방법 3. 7 차교육과정및교과서내용분석 가. 도덕과 나. 사회과 다. 실과 / 기술 가정과 4. 각교과별양성평등교육내용개발가. 도덕과 나. 사회과 다. 실과 / 기술 가정과 5. 결론 목 차 Ⅰ 서론

More information

차 례. 서론. 선행연구고찰. 학교생활기록부신뢰도제고를위한설문조사결과. 학교생활기록부신뢰도제고를위한면담조사결과 Ⅴ. 학교생활기록부신뢰도제고를위한개선방안제언 169 Ⅵ. 결론 195 참고문헌 부록 표차례 그림차례 서 론 1 Ⅰ. 서론 Ⅰ. 서론 1. 연구의필요성및목적 3 학교생활기록부신뢰도제고방안연구 4 Ⅰ. 서론 2. 연구의내용및범위 5 학교생활기록부신뢰도제고방안연구

More information

<BBE7C8B8C0FBC0C7BBE7BCD2C5EBBFACB1B820C3D6C1BEBAB8B0EDBCAD2E687770>

<BBE7C8B8C0FBC0C7BBE7BCD2C5EBBFACB1B820C3D6C1BEBAB8B0EDBCAD2E687770> 국립국어원 2007-01-42 사회적의사소통연구 : 성차별적언어표현사례조사및대안마련을위한연구 국립국어원 한국여성정책연구원 제출문 국립국어원장귀하 국립국어원의국고보조금지원으로수행한 사회적의사 소통연구 : 성차별적언어표현사례조사및대안마련을위한 연구 의결과보고서를작성하여제출합니다. 한국여성정책연구원 안상수 백영주, 양애경, 강혜란, 윤정주 목 차 연구개요 선행연구의고찰

More information

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )

278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 ) 여성경찰관의직업윤리의식결정요인분석 * An Analysis of Determinantal Factors Influencing Professional Ethical Standards of South Korean Police Women 신문희 ** 이영민 *** Ⅰ. 서론 Ⅱ. 이론적배경 Ⅲ. 연구방법 Ⅳ. 연구결과 Ⅴ. 결론 Ⅰ. 서론 278 경찰학연구제 12

More information

CR2006-41.hwp

CR2006-41.hwp 연구책임자 가나다 순 머 리 말 2006년 12월 한국교육학술정보원 원장 - i - - ii - - iii - 평가 영역 1. 교육계획 2. 수업 3. 인적자원 4. 물적자원 5. 경영과 행정 6. 교육성과 평가 부문 부문 배점 비율(%) 점수(점) 영역 배점 1.1 교육목표 3 15 45점 1.2 교육과정 6 30 (9%) 2.1 수업설계 6 30 2.2

More information

세미나자료 전국초 중 고성교육담당교사워크숍 일시 ( 목 ) 10:00~17:00 장소 : 한국교원대학교교원문화관

세미나자료 전국초 중 고성교육담당교사워크숍 일시 ( 목 ) 10:00~17:00 장소 : 한국교원대학교교원문화관 세미나자료집 전국초 중 고성교육담당교사워크숍 세미나자료 전국초 중 고성교육담당교사워크숍 일시 2007.12.27( 목 ) 10:00~17:00 장소 : 한국교원대학교교원문화관 워크숍일정표 시간주제사회 10:00-10:20 등록 10:20-10:30 개회사축사 : 신인철과장 ( 교육인적자원부폭력대책팀 ) 10:30-11:10 기조강연 : 학교성교육과교사의역할

More information

Microsoft PowerPoint - 26.pptx

Microsoft PowerPoint - 26.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2011년봄학기 강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI:   (LiD) - - * Way to Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp.353-376 DOI: http://dx.doi.org/10.21024/pnuedi.29.1.201903.353 (LiD) -- * Way to Integrate Curriculum-Lesson-Evaluation using Learning-in-Depth

More information

2002report220-10.hwp

2002report220-10.hwp 2002 연구보고서 220-10 대학평생교육원의 운영 방안 한국여성개발원 발 간 사 연구요약 Ⅰ. 연구목적 Ⅱ. 대학평생교육원의 변화 및 외국의 성인지적 접근 Ⅲ. 대학평생교육원의 성 분석틀 Ⅳ. 국내 대학평생교육원 현황 및 프로그램 분석 Ⅴ. 조사결과 Ⅵ. 결론 및 정책 제언 1. 결론 2. 대학평생교육원의 성인지적 운영을 위한 정책 및 전략 목

More information

Microsoft PowerPoint Relations.pptx

Microsoft PowerPoint Relations.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2010년봄학기강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

고3-02_비문학_2_사회-해설.hwp

고3-02_비문학_2_사회-해설.hwp 비문학 기출 제재별 문제 모음 (2007~2011학년도 학력평가) 정답 및 해설 사회 2 비문학 사회 01 사회 2011 학년도 10 월학력평가 정답과해설 사회 1 2012 학년도 11 월모의평가 ( 대전 ) 1. 이해한내용으로추론하는능력을파악하는문제이다. 1 7. 유사한사례를파악한다. 5 [ 오답풀이 ] 2. 이해한내용을바탕으로적용할수있는능력을파악하는문제이다.

More information

<B3EDB4DC28B1E8BCAEC7F6292E687770>

<B3EDB4DC28B1E8BCAEC7F6292E687770> 1) 초고를읽고소중한조언을주신여러분들게감사드린다. 소중한조언들에도불구하고이글이포함하는오류는전적으로저자개인의것임을밝혀둔다. 2) 대표적인학자가 Asia's Next Giant: South Korea and Late Industrialization, 1990 을저술한 MIT 의 A. Amsden 교수이다. - 1 - - 2 - 3) 계량방법론은회귀분석 (regression)

More information

경상북도와시 군간인사교류활성화방안

경상북도와시 군간인사교류활성화방안 2010-14 경상북도와시 군간인사교류활성화방안 목 차 경상북도와시 군간인사교류활성화방안 요약,,,, 4, 5, 6,,,,, 5 58 1:1 34, 24 ( 13, 11 ) 2010 2017 8 i (5 8 ),.,, 74 (4 3, 5 19, 6 52 ) (4~6 4,901 ) 1.5% 5% ii 제 1 장 연구개요 1 연구배경과목적 2 연구범위와방법

More information

< C0DAC0B2C5BDB1B820BFEEBFB520B8DEB4BABEF32D33C2F720C6EDC1FD2E687770>

< C0DAC0B2C5BDB1B820BFEEBFB520B8DEB4BABEF32D33C2F720C6EDC1FD2E687770> 과학영재의창의적탐구능력배양을위한 R&E 프로그램기획 운영핸드북 Handbook of Annual Planning and Implementing R&E Program for the Talented 2017 과학영재창의연구 (R&E) 지원센터 이핸드북은과학고와과학영재학교의연간 R&E 프로그램기획 운영을효과적으로지원하기위해개발된것으로, 한국과학창의재단지정과학영재창의연구

More information

핵 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (14) 27 (29) 2

핵 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (14) 27 (29) 2 1 학년 2 학년 3 학년 합계 6 5 11 5 5 16 문학과예술 핵 역사와철학 사회와이념 선택 4 4 1 1 3 3 6 11 학점계 12 12 24 5 1 6 3 3 6 36 ㆍ제 2 외국어이수규정 이수규정 또는 영역에서 과목 학점 이수하고 수량적석과추론 과학적사고와실험 에서 과목 학점 이수해도됨 외국어및고전어 중급이상외국어및고전어과목명 핵 1 학년 2

More information

viii 본 연구는 이러한 사회변동에 따른 고등직업교육기관으로서 전문대 학의 역할 변화와 지원 정책 및 기능 변화를 살펴보고, 새로운 수요와 요구에 대응하기 위한 전략으로 전문대학의 기능 확충 방안을 모색하 였다. 연구의 주요 방법과 절차 첫째, 기존 선행 연구 검토

viii 본 연구는 이러한 사회변동에 따른 고등직업교육기관으로서 전문대 학의 역할 변화와 지원 정책 및 기능 변화를 살펴보고, 새로운 수요와 요구에 대응하기 위한 전략으로 전문대학의 기능 확충 방안을 모색하 였다. 연구의 주요 방법과 절차 첫째, 기존 선행 연구 검토 vii 요 약 연구의 필요성 및 목적 우리 사회는 끊임없이 변화를 겪으며 진화하고 있다. 이러한 사회변 동은 정책에 영향을 미치게 되고, 정책은 기존의 정책 방향과 내용을 유지 변화시키면서 정책을 계승 완료하게 된다. 이러한 정책 변화 는 우리 사회를 구성하는 다양한 집단과 조직, 그리고 우리의 일상에 긍정적으로나 부정적으로 영향을 주게 된다. 이러한 차원에서

More information

핵 심 교 양 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 교양학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (

핵 심 교 양 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 교양학점계 학년 2 학년 3 학년합계비고 14 (15) 13 ( 1 학년 2 학년 3 학년 합계 6 5 11 5 5 16 문학과예술 핵 심 교 역사와철학 사회와이념 3 3 3 양 3 3 3 3 3 3 선택 4 4 1 1 3 3 6 11 교양학점계 12 12 24 5 1 6 3 3 6 36 ㆍ제 2 외국어이수규정 이수규정 또는 영역에서 과목 학점 이수하고 수량적석과추론 과학적사고와실험 에서 과목 학점 이수해도됨 외국어및고전어

More information

2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관

2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관 2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관 2015 개정교육과정에따른정보과평가기준개발연구 연구협력진 머리말 연구요약 차례 Ⅰ 서론 1 Ⅱ 평가준거성취기준, 평가기준, 성취수준, 예시평가도구개발방향 7 Ⅲ 정보과평가준거성취기준, 평가기준, 성취수준, 예시평가도구의개발 25 Ⅳ 정보과평가준거성취기준, 평가기준, 성취수준, 예시평가도구의활용방안

More information

유의사항 Information marking example 1 3 4

유의사항 Information marking example 1 3 4 제 26 회 한국어능력시험 The 26th Test of Proficiency in Korean 일반한국어능력시험 (S-TOPIK) 초급 (Beginner) B 1 교시표현 ( 어휘및문법, 쓰기 ) 수험번호 (Application No.) 이름 (Name) 한국어 (Korean) 영어 (English) 유의사항 Information marking example

More information

연구보고서 2009-05 일반화선형모형 (GLM) 을이용한 자동차보험요율상대도산출방법연구 Ⅰ. 요율상대도산출시일반화선형모형활용방법 1. 일반화선형모형 2 연구보고서 2009-05 2. 일반화선형모형의자동차보험요율산출에적용방법 요약 3 4 연구보고서 2009-05 Ⅱ. 일반화선형모형을이용한실증분석 1. 모형적용기준 < > = 요약 5 2. 통계자료및통계모형

More information

국립국어원 2012-01-30 한국어교육 어휘내용개발 (1 단계 ) 연구책임자 강현화 제출문 국립국어원장귀하 한국어교육어휘내용개발 단계 에관하여귀원과체결한연 구용역계약에의하여연구보고서를작성하여제출합니다 년 월 일 연구책임자 강현화 연세대학교 연구기관 연구책임자 공동연구원 연세대학교산학협력단 강현화 연세대 정희정 연세대 심혜령 배재대 한송화 연세대 원미진 건국대

More information

열거형 교차형 전개형 상승형 외주형 회전형 도해패턴 계층형 구분형 확산형 합류형 대비형 상관형 (C) 2010, BENESO All Rights Reserved 2

열거형 교차형 전개형 상승형 외주형 회전형 도해패턴 계층형 구분형 확산형 합류형 대비형 상관형 (C) 2010, BENESO All Rights Reserved 2 c 2010, BENESO All rights reserved 1 열거형 교차형 전개형 상승형 외주형 회전형 도해패턴 계층형 구분형 확산형 합류형 대비형 상관형 (C) 2010, BENESO All Rights Reserved 2 u 열거형 : 대소, 위치등의관계에대해설명 u 교차형 : 중복, 합동, 복합, 공동등의관계에대해설명 설명도, 대소관계도, 제휴관계도,

More information

< FB1B9BEEEB1B3C0B0BFACB1B C1FD5FC3D6C1BE2E687770>

< FB1B9BEEEB1B3C0B0BFACB1B C1FD5FC3D6C1BE2E687770> 글내용의전개방식에대하여 14) 이성영 * < 次例 > Ⅰ. Ⅱ. Ⅲ. Ⅳ. Ⅰ. 들어가며..,..,.,., * 200 국어교육연구제 31 집,. ( ), ( ), ( ).,... 1).,,.,. Ⅱ. 전개방식의개념과성격 1. 전개방식의개념 1) 개념의혼란양상 1),. 글내용의전개방식에대하여 201.. 2007 < > < >. < > - (2) - ( ) -

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

2014 년도사업계획적정성재검토보고서 차세대바이오그린 21 사업

2014 년도사업계획적정성재검토보고서 차세대바이오그린 21 사업 2014 년도사업계획적정성재검토보고서 차세대바이오그린 21 사업 목차 i 목 차 iv 목차 표목차 목차 v vi 목차 목차 vii 그림목차 viii 목차 요 약 요약 1 요 약 제 1 장사업개요및조사방법 4 차세대바이오그린 21 사업사업계획적정성재검토보고서 : * ( 15 ) 요약 5 : 6 차세대바이오그린 21 사업사업계획적정성재검토보고서 요약 7 8

More information

그린홈이용실태및만족도조사

그린홈이용실태및만족도조사 2009 년도연구용역보고서 그린홈이용실태및 만족도설문조사 - 2009. 11. - 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 책임연구원 이화여자대학교소비자학과교수정순희 그린홈이용실태및만족도 설문조사 2009. 11. 책임연구원 정순희 ( 이화여자대학교소비자학과교수

More information

국립국어원 20010-00-00 발간등록번호 00-000000-000000-00 국어정책 통계 조사 및 통계 연보 작성 연구책임자 이순영 제 출 문 국립국어원장 귀하 국어정책 통계 조사 및 통계 연보 작성 에 관하여 귀 원과 체결한 연 구 용역 계약에 의하여 연구 보고서를 작성하여 제출합니다. 2010년 12월 2일 연구책임자: 이순영(고려대학교 국어교육과)

More information

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: * Review of Research

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI:   * Review of Research Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp.79-102 DOI: http://dx.doi.org/10.21024/pnuedi.27.2.201706.79 * Review of Research Trends on Curriculum for Students with Severe and multiple

More information

2017 치안정책연구제 31 권제 1 호 Police Science Institute

2017 치안정책연구제 31 권제 1 호 Police Science Institute 교통경찰서비스만족요인우선순위결정연구 교통경찰서비스만족요인우선순위결정연구 차례 정철우 * 이종화 ** Ⅰ. 들어가며 1) Ⅱ. 이론적고찰 Ⅲ. 자료수집및연구방법 Ⅳ. 분석결과 Ⅴ. 나가며 국문요약 주제어 : 교통경찰, 서비스요소, 서비스만족, 우선순위, 요구분석 Ⅰ. 들어가며 치안정책연구소 2017 치안정책연구제 31 권제 1 호 Police Science Institute

More information

강의계획서 과목 : JUN s TOEIC 700+( 도약 ) 2017년 3차강사 : 황준선 교재 : ETS 토익기본서 (RC&LC)+ 수업부교재 (JUN s TOEIC 700+) + 품사별추가문제 +Mini Test 수업목표 : LC & RC 필수기본전략수립및 GRAM

강의계획서 과목 : JUN s TOEIC 700+( 도약 ) 2017년 3차강사 : 황준선 교재 : ETS 토익기본서 (RC&LC)+ 수업부교재 (JUN s TOEIC 700+) + 품사별추가문제 +Mini Test 수업목표 : LC & RC 필수기본전략수립및 GRAM 강의계획서 과목 : JUN s TOEIC 700+( 도약 / 단과 ) 2017년 3차강사 : 황준선 교재 : ETS 토익기본서 (RC)+ 수업부교재 (JUN s Toeic 700+)+ 추가문제 + 품사별추가문제 수업목표 : 총체적문장구조의이해 & 확립을통한품사 + 어휘유형 100% 정답및 Part 7 Key Word Location 훈련을통한 350+ 목표

More information

ad-200200004.hwp

ad-200200004.hwp 탈성매매를 위한 사회복귀지원 프로그램 연구 여 성 부 목 차 Ⅰ. 서론 Ⅱ. 이론적 배경 및 선행연구결과 정리 Ⅲ. 여성복지상담소 실태조사 결과 Ⅳ. 선도보호시설의 운영 및 프로그램 현황 조사 결과 Ⅴ. 결론 참고문헌 부 록 표 목 차 그 림 목 차 부 표 목 차 Ⅰ. 서 론 . 서론 1. 연구의 목적 및 필요성 탈성매매를 위한 사회복귀지원 프로그램 연구

More information

4

4 4 5 6 7 8 9 10 11 12 단계 학습기간 예비 파닉스 예비 초등 초등 예비중/중등 1개월 6개월 6개월 3개월 학습량 어휘 수 문장 수 331 456 477 730 935 1,335 1,882 1,210 단계 학습기간 기본과정 (권 수/차시 수) 예비 파닉스 1개월 Yoon s Smart Kids (3/18) 학습내용 어휘 노출을 통한 음소인식 Yoon

More information

지도임자_1204_출판(최종).hwp

지도임자_1204_출판(최종).hwp 2012 년도수요예측재조사보고서 국도 24 호선 ( 지도 ~ 임자 ) 건설사업 2012. 12 요 약 Ⅰ. 수요예측재조사의개요 1. 사업의개요 24(~) 4.99km 2 1975, 2006,, : L=4.99km(B=11.0m, V=60km/h) 3 1,955m( 2 1,920m), 3 : 182,151 ( 100%) : ~ : 2012 2019 (8) :

More information

장애인건강관리사업

장애인건강관리사업 장애인건강관리사업 2013. 2013 : : ( ) : ( ) ( ) ( ) : ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 1.. 2.. 제1장. 연구개요 1 제2장. 1세부과제 : 장애인건강상태평가와모니터링 10 - i - 제3장. 2세부과제 : 장애인만성질환위험요인조사연구 117 - ii - 4장.

More information

발간등록번호 11-1342000-000039-01 - iv - - v - - vi - - vii - - viii - - ix - - x - - i - - ii - - iii - - iv - - v - - vi - - vii - - viii - - ix - - x - - xi - - xii - - xiii - - xiv - - 1 - - 2 - - 3 -

More information

< C617720BBF3B4E3BBE7B7CAC1FD20C1A632B1C72E687770>

< C617720BBF3B4E3BBE7B7CAC1FD20C1A632B1C72E687770> IT&Law 상담사례집 - 제 2 권 - IT&Law 상담사례집제2권 - 1 - 제 1 장프로그램저작권일반 - 2 - IT&Law 상담사례집제2권 - 3 - 제 1 장프로그램저작권일반 - 4 - IT&Law 상담사례집제2권 - 5 - 제 1 장프로그램저작권일반 - 6 - IT&Law 상담사례집제2권 - 7 - 제 1 장프로그램저작권일반 - 8 -

More information

이보고서는 2010 년한국언론진흥재단의언론진흥기금을지원받아수행한것입니다. 보고서의내용은한국언론진흥재단의공식견해가아닌연구자의연구결과임을밝힙니다. 목 차 요약문 ⅳ Ⅰ. 서론 1 5 6 7 7 11 13 14 14 16 18 21 29 40-1 - 47 47 48 66 68 69 70 70 71 72 72 73 74-2 - < 표 > 목차 표 1 대한매일신보보급부수

More information

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: NCS : * A Study on

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI:   NCS : * A Study on Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp.157-176 DOI: http://dx.doi.org/10.21024/pnuedi.28.3.201809.157 NCS : * A Study on the NCS Learning Module Problem Analysis and Effective

More information

학점배분구조표(표 1-20)

학점배분구조표(표 1-20) 1 학년 2 학년 3 학년합 1 2 1 2 1 2 학문의기초 6 6 12 3 3 15 핵문학과예술 3 3 3 심역사와철학 교 양 자연의이해 3 3 3 선택 3 3 3 3 3 3 6 12 교양학점 12 12 24 3 3 6 3 3 6 36 1 학년 2 학년 3 학년합 1 2 1 2 1 2 학문의기초 3 3 6 6 핵 문학과예술 심 역사와철학 3 3 6 6 교

More information

도약종합 강의목표 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 점향상시킵니다. 강의대상다음과같은분들에게가장적합합니다. -현재토익점수 500점에서 600점대이신분들에게가장좋습니다. -정기토익을 2-3번본적이있으신분

도약종합 강의목표 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 점향상시킵니다. 강의대상다음과같은분들에게가장적합합니다. -현재토익점수 500점에서 600점대이신분들에게가장좋습니다. -정기토익을 2-3번본적이있으신분 도약종합 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 100-200점향상시킵니다. -정기토익을 2-3번본적이있으신분. -수업도많이들어봤고, 문제도많이풀었지만문법정리가제대로되지않은분. 강의특징수업시간에토익과관련없는사적인잡담으로시간낭비하지않는수업입니다. LC : 파트별집중정리한문제풀이로유형을익혀나가는수업입니다. RC

More information

차 례 머리말 Ⅰ. 21세기세종계획일지 Ⅱ. 21세기세종계획사업조직변천및주요사업내역 i -

차 례 머리말 Ⅰ. 21세기세종계획일지 Ⅱ. 21세기세종계획사업조직변천및주요사업내역 i - 21 세기세종계획백서 2007 차 례 머리말 Ⅰ. 21세기세종계획일지 1 3 5 7 10 16 18 20 23 24 26 29 Ⅱ. 21세기세종계획사업조직변천및주요사업내역 3 3 35 36 38 - i - 39 41 42 44 46 47 50 Ⅲ. 예산집행내역 51 53 53 54 Ⅳ. 참여자명단 5 57 128 Ⅴ. 21세기세종계획성과물구축현황 56 1 Ⅵ.

More information

다문화 가정의 부모

다문화 가정의 부모 영유아아동정신건강연구 Korean Journal for Infant Mental Health 2013, Vol. 6, No. 1, 57-84 영유아기정서및행동문제에대한 부모와일반교사의인식및지원욕구조사 - 57 - 영유아아동정신건강연구 6 권 1 호 - 58 - 영유아기정서및행동문제에대한부모와일반교사의인식및지원욕구조사 - 59 - 영유아아동정신건강연구 6 권

More information

학자금지원을위한소득기준 산출방식개선방안연구 한국장학재단이사장귀하 본보고서를 학자금지원을위한소득기준산출방식개선방안연구 의최종 보고서로제출합니다. 2011. 9 주관연구기관 : 한국보건복지정보개발원 연구진 연구책임자 : 홍성대연구위원공동연구원 : 이대영책임연구원추병주연구원구자연위촉연구원 학자금지원을위한소득기준 산출방식개선방안연구 주관연구기관 : 한국보건복지정보개발원

More information

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a 조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a) b) 조사연구 주제어 패널조사 횡단면가중치 종단면가중치 선형혼합모형 일반화선형혼 합모형

More information

2012-82 The Study on the Alternative Plans for Conservation and Effective Use in Palgong-Mountain , i ii iii iv v ? vi vii 제 절연구배경및목적 연구배경과필요성 연구목적 제 절연구범위 연구내용및방법 연구범위 연구내용 연구방법 제 절선행연구고찰 주요개념 관련연구

More information

2) 어휘 : 모국어화자에게하나의의미덩어리로인식되는것접사, 구단위항목 ( 연어, 관용구, 문장 ), 문법적연어, 조사결합형, 어미결합형 3.2. 조어법에따른어휘교육 단일어 : 하나의어근으로이루어진단어 ( 예 : 책, 손, 떡, 국, 머리등 ) 파생어 : 어근에접두사나접

2) 어휘 : 모국어화자에게하나의의미덩어리로인식되는것접사, 구단위항목 ( 연어, 관용구, 문장 ), 문법적연어, 조사결합형, 어미결합형 3.2. 조어법에따른어휘교육 단일어 : 하나의어근으로이루어진단어 ( 예 : 책, 손, 떡, 국, 머리등 ) 파생어 : 어근에접두사나접 어휘교육론 1. 개관 1. 어휘교육의중요성 - 문법없이는의미가거의전달되지않지만어휘가없으면의미는전혀전달되지않는다. (David Wilkins). - 당신이대부분의시간을문법을공부하는데쓴다면, 영어는많이향상되지않겠지만, 더많은단어와표현을학습한다면최고의향상을볼수있을것이다. 문법으로는거의말할수없지만, 단어들로는거의모든것을말할수있다. (Dellar H and Hocking

More information

CRM 2010-65-11 2010 교육정책네트워크 교육현장순회토론회 ( 전라북도교육청 ) 2009 개정교육과정의현장적합성제고를위한방향과과제 일시 : 2010년 11월 10일수요일 15:00 ~ 17:30 장소 : 전라북도교육청종합상황실주최 : 전라북도교육청 교육정책네트워크 * 주관 : 한국교육개발원 세부일정 15:00~15:10 : () - - ( ) 15:10~15:40

More information

C# Programming Guide - Types

C# Programming Guide - Types C# Programming Guide - Types 최도경 lifeisforu@wemade.com 이문서는 MSDN 의 Types 를요약하고보충한것입니다. http://msdn.microsoft.com/enus/library/ms173104(v=vs.100).aspx Types, Variables, and Values C# 은 type 에민감한언어이다. 모든

More information

<B9ABC1A62D31>

<B9ABC1A62D31> 08학년도 교육과정안내 P A R T 0 중국비즈니스 교육목적 대학의 교육목적 탁월한 실용전문인 양성 화합하는 민주시민 양성 연계전공 교육목적 학제적 연계 프로그램을 통하여 교과과정을 운영함으로써 종합적인 사고 능력과 실무능력을 구비한 유능한 인재를 양성 교육목표 대학의 교육목표 연계전공 교육목표 봉사하는 리더십 함양 건강한 육체와 정신함양 중국 사회, 문화

More information

Output file

Output file 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 An Application for Calculation and Visualization of Narrative Relevance of Films Using Keyword Tags Choi Jin-Won (KAIST) Film making

More information

5 291

5 291 1 2 3 4 290 5 291 1 1 336 292 340 341 293 1 342 1 294 2 3 3 343 2 295 296 297 298 05 05 10 15 10 15 20 20 25 346 347 299 1 2 1 3 348 3 2 300 301 302 05 05 10 10 15 20 25 350 355 303 304 1 3 2 4 356 357

More information

11¹Ú´ö±Ô

11¹Ú´ö±Ô A Review on Promotion of Storytelling Local Cultures - 265 - 2-266 - 3-267 - 4-268 - 5-269 - 6 7-270 - 7-271 - 8-272 - 9-273 - 10-274 - 11-275 - 12-276 - 13-277 - 14-278 - 15-279 - 16 7-280 - 17-281 -

More information

농림축산식품부장관귀하 본보고서를 미생물을활용한친환경작물보호제및비료의제형화와현장적용매뉴 얼개발 ( 개발기간 : ~ ) 과제의최종보고서로제출합니다 주관연구기관명 : 고려바이오주식회사 ( 대표자 ) 김영권 (

농림축산식품부장관귀하 본보고서를 미생물을활용한친환경작물보호제및비료의제형화와현장적용매뉴 얼개발 ( 개발기간 : ~ ) 과제의최종보고서로제출합니다 주관연구기관명 : 고려바이오주식회사 ( 대표자 ) 김영권 ( 농림축산식품부장관귀하 본보고서를 미생물을활용한친환경작물보호제및비료의제형화와현장적용매뉴 얼개발 ( 개발기간 :2014. 7. 29 ~ 2016. 7. 28.) 과제의최종보고서로제출합니다. 2016. 7. 28. 주관연구기관명 : 고려바이오주식회사 ( 대표자 ) 김영권 ( 인 ) 협동연구기관명 : 목원대학교산학협력단 ( 대표자 ) 고대식 ( 인 ) 협동연구기관명

More information

3 Contents 8p 10p 14p 20p 34p 36p 40p 46P 48p 50p 54p 58p 생명다양성재단 영물이라는 타이틀에 정 없어 보이는 고양이, 날카롭게 느껴지시나요? 얼음이 따뜻함에 녹듯이, 사람에게 경계심 많은 길고양이도 곁을 내어주면 얼음 녹듯이 당신을 바라봅니다. 길 위에 사는 생명체라 하여 함부로 대하지 말아주세요. 싫으면 외면해주세요.

More information

<4D F736F F D20C0CCBEBEC1A6BEEE5FC3A5BCD2B0B35F >

<4D F736F F D20C0CCBEBEC1A6BEEE5FC3A5BCD2B0B35F > 이씨제어 한글기술서적소개 1. SIMATIC S7-300/400 초급과정교육교재 S7-300/400 에대한초급교육에사용되는한글판교육교재. * 참고영어원문 : Programming with STEP 7, Automating with STEP 7 in STL and SCL A4 단면 280 쪽, 파워포인트컬러판 2. SIMATIC S7-300/400 중급과정교육교재

More information

사회수요에맞는교육을위한정책방안연구 연구책임자 : 박 동 ( 한국직업능력개발원 )

사회수요에맞는교육을위한정책방안연구 연구책임자 : 박 동 ( 한국직업능력개발원 ) 사회수요에맞는교육을위한정책방안연구 2016. 4. 연구책임자 : 박 동 ( 한국직업능력개발원 ) 사회수요에맞는교육을위한정책방안연구 2016. 4. 연구책임자 : 박 동 ( 한국직업능력개발원 ) 2015 12 2016 4.. 사회수요에맞는교육을위한정책방안연구 2016. 4. 연구책임자 : 박동 ( 한국직업능력개발원 ) 공동연구자 : 전재식 ( 한국직업능력개발원

More information

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: : * Research Subject

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI:   : * Research Subject Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp.91-116 DOI: http://dx.doi.org/10.21024/pnuedi.29.1.201903.91 : * Research Subject Trend Analysis on Educational Innovation with Network

More information

<BBEAC0E7BAB8C7E8C1A6B5B52E687770>

<BBEAC0E7BAB8C7E8C1A6B5B52E687770> 산재보험제도발전방안에대한연구 ( 재활 복지 ) 요약 ⅰ ⅱ 산재보험제도발전방안에대한연구 ( 재활 복지 ) 요약 ⅲ ⅳ 산재보험제도발전방안에대한연구 ( 재활 복지 ) 요약 ⅴ ⅵ 산재보험제도발전방안에대한연구 ( 재활 복지 ) 제 1 장서론 1 2 산재보험제도발전방안에대한연구 ( 재활 복지 ) 제 1 장서론 3 4 산재보험제도발전방안에대한연구

More information

- i - - ii - - iii - - iv - - v - - vi - - 1 - - 2 - - 3 - 1) 통계청고시제 2010-150 호 (2010.7.6 개정, 2011.1.1 시행 ) - 4 - 요양급여의적용기준및방법에관한세부사항에따른골밀도검사기준 (2007 년 11 월 1 일시행 ) - 5 - - 6 - - 7 - - 8 - - 9 - - 10 -

More information

CC......-.........hwp

CC......-.........hwp 방송연구 http://www.kbc.go.kr/ 텔레비전의 폭력행위는 어떠한 상황적 맥락에서 묘사되는가에 따라 상이한 효과를 낳는다. 본 연구는 텔레비전 만화프로그램의 내용분석을 통해 각 인 물의 반사회적 행위 및 친사회적 행위 유형이 어떻게 나타나고 이를 둘러싼 맥락요인들과 어떤 관련성을 지니는지를 조사하였다. 맥락요인은 반사회적 행위 뿐 아니라 친사회적

More information

ad-200400012.hwp

ad-200400012.hwp 제17대 총선과 남녀유권자의 정치의식 및 투표행태에 관한 연구 - 여성후보 출마 선거구 조사를 중심으로 - 2004. 7 여 성 부 제17대 총선과 남녀유권자의 정치의식 및 투표행태에 관한 연구 - 여성후보 출마 선거구 조사를 중심으로 - 2004. 7 여 성 부 연구요약 표 주제 및 연도별 여성유권자 연구 현황 표 출마한 여성후보 인지시기 투표후보여성

More information

- 89 -

- 89 - - 89 - - 90 - - 91 - - 92 - - 93 - - 94 - - 95 - - 96 - - 97 - - 98 - - 99 - 있다 장정임 ( 2009). Toylor 와 Betz(1983) 의 진로결정자기효능감 척도 와 및 등이 개발 (career 와 한 진로결정자기효능감 척도 단축형 은 미래계획수립 문제해결과 같은 자신에 대한 이해를 바탕으로

More information

08학술프로그램

08학술프로그램 www.kafle.or.kr Foreign Language Teachers Expertise 01 01 02 03 04 05 06 07 한국외국어교육학회 2008년 겨울학술대회 학술대회 관련 문의 좌장: 이강국 (대학원 309호) 13:30~14:00 명사구 내 형용사의 위치와 의미 유은정 이상현 곽재용 14:00~14:30 스페인어 문자체계의 발달과정 연구

More information

2003report hwp

2003report hwp 2003 연구보고서 220-13 교사의성인지적교육활동능력제고를위한프로그램개발 () 한국여성개발원 교사의성인지력향상프로그램개발진 발간사 년 월 한국여성개발원원장 연구요약 ,,,', 20 60 ( 1). Ⅰ Ⅰ. 서론 교사의성인지적교육활동능력제고를위한프로그램개발 Ⅰ. 서론 교사의성인지적교육활동능력제고를위한프로그램개발 Ⅰ. 서론 교사의성인지적교육활동능력제고를위한프로그램개발

More information

조사보고서 구조화금융관점에서본금융위기 분석및시사점

조사보고서 구조화금융관점에서본금융위기 분석및시사점 조사보고서 2009-8 구조화금융관점에서본금융위기 분석및시사점 Ⅰ. 서론 Ⅱ. 구조화금융의미시적시장구조 2 조사보고서 2009-08 요약 3 Ⅲ. 서브프라임위기의현황과분석 4 조사보고서 2009-08 Ⅳ. 서브프라임위기의원인및특징 요약 5 6 조사보고서 2009-08 Ⅴ. 금융위기의파급경로 Ⅵ. 금융위기극복을위한정책대응 요약 7 8 조사보고서 2009-08

More information

#Ȳ¿ë¼®

#Ȳ¿ë¼® http://www.kbc.go.kr/ A B yk u δ = 2u k 1 = yk u = 0. 659 2nu k = 1 k k 1 n yk k Abstract Web Repertoire and Concentration Rate : Analysing Web Traffic Data Yong - Suk Hwang (Research

More information

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 - 에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 - . - 2 - . 1. - 3 - [ 그림 1] 도시가스수요와실질 GDP 추이 - 4 - - 5 - - 6 - < 표 1>

More information

ii iv 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 2 3 4 5 1 3 6 37 제품군 제품분류 39 제출물관리대장 41 43 45 47 < 접수번호 > 관리번호 평가결과보고서 < 평가대상제품명 > 년월일 < 평가기관명 > 49 제 1 장개요 o 일반적으로다음의사항을포함한다. - 정보보호제품평가인증관련규정 (

More information

KD2002-29-02.hwp

KD2002-29-02.hwp 韓 國 敎 育 요 약 학술 논문.,......,.,,,......., (, 1999).. ...,.,.,,,.,,,,, (, 1990).,,. (,, 1999)...,...,,,.,,.,.. (, 1999),,., 학술 논문....,., (, 1998).., (Keeves, 1997)...,...,.,,.,... (, 1970). .,,,,,.,,,,...,,,,,..

More information

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: : A Study on the Ac

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI:   : A Study on the Ac Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp.269-293 DOI: http://dx.doi.org/10.21024/pnuedi.28.1.201803.269 : A Study on the Actual Condition of Character Education in Early Childhood

More information

슬라이드 1

슬라이드 1 1 언어의두가지모습과언어학 5 1. 언어수행 (linguistic performance): 실제대화상황에 서사용하는언어 (the actual use of language in concrete situations) 2. 언어능력 (linguistic competence): 머릿속에저장되어 있는언어지식 (the mental knowledge that a speaker

More information

allinpdf.com

allinpdf.com 이책은북한에대한이해를돕기위해통일교육원에서발간한교재입니다. 각급교육기관등에서널리활용하여주시기바랍니다. 차례 Ⅰ. 북한이해의관점 Ⅱ. 북한의정치 차례 Ⅲ. 북한의대외관계 Ⅳ. 북한의경제 Ⅴ. 북한의군사 Ⅵ. 북한의교육 차례 Ⅶ. 북한의문화 예술 Ⅷ. 북한의사회 Ⅸ. 북한주민의생활 차례 Ⅹ. 북한의변화전망 제 1 절 북한이해의관점 Ⅰ. 북한이해의관점 Ⅰ. 북한이해의관점

More information

제 3강 역함수의 미분과 로피탈의 정리

제 3강 역함수의 미분과 로피탈의 정리 제 3 강역함수의미분과로피탈의정리 역함수의미분 : 두실수 a b 와폐구갂 [ ab, ] 에서 -이고연속인함수 f 가 ( a, b) 미분가능하다고가정하자. 만일 f '( ) 0 이면역함수 f 은실수 f( ) 에서미분가능하고 ( f )'( f ( )) 이다. f '( ) 에서 증명 : 폐구갂 [ ab, ] 에서 -이고연속인함수 f 는증가함수이거나감소함수이다 (

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA The e-business Studies Volume 17, Number 6, December, 30, 2016:275~289 Received: 2016/12/02, Accepted: 2016/12/22 Revised: 2016/12/20, Published: 2016/12/30 [ABSTRACT] SNS is used in various fields. Although

More information

외국인투자유치성과평가기준개발

외국인투자유치성과평가기준개발 2010 년도연구용역보고서 외국인투자유치의성과평가기준개발 - 2010. 10. - 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 책임연구원 국립부경대학교지역사회연구소권오혁 수신 : 대한민국국회예산정책처장귀하. 2010 10 : : : : 요약문 I. 서론 1.

More information

소준섭

소준섭 2014 년미얀마의국가경쟁력평가와정책적시사점 : 세계경쟁력지수 (GCI) 분석을통한개발협력분야모색 원순구 목 차 Ⅰ. 서론 Ⅱ. 미얀마및한국의세계경쟁력지수 (GCI) 분석 1. 세계경쟁력지수의구조및측정 2. 미얀마국가경쟁력지수평가분석 3. 한국의국가경쟁력지수분석 Ⅲ. 양국의경쟁력지수 GAP 분석을통한개발협력분야모색 1. 한국과미얀마의부문별경쟁력지수 GAP 분석

More information

UDI 이슈리포트제 20 호 울산권개발제한구역의효율적관리방안 도시계획연구실정현욱연구원 052) / < 목차 > 요약 1 Ⅰ. 서론 3 Ⅱ. 울산권개발제한구역의현황및문제점 4 Ⅲ. 외국의개발제구역대안적관리사

UDI 이슈리포트제 20 호 울산권개발제한구역의효율적관리방안 도시계획연구실정현욱연구원 052) / < 목차 > 요약 1 Ⅰ. 서론 3 Ⅱ. 울산권개발제한구역의현황및문제점 4 Ⅲ. 외국의개발제구역대안적관리사 UDI 이슈리포트제 20 호 울산권개발제한구역의효율적관리방안 2009. 12. 7. 도시계획연구실정현욱연구원 052) 283-7752 / jhw@udi.re.kr < 목차 > 요약 1 Ⅰ. 서론 3 Ⅱ. 울산권개발제한구역의현황및문제점 4 Ⅲ. 외국의개발제구역대안적관리사례 10 Ⅳ. 울산권개발제한구역의효율적관리방안 16 Ⅴ. 결론 21 울산권개발제한구역의효율적관리방안

More information

???德嶠짚

???德嶠짚 2018 3+4 NO.132 SDGs Social Equality Communication Human Rights Justice Peace www.kipa.re.kr CONTENTS 2018 3+4 NO.132 02 52 16 22 58 32 38 44 66 www.kipa.re.kr 74 80 132 2018 4 13 235 02-2007-0644 02-564-2006

More information

<28C6EDC1FD FBBF5B1B9BEEEBBFDC8B C3D6C1BE2E687770>

<28C6EDC1FD FBBF5B1B9BEEEBBFDC8B C3D6C1BE2E687770> 특집 4 21 세기세종말뭉치제대로살펴보기 언어정보나눔터활용하기 황용주 최정도 국립국어원 1. 서론 잘알려져있다시피 21세기세종계획 은 1997년에그계획이수립되었고이듬해인 1998년부터 2007년까지 10년동안시행된한국의국어정보화중장기발전계획이다 ( 홍윤표, 2009). 이사업을통해한국어연구를목적으로하는기초자료에대한갈증을상당히풀게된것이사실이다. 최초이글은 21세기세종계획

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

#7단원 1(252~269)교

#7단원 1(252~269)교 7 01 02 254 7 255 01 256 7 257 5 10 15 258 5 7 10 15 20 25 259 2. 어휘의 양상 수업 도우미 참고 자료 국어의 6대 방언권 국어 어휘의 양상- 시디(CD) 수록 - 감광해, 국어 어휘론 개설, 집문당, 2004년 동북 방언 서북 방언 중부 방언 서남 방언 동남 방언 제주 방언 어휘를 단어들의 집합이라고 할 때,

More information

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은 2013 년도연구용역보고서 공공기관임금프리미엄추계 - 2013. 12.- 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한국노동연구원선임연구위원정진호 공공기관임금프리미엄추계 2013. 12. 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영

More information

- 2 -

- 2 - - 1 - - 2 - - - - 4 - - 5 - - 6 - - 7 - - 8 - 4) 민원담당공무원 대상 설문조사의 결과와 함의 국민신문고가 업무와 통합된 지식경영시스템으로 실제 운영되고 있는지, 국민신문 고의 효율 알 성 제고 등 성과향상에 기여한다고 평가할 수 있는지를 치 메 국민신문고를 접해본 중앙부처 및 지방자 였 조사를 시행하 였 해 진행하 월 다.

More information

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI: : Researc

Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp DOI:   : Researc Journal of Educational Innovation Research 2017, Vol. 27, No. 2, pp.251-273 DOI: http://dx.doi.org/10.21024/pnuedi.27.2.201706.251 : 1997 2005 Research Trend Analysis on the Korean Alternative Education

More information

<C1DF3320BCF6BEF7B0E8C8B9BCAD2E687770>

<C1DF3320BCF6BEF7B0E8C8B9BCAD2E687770> 2012학년도 2학기 중등과정 3학년 국어 수업 계획서 담당교사 - 봄봄 현영미 / 시온 송명근 1. 학습 목적 말씀으로 천지를 창조하신 하나님이 당신의 형상대로 지음 받은 우리에게 언어를 주셨고, 그 말씀의 능 력이 우리의 언어생활에도 나타남을 깨닫고, 그 능력을 기억하여 표현하고 이해함으로 아름다운 언어생활 을 누릴 뿐만 아니라 언어문화 창조에 이바지함으로써

More information

[11하예타] 교외선 인쇄본_ver3.hwp

[11하예타] 교외선 인쇄본_ver3.hwp 2012 년도예비타당성조사보고서 교외선 ( 능곡 ~ 의정부 ) 철도사업 2012. 7. 요약 요약 제 1 장예비타당성조사의개요 1. 사업추진배경 2000 5 16, 2004 4 1,, 2006 -,, 39,., ~~, 2. 사업의추진경위및추진주체 2004. 12: (~) () - 21 (B/C=0.34). 2010. 04~2012. 02: (~) () - (B/C=0.53,

More information

2002report hwp

2002report hwp 2002 연구보고서 210-23 가족법상친권 양육권및면접교섭권제도의실효성확보방안연구 한국여성개발원 발간사 연구요약. 연구의목적 . 가족법상친권 양육권및면접교섭권제도의내용 1. 친권에관한검토 2. 양육권에관한검토 3. 면접교섭권에관한검토 4. 관련문제점 . 가족법상친권 양육권 면접교섭권제도의시행현황 1. 공식통계를통해본시행현황 2. 친권 양육권 면접교섭권관련법원실무

More information

보도자료 2014 년국내총 R&D 투자는 63 조 7,341 억원, 전년대비 7.48% 증가 - GDP 대비 4.29% 세계최고수준 연구개발투자강국입증 - (, ) ( ) 16. OECD (Frascati Manual) 48,381 (,, ), 20

보도자료 2014 년국내총 R&D 투자는 63 조 7,341 억원, 전년대비 7.48% 증가 - GDP 대비 4.29% 세계최고수준 연구개발투자강국입증 - (, ) ( ) 16. OECD (Frascati Manual) 48,381 (,, ), 20 보도자료 2014 년국내총 R&D 투자는 63 조 7,341 억원, 전년대비 7.48% 증가 - GDP 대비 4.29% 세계최고수준 연구개발투자강국입증 - (, ) 2014 10 30() 16. OECD(Frascati Manual) 48,381 (,, ), 2014,. * 통계법국가승인지정통계 ( 제 10501 호 ) 로서 1963 년에최초실시된이래, 매년시행하고있는전국

More information

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: 3 * The Effect of H

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI:   3 * The Effect of H Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp.577-601 DOI: http://dx.doi.org/10.21024/pnuedi.28.4.201812.577 3 * The Effect of Home-based Activities Using Traditional Fairy Tales

More information

< 목차 > Ⅰ. 연구동기 1 Ⅱ. 연구목적 1 Ⅲ. 연구내용 2 1. 이론적배경 2 (1) 직접제작한물질의기본구조 2 (2) 회절격자의이론적배경 3 (3) X-선회절법-XRD(X-Ray Diffraction) 3 (4) 브래그의법칙 (Bragg`s law) 4 (5)

< 목차 > Ⅰ. 연구동기 1 Ⅱ. 연구목적 1 Ⅲ. 연구내용 2 1. 이론적배경 2 (1) 직접제작한물질의기본구조 2 (2) 회절격자의이론적배경 3 (3) X-선회절법-XRD(X-Ray Diffraction) 3 (4) 브래그의법칙 (Bragg`s law) 4 (5) [ 첨부 4] 작품설명서표지서식 작품번호 1143 LASER 의라우에패턴을통한입체모형의구조분석 출품분야물리출품부문학생 2011. 7. 7 구분성명 출품학생 지도교사 김성현 권채련 김서연 전종술 - 1 - < 목차 > Ⅰ. 연구동기 1 Ⅱ. 연구목적 1 Ⅲ. 연구내용 2 1. 이론적배경 2 (1) 직접제작한물질의기본구조 2 (2) 회절격자의이론적배경 3 (3)

More information

2011년 제21권 제3호

2011년 제21권 제3호 세계의 언어 정책 루마니아의 언어 정책 한국외국어대학교 동유럽 발칸연구소 연구 교수 엄태현 1. 루마니아어에 대해서 잘 알려지지 않은 언어이니만큼 루마니아 의 언어 정책에 대한 설명을 돕기 위해서 이 언어의 특징과 역사에 대 해 간략한 설명이 필요할 것으로 보인다. 언어 계보학적인 측면에서 루 마니아어는 발칸 반도 지역에서 광범위하게 사용되던 라틴어가 그 기

More information

2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd

2013_1_14_GM작물실용화사업단_소식지_내지_인쇄_앙코르130.indd GM작물실용화사업단 인식조사 및 실용화 방향 설정 GM작물 인식조사 및 실용화 방향 설정 한국사회과학데이터센터 김욱 박사 1. 조사목적 GM 작물 관련 인식조사는 사회과학자들을 바탕으로 하여 국내 다양한 이해관계자들의 GM 작물 관련 인식 추이를 지속적이고, 체계적으로 모니터링하여 인식이 어떻게 변화하고 있는가를 탐구하기 위한 것입니다. 2. 조사설계 2.1.

More information

Untitled-1

Untitled-1 영역별 욕구조사 설문지 예시 자료 3 장애인영역 평택시 사회복지시설 욕구조사 실무도움서 _ 201 202 _ 평택복지재단 영역별 욕구조사 설문지 예시 자료 2 3 2 3 평택시 사회복지시설 욕구조사 실무도움서 _ 203 204 _ 평택복지재단 영역별 욕구조사 설문지 예시 자료 2 3 4 평택시 사회복지시설 욕구조사 실무도움서 _ 205 2 3 4 5 6 7

More information

> 국가기술자격검정시행계획 2015. 11. 2016 - 4 - 1. 근거 2. 기본방침 - 1 - 3. 세부시행계획 - 2 - - 3 - - 4 - 4. 검정별시행계획 - 5 - - 6 - - 7 - 기술사 종목별시행회 108 110 108 110 108 110 108 109 110 108 109 110 108 109 110 108

More information

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion 요약 본연구에서는, 웹문서로부터특정상품에대한의견문장을분석하는오피니언마이닝 (Opinion

More information

27 2, * ** 3, 3,. B ,.,,,. 3,.,,,,..,. :,, : 2009/09/03 : 2009/09/21 : 2009/09/30 * ICAD (Institute for Children Ability

27 2, * ** 3, 3,. B ,.,,,. 3,.,,,,..,. :,, : 2009/09/03 : 2009/09/21 : 2009/09/30 * ICAD (Institute for Children Ability 27 2, 71-90. 2009. 3 * ** 3, 3,. B 2003 4 2004 2.,.,,,. 3,.,,,,..,. :,, : 2009/09/03 : 2009/09/21 : 2009/09/30 * ICAD (Institute for Children Ability Development) ** ( : heyjun@gmail.com) 72 한국교육문제연구제

More information