DBPIA-NURIMEDIA
|
|
- 상렬 신
- 8 years ago
- Views:
Transcription
1 한국어용언위계구조자동구축 * 1) 송상헌 최재웅 * (Univ. of Washington 고려대학교 ) Sanghoun Song Jae-Woong Choe, Automatic Construction of Verbal Type Hierarchy for Korean. Language and Linguistics 54, This paper discusses an automatic way to derive a type hierarchy for verbal items in Korean based on their subcategorization. There are three steps: First, all the dependent categories of the each verb are extracted from the Sejong Treebank. Second, based on the frequency of the dependent categories of each verb, the most stable subcategorization frames are selected, and two statistical measures are tested with some variations in their cutoff values. The resulting subcategorization frames are then compared with those from the Sejong Electronic dictionary for evaluation. The final step is to form a type hierarchy for Korean verbal items, based on the chosen subcategorization information. Keywords : subcategorization, Korean, Sejong Treebank, dependency relations, statistical test, Jaccard coefficient, HPSG, clustering, type hierarchy, automatic construction 주제어 : 하위범주화, 세종구문분석말뭉치, 의존관계, 통계적검증, Jaccard 계수, 군집화, 유형위계구조 * 본연구는 Automatic Construction of Korean Verbal Type Hierarchy using Treebank 이라는제목으로 The 15th International Conference on Head-Driven Phrase Structure Grammar(HPSG08, 2008 년 7 월, Keihanna, Japan) 에서발표된것을발전시킨것으로, 전과정을재분석하였다. 특히통계식의적용및임계치의설정과관련된부분은새롭게구성되었다. 연구초기부터관심을가지고조언을아끼지않은김종복선생님과 2008 년당시발표장에서귀중한지적을해준 Hans Uszkoreit, Dan Flickinger, Laurie Poulson, Bart Cramer 등여러선생님들, 그리고심사의과정에서좋은지적을해준심사위원들께깊은감사를드린다. 이논문은 2010 년정부 ( 교육인적자원부 ) 의재원으로한국연구재단의지원을받아수행된연구임 (NRF A00212). ** 교신저자
2 202 언어와언어학제 54 집 1. 서론 전산언어학의주요쟁점중의하나는개별언어별로방대한양의어휘정보를어떻게획득하느냐하는문제다. 기존사전의정보를적절하게가공하여사용하던단계를지나현재는대규모말뭉치로부터통사-의미정보를직접자동으로추출하려는시도가많이이루어지고있다 (Brent, 1993; Utsuro et al., 1998; Sarkar and Zeman, 2000; Korhonen et al., 2000; Gamallo, 2001; Chesley and Salmon-Alt, 2006). 이와같은어휘정보의자동추출은해당언어의모국어화자가어휘를습득하는방식과개념적으로다르지않을것이라는전제에서출발한다. 문장의구성을이해하는데는해당문장의술어가지니는하위범주화정보가가장중요하다는점에는이견이없다. 언어이론상으로도그러하고, 또한언어처리의관점에서도마찬가지다. 예컨대아래에서보이는바와같이영어에서 want 와 hope 는서로비슷한의미적속성을지님에도불구하고, 그들이취할수있는문형은각기다르다 (Brent, 1993:243). (1) a. John wants Mary to be happy. b. John hopes that Mary is happy. c. *John wants that Mary is happy. d. *John hopes Mary to be happy. 따라서이러한하위범주화정보를어떻게획득하느냐하는것은전산언어학내에서도어휘정보습득과관련한핵심주제중하나가된다. 이러한맥락에서본연구가관심을가지는바는한국어용언의논항관계및위계구조를어떻게하면 (i) 효율적이면서도 (ii) 포괄적으로그리고동시에 (iii) 객관적인방법으로구축하여, 그 (iv) 활용가능성을극대화할수있을것인가이다. 전체연구는세가지하위단계로구성이된다. 첫번째단계는말뭉치에서하위범주화의후보군을모두뽑아내는 (i) 의존소추출이다 (3절). 두번째단계는추출된의존소가운데실제주어진용언의논항으로판단되는집합만을통계적으로걸러내는 (ii) 하위범주화선별에 1) 해당한다 (4절). 끝으로세
3 한국어용언위계구조자동구축 203 번째단계는 (iii) 위계구조군집화이며, 이는각각의용언에대하여확립된논항구조를군집화하여얻어진전체용언의위계구조를말한다 (5절). 이어지는 2절에서는본연구의배경에대한개괄적인소개와함께하위범주와추출및위계구조구성의대상이되는어휘군의선정절차가논의될것이다. 3절은수형도기반접근법을제시하며, 관련된주요이슈들에대해서살펴본다. 여기에서는현재가용한가장큰규모의통사분석말뭉치인세종구문분석말뭉치를논항추출의주대상으로활용한다. 4절은통계적기법을통해논항구조를확정하는과정에대해살펴볼것이다. 구체적으로는 Jaccard 계수와이항가설검증에기초한통계식을활용하여도출된결과를세종전자사전과교차비교를통해평가할것이다. 5절에서는구성된논항관계에입각하여 Head-driven Phrase Structure Grammar(=HPSG; Sag et al., 2003) 기반의용언위계구조를구축하는과정이제시될것이다. 끝으로 6절은본연구가지니는의의를짚어보고, 추후과제를떠올려본다. 2. 연구의토대 서론에서언급하였듯이본연구는기존사전에대한의존도를최소한으로줄인전산모형을큰방향으로설정하고있다. 2) 그러한방향속에서한국어용언위계구조를도출하는것이본연구의목표다. 단계별로그러한목표가어떻게달성될수있는지세밀하게보이기전에우선본절에서는연구의방법, 구성, 연구의자원및대상등본연구의토대와관련한보다구체적인사항들을논하기로한다. 1) 본고에서는 하위범주화틀 이라는용어와 논항구조 라는용어가사실상같은것을지칭하는것으로사용되었다. 언어이론적인측면에서양자사이의보다세밀한구분이가능하겠으나, 실제시스템을구현하여전산적으로표상을하는것을목적으로한본연구에서는양자의엄정한구분이요구되지않는다. 2) 자연어처리의모형을크게대별하자면, 하나의축은기계 - 가독형사전과같은언어지식에크게의존하는모형 (knowledge-rich) 일것이고다른하나는언어지식에대한의존도를줄인모형 (knowledge-poor) 이다 (Gamallo et al., 2001). 본연구는구문분석말뭉치를활용한다는점에서는전자처럼보이나, 사전처럼정제된자원을사용하지않는다는점에서후자에가깝다.
4 204 언어와언어학제 54 집 2.1. 연구의방법 한국어의각용언이어떠한논항구조를지니고있는가를포괄적인차원에서검토를하고이들사이의관계를파악하는일은이론언어학자체에서도중요한부분이다. 동사성어휘의논항구조및그변이현상을바탕으로하여그위계를설정한연구로는 Levin(1993) 을들수있다. 그연구는영어의주요동사를대상으로한것으로각어휘에서투사되는통사구조를하나씩분류하고이를유형화한것이다. 마찬가지로한국어에서이에해당하는자원으로서는 1998년부터 2007년까지 10년간의연구결과를통해구축된세종전자사전을들수있다. 이러한기존의연구가논항구조에입각한동사성어휘의위계를설정하는데중요한성과를거둔것은사실이나, 이를실제자연어처리시스템에곧바로적용하기에는몇가지문제가따른다. 아래와같은네가지면에서의한계를지적할수있다. 활용가능성 : 최근의자연어처리는빈도등의정보에입각한통계적수치에크고작은의존을하고있는관계로, 실제의각어휘가가지는논항구조의분포에대한계량적연구가요구된다. 시스템구축의차원에서는통사및의미단계의정리와함께, 빈도등과같은분포적특질에대한통계정보가필요하기때문이다. 예컨대, 통계기반구문분석 또는 통사정보에기반한통계적기계번역 등의최근자연어처리모형은이와같은통사구조에계량적연구에입각하고있다. 이는실제의대규모언어자원을활용하지않고서는성취하기가어려운목표다. 포괄성 : 실제시스템은각매개언어의다양한현상을반영하여처리결과를내어야한다는점에서, 제한된수의어휘를대상으로진행한연구결과는필연적인한계를보인다. 즉, 매개언어의동사성어휘전반을대상으로하여포괄적인연구결과가밑받침되어야실제자연어처리시스템의성능향상을도모할수있다. 뿐만아니라자연어의어휘는폭넓은변이현상을보이는바, 각어휘사이의관계성을포착하기가쉽지않다는점도한계로지적될수있다. 한국어에사용
5 한국어용언위계구조자동구축 205 되는모든용언의통사및의미관계를유형화하고이를위계구조로정리한연구는그성과가아직뚜렷하지않은측면이존재한다. 객관성 : 기존사전의경우, 연구자의직관의차이에따른기술상의불일치가얼마든존재할수있다. 예컨대, 연세한국어사전에서는이른바 tough 동사군에해당하는 어렵다 의논항구조를아래 (2) 와같이 <NP(nom)>, <NP(nom), NP(nom)>, 그리고 <S(nom)> 의세가지로설정하고있다. (2) a. 언어학이어렵다. b. 내가공부가어렵다. c. 언어학을공부하기가어렵다. 반면, 세종전자사전에서는동일한어휘 어렵다 에대해총여섯개의논항구조를설정하고있다. 이양자의입장가운데어느한쪽이더타당성을지니는가를밝히는것은이론언어학차원에서중요하게논의될만한것이나, 보다객관화된방법론의도입역시매우중요한연구방향이라할수있다. 효율성 : 기존의연구방식은그구축에따르는시간과비용그리고노력이지나치게많이요구된다는점에서효율성에문제가많다. 최소한수년이상, 적지않은인력의집중적인투자가있기전에는그소기의성과를기대하기어렵다. 실제로앞서언급한 Levin(1993) 및세종전자사전의경우만보아도용언위계가상당한고비용자원임을알수있다. 본연구는앞서언급된한계점을극복하기위한방향으로의연구로, 기존연구와의차별성을보이기위하여다음과같은방법론에입각하고자한다. 첫째, 구축에소요되는시간과비용을최소화하는차원에서전체연구과정을최대한 (i) 자동화하는것을기본골자로한다. 이는한편으로 annotate automatically, correct manually 라는입증된방법론과맥락을함께한다 (Marcus et al., 1993). 둘째로실제 (ii) 언어자원을활용하는것을중요한
6 206 언어와언어학제 54 집 목표로상정한다. 따라서본연구의결과가되는위계구조에는그통사적및의미적분포특질에대한계량적정보가함께부착될것이다. 셋째로단순히용언구조를도출하는것에끝나지않고이를 (iii) 군집화하여전체용언의위계구조를밝힐것이다. 위계구조는 HPSG의이론적틀에따라구축한다 연구의구성 말뭉치에서유의미한언어정보를자동습득해내는연구는일반적으로 Gamallo et al.(2001) 에서제시된아래의구성을따른다. (3) a. 분석 (parsing): 해당언어자원을처리하여연구의목적에맞도록태그 ( 품사표지, 구문표지, 의미표지등 ) 를부착하는과정 b. 추출 (extracting): 분석된언어자원에서관심의대상이되는언어정보를일관된방식으로뽑아내는과정 c. 선별 (filtering): 추출된자료를대상으로하여이가운데통계적으로유의미한것만을선택하여자료를정제하는과정 d. 군집화 (clustering): 도출된자료를추상화또는유형화하여, 이를세부단위로나누는과정 본연구의경우이미분석된자료에서연구를시작할계획이므로, 위의네단계가운데첫번째인분석은논외가될것이다. 따라서본고의전체연구는세개의하위단계로구성된다. 1단계는추출에해당하는것으로실제언어자원에서논항으로파악될수있는모든후보군을도출한다. 2단계는선별에해당하며, 이도출된후보를대상으로하여통계적모형을활용하여유의미한집합을걸러낸다. 끝으로 3단계는확립된논항구조를바탕으로이를군집화하여그관계를위계화하는것이다.
7 한국어용언위계구조자동구축 연구의자원 본연구에활용되는자원은 3) 두가지차원에서나누어살필수있다. 첫번째는활용되는목적에따라구분되는것으로, (i-a) 구축을목적으로한자원인가아니면 (i-b) 평가를위해쓰이는자원인가하는점이다. 두번째는자원의성격에따른것으로, (ii-a) 자료적성격을띠는것인가아니면 (ii-b) 도구에해당하는가의구분이다. 이에따라본연구에활용되는자원을정리하면아래표와같다. 구축 (i-a) 평가 (i-b) 자료 (ii-a) 세종구문분석말뭉치 세종전자사전 도구 (ii-b) Xavier ver. 2.0 < 표 1> 연구의자원 먼저본연구의모든결과는세종구문분석말뭉치에서추출된언어적정보를기반으로한다. 어휘습득연구에서사용되는정보추출의대상이되는 개발용말뭉치 (development corpus) 가필수적인데, 당연히정밀하게주석처리가된말뭉치를활용하는것이보다나은결과를산출할것이다. 4) 현재이용가능한한국어구문분석말뭉치에는두가지종류가있다. 하나는펜실베니아대학에서구축한 Penn Korean Treebank( 약 30만어절규모 ) 이며, 다른하나는 21세기세종계획의일환으로구축된세종구문분석말뭉치 ( 약 80만어절규 3) 세종구문분석말뭉치와세종전자사전에대한정보및자료의입수는아래홈페이지참조. 4) 물론주석처리가되지않은원시말뭉치 (raw text) 를사용하여도원하는결과를일정정도얻을수있다 (Manning, 1993). 그러나이경우에도대체로주어진원시말뭉치를바로활용하기보다는 1 차분석된결과를바탕으로연구를수행하는것이일반적이다. 예컨대, Gamallo et al. (2001) 은품사태깅과부분구문분석을거쳐파악된의존관계에서정보수렴을시작하며, Erk(2007) 는 BNC 를대상으로하여, 구문분석기를통해처리된결과를바탕으로어휘정보를추출하였다. 즉, 정보추출을위해서는원시말뭉치를어떠한형식으로든선처리하는과정이요구된다. 그러나품사부착기나구문분석기의성능이완벽한것이아니며, 세종구문분석말뭉치와같이충분한양의심층분석자료가존재하는경우굳이원시말뭉치를분석하는과정을거칠필요가없다.
8 208 언어와언어학제 54 집 모 ) 이다. 양자는크게세가지점에서차이는보이는데, 우선세종구문분석말뭉치는균형말뭉치로서의성격을보여다양한장르의텍스트를대상으로하였다. 반면, Penn Korean Treebank 는군사교본과뉴스기사로그대상이한정되어있다. 두번째로 Penn Korean Treebank 는공범주를그기술의과정에포함시킨반면, 세종구문분석말뭉치에서는공범주표지가존재하지않는다. 세번째로사격 (oblique) 명사구 5) 를논항으로인정할것인가에있어서뚜렷한차이가있다. 세종구문분석말뭉치는논항의인정범위에대해비교적엄격한반면, Penn Korean Treebank 는다양한사격논항을포함하고있다. 본연구에서세종구문분석말뭉치를기본자원으로선택한이유는우선규모에서세종구문분석말뭉치가더크다는점이다. 한국어용언의논항구조를종합적차원에서논의하고자하는본연구의특성상, 양의차이는무시할수없는요소이기때문이다. 또한선택적인장르특성역시결과의왜곡을초래할수있는바, 포괄적성격의연구에는세종구문분석말뭉치가보다적합하다. 실제로 Roland and Jurafsky(1998) 는어떠한특성의자료를일반화말뭉치로선택하느냐가검출된하위범주화의출현빈도에적지않은영향을준다는사실을입증하였는데, 한국어를보다더대표할수있도록균형말뭉치를활용하는것이바람직하다하겠다. 6) 다음으로이세종구문분석말뭉치에접근하여원하는정보를취합하기위한도구로는 Xavier 모듈이사용된다 (Song and Jeon, 2008). Xavier 모듈은세종구문분석말뭉치에서사용자가원하는정보를빠르고단순하게추출할수있도록구성된프로그램패키지로서용례검색, 빈도추출, 문맥자유문법추론, 의존소추출, 하위범주화구성등의기능을지니고있다. 끝으로평가를위한비교의대상이필요하다. 4절에서는하위범주화가얼마나설명력있게구성되었는지를판단하기위한내부평가의용도로세종전자사전이사용될것이다. 세종전자사전의각정보는세종구문분석말뭉치와는별도로구축된것이다. 즉, 세종구문분석말뭉치가실제텍스트에서기초자료를 5) 본고애서사격명사구는주격표지 (NP_SBJ) 또는목적격표지 (NP_OBJ) 를달지않은모든명사구를말한다. 세종구문분석말뭉치에서사격명사구는통상 NP_AJT 로표지되어있다. 6) 그러나이러한판단이특정말뭉치가더우월하다는주장과는무관하다. 어떠한말뭉치도나름의장점과단점을가지기마련이고, 일반화말뭉치의선택은철저히연구의목적에따라결정되는것이기때문이다.
9 한국어용언위계구조자동구축 209 취한반면, 세종전자사전에망라된정보는말뭉치를참조하되기본적으로연구자의직관에따라구축된것이다. 특히세종전자사전은각용언의격틀정보를연구자의수작업을통해망라하고있는데, 이정보를통계적인처리과정을통해얻어진결과와교차비교를하면전산적으로자동추출된결과와연구자의직관에근거확립된결과가상호어느정도의합치점을보이는가를살필수있다. 하향식 (top-down) 으로구성된세종전자사전의격틀정보와상향식 (bottom-up) 방법에따른본고의결과는흥미로운비교거리가될것이다 연구의대상 어휘군선정과관련하여, 본연구에서는세종구문분석말뭉치에서 1회이상출현하는용언 5,370 개를분석의대상으로하며, 그것은동사, 형용사는물론서술성명사까지포함하는것이다. 우선일반적인동사와형용사는각기형태표지 VV 와 VA 를달고있는어휘가그대상이될것이다. 반면에서술성명사의경우에는목록선정이비교적단순하지가않은데, 7) 본연구에서는아래의두가지원칙에의거하여그에해당되는어휘군만을대상집합에포함시켰다. 첫째로서술성명사에부착되는경동사는 하다 만을인정하였다. 즉, 되다, 받다, 당하다 류의피동형경동사와 스럽다 등의경동사가제외된것인데, 이들경동사는논항교체와관련되기때문이다. 교체된논항관계를주어진구문분석말뭉치에서거꾸로복원하는일은현재의시스템에서상당히어렵거나혹은불가능하기때문에 하다 이외경동사는논의에포함시키지않았다. 두번째로 [ 명사군 + 을 / 를하다 ] 의형태는제외하고, 일반명사 (NNG) 또는어근명사 (XR) 가한단어안에서경동사 하다 (XSV) 와결합하는경우만서술성명사로인정하였다. 이러한판단의근거는실제자료의분포를보면 [ 명사군 + 을 / 를하다 ] 의구조가 [ 명사군 + 하다 ] 와완전히동일하다고보기어려운반례들이상당수존재하기때문이다. 8) 실제말뭉치에서취한아래예시들을살펴보자. 7) 기본적으로이론적차원에서서술성명사의경계를인정하는기준에아직충분한합의가이루어지지않았다고보기때문이다. 8) 채희락 (1996) 에서는이론적차원에서이와유사한입장을제시하고있다. 즉, 서술성명사가 하다 와한단어로구현된것과 [ 명사군 + 을 / 를하다 ] 가통사적으로결합된것의언어적구조가완전히동일하지는않다는것이다.
10 210 언어와언어학제 54 집 (4) a. 모든토끼는이월토와사랑의작업을하고 b. 적진지에대한공격을빨리하도록 위 (4a) 에서 하다 는명사 작업 과결합을하고있으나, 작업 은동시에 사랑 과결합하여하나의명사구를이루고있다. 이때 월토 가 사랑 과관련되는항목이라면, -와사랑하다 의측면에서논항으로간주될수있지만, 작업 과관련되는항목이라면그것은부가어로간주하는것이더타당하다. 즉, 여기에서 [[ 사랑의작업 ] 을하고 ] 또는 [ 사랑의 [ 작업을하고 ]] 와같은괄호묶기문제가발생하는것이다. 더군다나, 이때 작업을하고 가 작업하다 와동일한구조를지닌다고가정하면, 사랑의작업하고 의형태도가능해야할것이나우리의직관이비추어타당치않다. 한편, (4b) 와같이 [ 명사군 + 을 / 를 ] 과 하다 사이에부사어등의다른단어가삽입된예시도종종관찰되는데이역시 공격하다 등의구조와동등하다고볼수없는부분이다. 결론적으로 [ 명사군 + 하다 ] 의형태만을경동사가결합된서술성명사구로인정하며, [ 명사군 + 을 / 를하다 ] 에서 하다 는중동사의일종으로간주한다. 이하에서서술성명사는 작업하 /VV, 공격하 /VV 와같은 [ 명사 + 하다 ] 의단어형태로 VV 또는 VA 에포함되는것으로가정한다. 3. 의존소추출 본절에서는우선세종구문분석말뭉치로부터의존소를추출하는절차를핵심알고리즘중심으로소개하고, 이어서그러는과정에서제기되는문제점및한계를논한뒤에, 마지막으로 어렵 /VA- 과 놓 /VV- 을예시로하여실제추출된자료의한단면을소개하기로한다.
11 한국어용언위계구조자동구축 구현 9) 최초의단계는구문분석말뭉치를처리하기위한파스트리 (Parse-Tree) 알고리즘을구축하는것이다. 10)11) 파스트리자료구조는부모절점 (Mother Node) 과좌측및우측딸절점 (Left Daughter Node / Right Daughter Node) 으로구성된다. 아래그림은전형적인파스트리구조를보여주고있다. < 그림 1> 파스트리의예시 최상위절점 S 는좌측딸절점 AP 와우측딸절점 S 를지니며, 다시두번째 S 절점은좌측딸절점 NP_SBJ 와우측딸절점 VP 를지닌다. 다시말해, 모든절점이최상위절점에계층적으로연결되는이분지구조가파스트리자료구조이며, 그알고리즘은아래 (5) 와같다. 12) 1: parse_tree(n): 2: n left = n right = n parent = NIL 3: if n is not a terminal node: 4: n right = pop() 9) 본절에서논하는알고리즘및관련문제점에대한상세한논의는 Song and Choe(2008) 참고. 10) 세종구문분석말뭉치가 X-bar 이론에근거, 완전한이분지구조로이루어져있음을반영하였다. 11) 본고에서는자료구조상의용어선택과관련하여가급적한국어대역어를사용하였다. 예컨대, 노드 (Node) 는절점으로, 이진트리 (Binary Tree) 는이분지구조로, 루트노드 (Root Node) 는최상위절점으로기술하였다. 이는전산적배경지식이많지않는독자들도고려한차원에서선택한것이다. 따라서한심사위원의지적대로전산학분야에서일반적으로사용하는용어와는약간의차이가있음을밝힌다. 12) 전체알고리즘과처리모형은 Song and Jeon(2008) 및 Song and Choe(2008) 참조.
12 212 언어와언어학제 54 집 5: n left = pop() 6: if n left is NIL: 7: n left = n right 8: n right = NIL 9: n left parent = n right parent = n 10: push(n) 어떠한새로운절점 n이출현한경우 (1행), 우선그절점의좌측, 우측, 및부모절점은 null 값을할당받는다 (2행). 다음으로그절점이단말절점 ( 어휘항 ) 이아니면 (3행), 우측및좌측절점은스택에저장된값을차례로할당받게된다 (4,5행 ). 최종단절점의경우좌측딸절점만을가지기때문에이경우 (6 행 ), 우측딸절점에다시 null 값이할당된다 (7,8행). 현재의절점은좌측딸절점과우측딸절점의부모절점으로명시되고 (9행), 이제까지처리된절점은다른절점과의추가적인결합을위해스택에저장된다 (10행). 위알고리즘을토대로하여본연구의 1단계에서는대상이되는 5,370 개용언이세종구문분석말뭉치에서가지는의존소를모두추출하였으며, 추출된의존관계의수는총 104,442 개다. 이것은곧총토큰의수이다. 반면전체의존관계유형의가짓수, 다시말해타입의수는 103개다. 결과적으로토큰 / 타입비율은약 1,014 가된다 문제점 본연구에서는표층에서의실현을최대한존중하여각동사성어휘와의존관계를지닌모든범주를추출하는것을기본적인출발점으로삼는다. 그러나이러한말뭉치기반구축방법론역시문제점이없는것은아니다. 대표적으로세종구문분석말뭉치역시 (i) 논항의인정범위가제한적이고 (ii) 공범주가없다는점에서그자체로논항관계를완전히보여주고있다고는할수없다. 13) 13) 이이외에도언어자료의특성상전산적인일괄처리를완전히보장할수없는현상들이존재한다. 대표적인것으로장거리의존문제와동음이의어의구별을들수있다. 이러한예외항목들에대한고려는추후연구로미루고자한다.
13 한국어용언위계구조자동구축 213 먼저논항의인정범위문제를생각해보자. 한국어에서논항과부가어를판별하는여러검증도구가제시되어있기는하지만 (Chae, 2000; 김영희, 2004), 양자의경계가항상명확한것은아니다. 본연구에서는통계적검증모형을도입하여논항과부가어의모호한경계면을해결하기위한방안으로사용한다. 본고는논항과부가어의구분이범주적일수없다는 Choi(2010) 과기본적인입장을함께한다. 즉, 양자를이분법적으로명확히구분하는것은자연언어의특성상불가능하며, 다만이들의관계를정도의문제로파악하는것이더타당할수있다는관점을취한다. 이러한견지에서, 논항의선택은가부의문제가아니라통계적으로유의미성을추론할수있는대상으로규정된다. 다른한편으로공범주의문제가있다. 예컨대관계절과피동구문은하위범주화를말뭉치에서추출하는절차에다소난제로작용한다. 관계절의경우논항가운데하나가그절의밖에서실현될수있으며, 피동구문의경우논항이교체되어실현될뿐만아니라논항의개수가하나줄어드는경우가빈번하다. 세종구문분석말뭉치에서는이들의원형정보에대한주석처리가별도로존재하지않는다. 결국현재로서는처리의중간과정에서이들을복원할수있는기제가불분명한까닭에전처리를통해이들구문을제외하였다. 관계절의경우그최대절점이 VP_MOD 또는 S_MOD로태깅되어있기때문에해당절점이하의구조를무시하는방법을택하였다. 피동구문의경우, 어떠한용언이피동보조용언 지다 와결합하거나서술성명사가피동형경동사 되다, 받다, 당하다 와결합을하는경우이들의의존소를추출하지않도록하였다. 단, 세종말뭉치는 이, 히, 리, 기 와같은피동접사를파생접사로간주하기때문에, 접미피동사는애초에 먹히 /VV, 뚫리 /VV, 잘리 /VV 와같은형태로주석처리되어있다. 따라서이들은일반적인자동사와마찬가지로처리하였다 예시 : 어렵 (VA)-, 놓 (VV)- 추출된의존소목록을살펴보면형용사 어렵다 의경우 19개의논항관계유형이검출되며, 그전체토큰수는 195개에달한다. 동사 놓다 는마찬가지로 14개의논항관계유형을보이며, 전체출현빈도는 170회이다. 각각의대표적인실례를살펴보면아래와같다. (6-7) 에서각논항구조우측의숫자는해당
14 214 언어와언어학제 54 집 빈도및비율을말한다. (6) 어렵 /VA a. <VP(nom)> 86 (44.10%) b. <NP(nom)> 51 (26.15%) c. <S(nom)> 11 (5.64%) d. <VP(nom), NP(dat)> 10 (5.13%) e. <VP(nom), NP(dir)> 7 (3.59%) f. <NP(nom), NP(dat)> 5 (2.56%) (7) 놓 /VV a. <NP(nom), NP(acc)> 94 (55.29%) b. <NP(nom), NP(acc), NP(dat)> 38 (22.35%) c. <NP(nom), NP(acc), NP(loc)> 9 (5.29%) d. <NP(nom), NP(loc)> 8 (4.70%) e. <NP(nom), NP(acc), NP(dir)> 7 (4.11%) f. <NP(nom)> 3 (1.76%) 먼저 (6) 의 어렵다 의경우 (6a-d) 의구조는차례로아래와같은예문을상정해볼수있다. (8) a. 언어학을공부하기가어렵다. b. 언어학이어렵다. c. 내가언어학을공부하기가어렵다. d. 언어학이나에게어렵다. 직관에비추어이들각각은논항이라고판별을하여도크게무리가없을듯하지만, 다른한편으로 (6e) 에해당하는구문, 다시말해 NP(dir) 를필수요소
15 한국어용언위계구조자동구축 215 로취하는구문은쉽게찾을수없다는문제점이발생한다. 이때의 NP(dir) 는언어자원에서부가어로사용된것으로볼수있다. 14) (7) 의 놓다 예에서는예상하는바와같이 NP(loc) 가동시에출현하는구문이어느정도검색되었다. 한편으로유의하여볼것은 놓다 가타동사임에도불구하고 (7d) 와 (7f) 에 NP(acc) 에해당하는논항이결여되어있다는점이다. 이러한점은앞서설명한공범주의문제에해당한다. 4. 하위범주화선별 하위범주화정보가구문분석의성능향상에크게도움이된다는점은실제그동안여러실험을통해서도입증되어왔다 (Briscoe and Carroll, 1997; Carroll et al., 1998). 또한실제의말뭉치에서추출한정보로편성된하위범주화정보를활용하는것이단순히기계-가독형사전에의존하는구문분석보다좋은성능을보인다는점역시실험을통해입증된사실이다 (Manning 1993). 한편으로하위범주화정보는구문분석기의종류에구애받지않고거의모든시스템에긍정적인기여를한다는것역시실험으로확인되었다. 예컨대, 통계기반구문분석기는물론, HPSG 기반구문분석기와같이특정언어이론에입각한규칙기반구문분석에서도그실효성은이미증명된바있다 (Carroll and Fang, 2005). 다른한편으로언어의유형을막론하고하위범주화는실제구문분석시스템에상당한기여를한다는점이증명되었는데, 대표적으로영어 (Brent, 1993; Manning, 1993; Korhonen et al., 2000), 프랑스어 (Chesley and Salmon-Alt, 2006), 체코어 (Sarkar and Zeman, 2000), 일본어 (Utsuro et al., 1998) 등이있다. 정리하자면하위범주화정보를말뭉치에서자동습득하여활용하는것은단기간내에구문분석기의성능향상을도모할수있는가장안정적인방법론이라할수있다. 하위범주화자동구성에관련하여, 위에서열거된모든선행연구는크게두가지측면에주안점을두고있다. 하나는통계적선별 (statistical filtering) 을위하여어떠한통계식을사용할것인가의문제이다. 다른하나는각통계식을 14) 실제세종자료에등장하는예로는 그것은현실적으로어려웠다 등이있다.
16 216 언어와언어학제 54 집 이용할때확정범위를결정하는임계치 (cutoff-value) 또는유의수준 (confidence level) 을어떻게설정할것이냐의문제이다. 기존연구에서사용된통계식은크게 Log Likelihood Ratio, T-score, 이항가설검증, 상대빈도, Jaccard 계수등이다. 이가운데거의공통적으로좋은성적을보인다고평가받는것은이항가설검증 (Binominal Hypothesis Testing) 인데, 연구에따라크고작은차이는있으나대략 80% 내외의정확도 (precision) 을보이는것으로보고되고있다. 15) 그러나다른언어에서이이항가설검증을적용하여좋은성능을보였다고해서한국어에서도마찬가지로최적의성능을보인다는보장은할수없다. 앞서설명한바와같이한국어는여타언어와구별되는그나름의형태-통사적특성을지니기때문이다. 실제로이항가설검증을적용하여성공적인결과를거둔사례연구는대개인구어에속한다. 반면 Tsunakawa and Kaji(2010) 은일본어를대상으로 Jaccard 계수가여타의통계식보다좋은결과를낸다는점을실험으로입증하였으며이때의정확도는약 40% 의선으로나왔다. Tsunakawa and Kaji(2010) 은하위범주화자체를대상으로한다기보다는기계번역의대역어를찾는차원의연구에가깝기는하지만, 그기본적용모형이유사하다는점에서시사하는바가있다. 특히한국어와형태-통사적특성이유사한일본어에적용된결과라는점에서적극고려해볼가치가있다. 한편임계치에대한결정은절대적인정답이존재하지않으며통상대개의경우실제실험및평가를통하여어떠한임계치를사용하는것이가장결과를잘내는가를비교한뒤그에따라선정을하는것이일반적인방법이다. 즉, 다양한처리를통해경험적으로최적의수치가설정된다. 이러한점을반영하여본고에서는통계식으로이항가설검증과 Jaccard 계수를사용하여그결과를비교할것이다. 임계치설정은각통계식에대하여선행연구에서주로사용한값을차용하여역시그결과를비교할것이다. 비교평가는다시두가지차원에서진행되는데, 하나는 얼마나정확한가 (precision) 의문제이며다른하나는 얼마나빠짐없이도출되는가 (recall) 의문제이다. 15) 기존연구의성능비교는 Sarkar and Zeman(2000), Chesley and Salmon-Alt(2006) 등을참조.
17 한국어용언위계구조자동구축 통계적검증모형 먼저이항가설검증은아래와같은통계식에의거하여계산된다 (Sarkar and Zeman, 2000). 위식에서, 는어떠한하위범주화틀이그동사에사용되긴하였지만그것이해당동사의하위범주화로보기어려운경우의확률값을말한다. n은어떤동사가말뭉치에출현한총횟수이며, m은그동사가해당논항관계로실현된횟수를의미한다. 이렇게하면어떤동사가어떤하위범주화틀 f에대하여취하는값을구할수있는데, 이값이임계치보다작으면그하위범주화틀 f는해당동사와유의미한상관관계를가지는것으로파악한다. 다음으로 Jaccard 계수는보다단순하여다음수식으로연산된다 (Smadja et al., 1996). n v, n f 는각각용언 v와틀 f의해당출현빈도를나타내며, m은용언 v가틀 f가공기하는회수를의미한다. 이때계산된값이임계치보다크면, 틀 f는해당용언 v의유의미한하위범주화로간주된다. 위에서주목해야할점은임계치 (cutoff-value) 를대하는두통계식의관점이서로반대라는것이다. 이러한점은위두식에서부등호의방향이서로반대라는점에서드러난다. 즉, 이항가설검증은임계치보다값이작아야하고, Jaccard 계수는거꾸로값이커야한다. 따라서이항가설검증에서는작은임계치를사용하는것이보다엄격한검증이되는반면, 역으로 Jaccard 계수에서는큰임계치를사용하는것이보다엄격한검증이된다. 본연구에서는 5,370 개의용언을대상으로추출한 104,442 개의전체논항
18 218 언어와언어학제 54 집 관계및 103개의논항유형에위두수식을적용하여전체결과치를도출하였다. 이때의임계치는이항가설검증의경우선행연구에서흔히사용된 [0.05, 0.025, 0.01, 0.005, 0.001] 의다섯개의값을사용하였다. 반면, Jaccard 계수는 Tsunakawa and Kaji(2010) 을참고하여 [0.01, 0.001, ] 을사용하였다. 결과를검증하는기준은이항가설검증의경우임계치 0.05가가장느슨하며임계치 이가장엄격하다. 반대로 Jaccard 계수에서는임계치 0.01이가장엄격하고임계치 이가장느슨하다 평가 앞소절에서계산된각값에임계치를적용하여 104,442 개의전체논항관계에서상대적으로중요성이떨어지는항목을걸러내고나면, 다음단계는이들의평가이다. 총 2개의통계모형에대하여각 5개, 3개씩의임계치가설정되어있기때문에총비교의대상이되는집합은 8개다. 이들 8개의집합은세종전자사전의격틀정보와교차비교의대상이되는데, 세종전자사전의격틀정보구성은아래와같은형식으로되어있다. (9) 어렵다 a. X=N0- 이 A b. Y=N1-에게는 이 X=N0-이 A (10) 놓다 a. X=N0-이 W=N3-에게 Z=N2-을 Y=N1-을 V b. X=N0-이 Y=N1- 을 V (6-7) 의형태로되어있는도출의존관계를 (9-10) 의형태로되어있는격틀정보에대응시켜보면, 두개의자료가얼마나일치를하고있는가를판단할수있다. 16) 두자료의비교를통한평가는 precision, recall, 및 F-measure 16) 실제의이작업은세종격틀정보를 (6-7) 과같은형태로변형하는프로그램을개발하여
19 한국어용언위계구조자동구축 219 의계산을통해이루어진다. 아래에서 tp는어떠한논항관계 f가 4.1절에서도출된결과와세종전자사전모두에서하위범주화로인정되는경우의수를말한다. fp는상단에서도출된결과에포함된논항관계가세종전자사전에는나타나지않는경우의수이며, fn은거꾸로세종전자사전에포함된논항관계가위결과에서인정되지않는경우를말한다. 끝으로 F-measure 는 precision 과 recall 을조합한값으로양자의일치정도를종합적으로살피게끔한다. 이러한방식에의거 8개의후보집합의각평가값을계산하면아래표와같다. 각항목에서가장높은점수를취한셀은굵은글씨로표시하였다. 통계모형 임계치 precision recall F-measure % 63.97% 44.45% 이항가설검증 % 57.86% 42.97% % 49.61% 40.57% % 39.22% 36.67% % 23.41% 27.85% Jaccard 계수 % 87.02% 45.98% % 86.95% 46.18% % 86.34% 47.07% < 표 2> 통계검증모형의비교 우선 precision 의경우에는이항가설검증의값이 Jaccard 계수의값보다약간높은편이나최대차이가약 3% 로서 ( 이항가설검증의임계치 와 이루어졌으며, 하단의평가결과역시컴퓨터프로그램을통해자동으로연산하였다.
20 220 언어와언어학제 54 집 Jaccard 계수의임계치 0.01), 별다른차이가없다. 반면 recall 의경우에는차이가크게나는데대체로 Jaccard 계수의값은 86% 이상의양호한일치도를보이나, 이항가설검증의경우에는그렇지못하다. 결과적으로, F-measure 에서는 Jaccard 계수의값이이항가설검증의값을항상상회하는것을확인할수있다. 한편으로 Jaccard 계수안에서는 F-measure 의최대편차가 1% 정도에지나지않아큰유의미성을지닌다고는볼수없다. 결론적으로 2단계하위범주화구성에서는 Jaccard 계수를통해도출된결과치를활용하고자한다. 한편으로위의평가는세가지측면에서보완되어야한다. 첫째는, 세종전자사전역시절대적인기준 (golden standard) 가아니기때문에위에서높은수치를보였다고하여반드시최선의결과라고장담할수는없다. 다만, 위표는이항가설검증을통한결과보다 Jaccard 계수를통한결과가연구자의직관에기초하여구축된자원과더합치하는경향성이있다는것을나타낼뿐이다. 두번째로 Jaccard 계수안에서우월성이결정되지않았기때문에각임계치에따른결과는다른방식으로재평가가뒤따라야할것이다. 이러한점을보완하기위해 5절에서는각임계치에준거하여구축된최종결과를놓고그분포적양상에대한질적평가를시도할것이다 예시 : 어렵 (VA)-, 놓 (VV)- 3.3절에서언급된바와같이, 최초세종구문분석말뭉치에서추출된의존관계는 어렵다 의경우 28개, 놓다 의경우에는 23개의유형을지닌다. 이들이 Jaccard 계수의의거어떻게걸러지는가를보면아래표3과같다. 임계치어휘 어렵다 놓다 < 표 3> 임계치에따른하위범주화틀개수
21 한국어용언위계구조자동구축 221 주목할점은가장엄격한임계치를사용하는 0.01의경우논항인정범위가대폭축소된다는것이다. 구체적으로이들각각은아래와같은논항구조로정리된다. 각논항구조우측의수치는해당 Jaccard 계수이다. (11d) 의경우가약간의아스러운부분이있으나그값이임계치에서크게벗어나지않음을감안하면아래의결과는비교적타당하다고판단된다. 특히, 놓다 의논항으로 NP(loc) 가명시된 (12a) 가선택된점은흥미로운결과라하겠다. (11) 어렵 /VA a. <VP(nom)> b. <VP(nom), NP(dat)> c. <S(nom)> d. <VP(nom), NP(src)> (12) 놓 /VV a. <NP(nom), NP(acc), NP(loc)> 그러나한편으로위의예시는 Jaccard 계수의단점역시드러내고있다. 대다수의통계식은대상이지나치게자주출현하거나혹은지나치게드물게출현하는경우를어떻게처리하느냐에따른장단점을지니게마련인데, Jaccard 계수는이관점에서약간취약하다. 17) 그이유는 Jaccard 계수가해당검증대상의가장특징적인분포를대변해주는기능을수행하기때문이다. 예를들어, 놓다 의경우실제자료에서는 <NP(nom), NP(acc)> 구조가고빈도로출현하였으나위 (12) 에서는제외된것을볼수있는데그이유는 <NP(nom), NP(acc)> 의하위범주화틀이모든동사에걸쳐가장고빈도형태이기때문이다. 즉, 고빈도로출현하는하위범주화틀에는지나친불이익을주는경향성을 Jaccard 계수는내포하고있다. 이러한점을실증적으로보완하기위하여, 다 17) 모든통계적검증은나름의취약점을일정정도내포하기마련이다. 예컨대, 하위범주화틀의자동추출연구에종종사용되어온 T-score 의경우 Jaccard 계수와대립되는특성을보이는데, 저빈도분포를지나치게무시하는경향성을나타낸다. 또한이항가설검증의경우표 2 에서드러난바와같이대개 recall 이 precision 에비해상대적으로떨어지는경향이있다.
22 222 언어와언어학제 54 집 음 5절은도출된하위범주화틀에후처리를한결과를사용하여위계구조를도출하였다. 어떠한용언의하위범주화틀가운데가장고빈도로출현한것은 Jaccard 계수에의해임의로걸러지지않게끔하여전체결과가편중되지않도록추가적인조정을하였다. 18) 5. 위계구조 지금까지의과정에서우리는구문분석말뭉치에서의존소를일관된기준에의거추출하고, 이를다시통계적모형에의거정제하여유의미한논항구조까지자동구성하였다. 다음으로 5절에서는앞서구성된 5,370 개용언의논항구조를토대로이들사이의관계를체계화하고계층화하여용언위계구조를설정한다. 여기에서이론적배경이되는문법적틀은 HPSG 이며, 구체적으로는김종복 (2004) 의방식을기준점으로한다. 다만, 기존연구가연구자의직관을통해수작업으로위계구조를만들고, 개별어휘를하나하나분석하여이들에대입하는방식이었다면, 본연구의방식은대량의자료에서추출된언어정보를바탕으로이들을군집화하는방식에속한다 위계구조확립 HPSG에서는이론적틀안에서는유형자질구조 (Type Feature Structure) 가중요한기제로상정되고있다. 이유형자질구조는다시언어적각유형의종적및횡적잉여성을경감하고언어구조가상호작동하는방식의일반화를포착하기위해계층화되어표상되는데, 이를유형위계 (Type Hierarchy) 라칭한다. 이유형위계가성립되는중요한원리가운데하나가바로다항상속인데, 이것은위계상의하나의절점, 다시말해하나의유형은복수 18) 이러한추가조정은다소실용적인목적에서선택된방법이다. 먼저몇가지통계적검증모형을통해얻어진결과에서실제시스템에탑재되었을때가장우수한성능을낼것으로기대되는것을선택한다. 다음으로그단점을어떻게보완할수있는가를판단하여결과를후보정한다. 즉, 시스템의성능향상을위해가장실질적인도움이되는방식을적극적으로사용하는것이다.
23 한국어용언위계구조자동구축 223 의상위유형의속성값을상호모순이존재하지않는한모두할당받을수있다는의미다. 본연구의용언위계구조는이러한점에착안하여, 기본적으로두가지층위의상위유형의다중상속으로이루어진다. 하나의층위는 (i) 범주적계층정보이며, 다른하나는 (ii) 어휘적자질정보이다. 범주적계층정보는하나의유형이문법범주적으로판단하였을때어느유형의상위유형이되고또어느유형의하위유형이되는가를말한다. 이범주적계층정보는 5단계로구성이된다. 우선동사 (VV) 와형용사 (VA) 의경우를살펴보면다음과같다. (i) 용언위계의제일상단에는 heavy-v 가놓이며전체위계안에서는경동사 (light-v) 와자매관계를이루어주동사 (main-verb-lex) 의딸절점에놓인다. (ii) 다음단계는동사 / 형용사를구분하기위한것으로각기 non-stative-v 및 stative-v 으로명명되어 heavy-v 의딸절점이된다. (iii) 이들각각은다시타동성의여부에따라구분이되어, 각자 {v-intr, v-tr, v-ditr} 및 {a-intr, a-tr} 을자신의딸절점으로취한다. (iv) 다음단계는논항의범주에따른구분이다. 즉, 논항이명사구인가, 동사구인가, 문장인가에따른것으로, 예컨대 v-np-tr, v-vp-tr, v-s-tr 등과같은세부유형이여기에속한다. (v) 마지막단계로논항의범주가명사구일경우, 그격정보를취하여세분화된다. 예컨대, 논항이 밥을먹다 와같이목적격으로구성될경우에는 v-np-tr 의하위유형인 v-acc-tr 으로판별되고, 연필을책상에다놓다 와같이논항이 2개면서각기목적격과처소격을지니는경우에는 v-np-np-ditr 의하위유형인 v-acc-loc-ditr 으로처리된다. 아래의그림은전체계층을단순화하여제시한것으로타동사 먹다 의계층상의위치를예시하고있다.
24 224 언어와언어학제 54 집 < 그림 2> 범주적계층정보 다음으로어휘자질정보는위의각절점이가지는어휘적속성을말하며, 각절점의특성을규정해야하기때문에마찬가지로 5개의단위로구성되어있다. (i) 첫번째는 lex-heavy 로서이것은중동사의속성값을기술한다. (ii) 두번째는상태성을명시하기위한 lex-stative / lex-non-stative이며, (iii) 세번째항목은타동성을명시한 lex-intransitive, lex-intransitive 및 lex-ditransitive 등이다. (iv) 네번째항목은논항의범주정보를명시한 lex-argst-np-tr, lex-argst-np-s-ditr 등이며, (v) 마지막항목은각 lex-argst-acc-tr 와같이논항의격정보를구분해준다. 각각의예시는아래와같다. 즉, (13) 은타동사 먹다 의어휘적속성을순차적으로반영한다. 19) (13)a. lex-heavy [ SYNSEM.LOCAL.CAT.HC-LIGHT ] b. lex-non-stative [ SYNSEM.LOCAL.CAT.STATIVE ] c. lex-transitive [ SYNSEM.LOCAL.CAT.VAL.COMPS <1>, ARG-ST < [], 1> ] d. lex-argst-np-tr [ ARG-ST < [], [ LOCAL.CAT.HEAD.NOMINAL + ] > ] e. lex-argst-acc-tr [ ARG-ST < [], [ LOCAL.CAT.HEAD.CASE.SCASE no_scase ] > ] 19) 각자질구조는김종복 (2004) 에서제시된바에일부기초하였다.
25 한국어용언위계구조자동구축 225 다시말해, 범주적계층정보는전체위계구조의틀을구성하고위계내의각유형의실질적인속성값은어휘자질정보에서부여받는다. 예컨대, v-acc-tr 은범주계층정보인 v-np-tr 과어휘계층정보인 lex-argst-acc-tr 으로부터다중상속된유형이다 평가 지금까지도출된전체결과를평가를하여가장우수한결과를보인다고판단되는대상을선택하여보기로하자. 우선 5,370 개의어휘소에서표면형어휘는총 5,223 개로조사되었다. 어휘소의개수와표면형의개수가 147개가차이가나는것인데, 이러한차이에는두가지이유가있다. 하나는동음이의어의처리가이루어지지않았기때문이다. 예를들어, 형용사로서의 쓰다 (bitter) 와동사로서의 쓰다 (write) 가실제사전부에는모두 쓰- 로등재되기때문이다. 두번째이유는세종구문분석말뭉치에일반명사를지칭하는 NNG와어근명사를지칭하는 XR이하나의표면형에혼재되어사용되는경우가있기때문이다. 예를들어 가능하다 의 가능 이경우에따라일반명사로주석되는경우가있는반면때로는어근명사로처리되는경우도존재한다. 이러한문제점은실제말뭉치에표기된표면형을존중하는차원에서별다른전처리를하지않았다. 이러한결과어휘항개수에있어서 101개의차이가발생하였다. 두번째로도출된하위범주화틀의계량적분포는 Jaccard 계수식에서사용한임계치에따라아래표와같이조사되었다. 임계치 전체하위범주화개수 5,833 9,467 14,804 한어휘당평균하위범주화개수 표준편차 < 표 4> 하위범주화틀의계량적분포
26 226 언어와언어학제 54 집 위에서나타난바와같이가장엄격한임계치 0.01을사용하였을때에는하나의표면형어휘가평균적으로하나씩의하위범주화틀을가지는것으로보이는반면, 느슨한임계치를사용한경우에는그평균개수및편차값이상당히커진다는점을알수있다. 특히, 임계치 의경우, 표준편차값 3.54는다소의아스럽다. 큰표준편차는대부분의용언의하위범주화가예측가능하지않다는것을의미할수있기때문이다. 다음으로각임계치에따라선별된용언별하위범주화틀의개수를살펴보자. 편의상여기에서는개수순으로상위 10 개의용언을비교하기로한다. 임계치 : 0.01 임계치 : 임계치 : 어휘 개수 어휘 개수 어휘 개수 되다 7 느끼다 30 하다 58 하다 7 보이다 29 되다 54 말다 6 생각하다 28 있다 44 보다 6 알다 28 말다 39 보이다 6 있다 26 보이다 38 없다 6 되다 25 없다 36 있다 6 시작하다 25 가다 33 적다 6 말다 24 알다 32 중요하다 6 하다 24 보다 31 낮다 5 나오다 23 느끼다 30 < 표 5> 용언별하위범주화틀의개수 위 < 표 5> 를통해우리는임계치 과 을사용하여도출된결과는하위범주화의개수가지나치게편중되어있음을짐작할수있다. 대표적으로형용사 느끼다 가 30개나되는하위범주화틀을가진다는점은납득하기어려운부분이다. 실제추출된 느끼다 의하위범주화틀가운데전체누적비율의 75% 이상을차지하는주요항목은아래와같다. 각괄호안의수치는차례로출현빈도, 비율, Jaccard 계수를나타낸다.
27 한국어용언위계구조자동구축 227 (14) 느끼 /VV a. <NP(nom), NP(acc)> (114, 30.32%, ) b. <NP(nom)> (58, 15.43%, ) c. <NP(nom), NP(acc), NP(dat)>(35, 9.31%, ) d. <NP(nom), NP(equ)> (24, 6.38%, ) e. <NP(nom), VP(acc)> (16, 4.26%, ) f. <NP(nom), NP(dat)> (15, 3.99%, ) h. <NP(nom), NP(acc), NP(loc)> (15, 3.99%, ) i. <NP(nom), S(acc)> (14, 3.72%, )... 이가운데, 임계치를 0.01로설정하였을경우도출되는하위범주화틀은굵은글씨로표시된 3개뿐이다. (14) 를세종전자사전에추출한아래의각유형및예문과비교해보자. (15) a. X=N0-이 Y=N1-을 V (=14a) 우리마누라는자유를느끼고싶단다. b. X=N0-이 Y=S1-고 V (=14i) 철호는민서가정상이아니라고느꼈다. c. X=N0-이 Y=N2-에 에서 에게 에게서 에대해 Npr1-을 V (=14c) 그는친구에게심한모욕감을느꼈다. d. X=N0-이 Y=N2-에 Npr1-을 V (=14h) 나는갑자기옆구리에통증을느꼈다. e. X=N0-이 Y=N1-을 ADV V ( 14i) 철수는애인을가깝게느끼면서도... 첫번째와두번째격틀 (15a-b) 는임계치 0.01을사용하여추출된하위범주화틀과완전한일치를보이고있다. 이러한일치는평가에서 precision 값에긍정적인영향을주는요소이다. 그러나 (15c-d) 의격틀은임계치 0,001 및
28 228 언어와언어학제 54 집 을사용한결과에는포함되나임계치 0.01을사용한결과에서는배제되었다. 즉, 평가의 recall 값에부정적인영향을주게되는것이다. 끝으로 (15e) 는완벽히일치하는것은아니나, (14i) 의하위범주화와부분일치를보이는항목이다. (15e) 같은예는 precision 및 recall 각각의하락을가져오는요소이지만, 완전히잘못된도출이라고판단할수는없는것이다. 여기서 precision 과 recall 가운데우선시되어야할항목이무엇이냐의문제가제기되는데, Sarkar and Zeman(2000), Chesley and Salmon-Alt(2006), Tsunakawa and Kaji(2010) 등의선행연구는공통적으로 precision 에더비중을두고있다. 이는경험적인이유에근거하는데, 실제결과가자연어처리에활용될때발생할수있는문제점을최소화하도록하는장치이다. 이러한측면에서표5 및 (14) 의수치를다시고려하면, 임계치 0.01을사용하는것이과잉일반화의오류를피할수있는선택이다. 다음으로각각의임계치에따른결과를바탕으로자동구성된위계구조의분포를살펴보자. 임계치 전체용언유형개수 한유형당평균어휘수 표준편차 < 표 6> 위계구조의분포 더느슨한임계치를사용할수록용언의유형의개수가늘어남을알수있는데그이유는그만큼다양한종류의하위범주화틀을포괄하고있기때문이다. 끝으로각임계치에따른결과의주요유형을살펴보도록한다.
29 한국어용언위계구조자동구축 유형 비율 누적 유형 비율 누적 유형 비율 누적 v-acc-tr 34.06% 34.06% v-acc-tr 21.17% 21.17% v-acc-tr 14.21% 14.21% v-intr 17.32% 51.38% v-intr 11.23% 32.40% v-intr 9.56% 23.76% a-intr 11.14% 62.52% a-intr 6.90% 39.29% v-dir-tr 7.56% 31.32% v-dat-tr 9.41% 71.94% v-dat-tr 6.41% 45.71% v-acc-dir-ditr 7.06% 38.38% v-dir-tr 4.87% 76.80% v-dir-tr 4.25% 49.95% v-dat-tr 6.61% 44.99% v-acc-dat-ditr 2.31% 79.12% v-v-tr 3.75% 53.70% v-acc-dat-ditr 6.56% 51.55% v-acc-dir-ditr 2.19% 81.31% v-acc-dir-ditr 2.98% 56.68% v-src-tr 4.71% 56.26% v-src-tr 1.92% 83.23% v-s-tr 2.90% 59.59% v-acc-src-ditr 4.54% 60.80% a-dat-tr 1.03% 84.26% v-equ-tr 2.86% 62.45% a-intr 4.49% 65.29% v-com-tr 1.01% 85.27% v-acc-dir-ditr 2.84% 65.29% v-v-tr 4.19% 69.48% < 표 7> 임계치별주요유형비교 위표에서상위 2개의비율을점하는유형은모두 v-acc-tr 및 v-intr 로서동일하다. 다만그비율의크기가서로상이한데, 가장엄격한임계치를사용하는좌측 0.01 항목에서는그누적비율이 50% 를상회하는반면, 가장느슨한임계치를사용하는우측 에서는 25% 에도채미치지못한다. 기본형인자동사혹은목적격을취하는기본형타동사가전체용언의절반가까이를차지한다는것이화자의직관에도부합된다고본다. 또한일반적인형용사인 a-intr 을포함시킬경우임계치 0.01은전체용언의 60% 이상을포괄하고있어자연스러워보인다. 반면, 임계치 은상위 3개의누적비율이 40% 에미치지못하며, 임계치 에서는 a-intr 이전체의 5% 에도미치지못하는점을관찰할수있다. 따라서, 위에서결국임계치 0.01을사용하는결과가가장좋은결과를보인다고판단해볼수있다. 이러한여러측면을종합적으로고려하여본연구에서는 0.01을잠정적인임계치로설정하였다. 결과적으로도출된전체위계구조는부록 1과같다. 부록 1에서각유형우측의숫자는해당유형에속한어휘의수를말한다.
30 230 언어와언어학제 54 집 5.3. 예시 : 어렵 (VA)-, 놓 (VV)- 임계치 0.01을적용한용언위계구조를결과로택하였으므로, 두가지예시 어렵다 와 놓다 가각기어떻게최종구현되어있는지살펴보도록하자. 먼저 어렵다 의경우 (11) 에서논의된논항구조와동일한세부유형을지닌다. 이때, (16b) 와 (16d) 의경우주어의범주정보 vp가명시되지않았으나, 주어의경우에는해당용언이타동성을지니는경우범주제약을미명세상태로남겨두므로문제가되지않는다. (16) 어렵 /VA a. 어렵-1a-vp-intr <VP(nom)> b. 어렵-2a-dat-tr <VP(nom), NP(dat)> c. 어렵-3a-s-intr <S(nom)> d. 어렵-4a-src-tr <VP(nom), NP(src)> 다음으로 놓다 의경우에는 (12) 에서살핀하위범주화틀이외에가장잦은빈도로출현한하위범주화가처리에포함되어아래와같은유형을취한다. (17) 놓 /VV a. 놓-1 v-acc-tr <NP(nom), NP(acc)> b. 놓-2 v-acc-loc-ditr <NP(nom),NP(acc), NP(loc)> 6. 결론 지금까지세종구문분석말뭉치를기반으로하여한국어용언의하위범주화틀과그위계구조를자동구축하는과정을제시하였다. 첫번째단계는의존소추출로서말뭉치에서의존소를추출하는구체적인알고리즘을제시하고, 관련된몇가지이슈에대해검토하였다. 하위범주화틀을기술하는데논항 / 부가어의구분과공범주출현가능성을반영하기위해두번째단계에서는통계적인
31 한국어용언위계구조자동구축 231 검증모형을도입하였다. 이항가설검증과 Jaccard 계수가활용되었으며, 그결과 Jaccard 계수를통한결과값이주어진자료에더잘맞는다는사실을확인하였다. 그러나각임계치에따른하부결과가운데어느것이더우월한지는판단하지못하였으며, 그점은마지막단계에서재검토되었다. 최종단계에서는 HPSG의이론적틀에준거하여주어진하위범주화의군집화를통해위계구조를도출하였고그구체적결과를평가하였다. 각각의분포적성향가운데타당성이높다고판단되는것은가장엄밀한임계치인 0.01을사용한결과였다 연구의의의 이상의연구의가장큰의의는무엇보다한국어의언어자원을구축하는방법론을설정하는데있어서기존의연구와차별성을보인다는점이다. 구체적으로는아래표와같다. 기존연구 본연구 기술방식 수동 자동 배경 언어이론 자료기반 판단의근거 언어직관 언어자료 ( 구문분석말뭉치 ) 처리의모형 심리언어적기술 전산적 / 통계적처리 도출방식 분류 (classification) 군집화 (clustering) 하향식 (top-down) 상향식 (bottom-up) < 표 8> 구축방법론비교 물론본연구의방식이기존연구의방식에비해절대적으로우수하다는입장은아니다. 다만, 기존연구의방식을보완할수있는다른각도의접근법을제시하였다는점에서의의가있을것이다. 두번째로는현재까지구축되어온한국어언어자원을적극활용하였다는점을본연구의의의로들수있다. 특히, 10여년간정부주도로구축되어일반에
32 232 언어와언어학제 54 집 게공개된세종말뭉치와전자사전을연구의중심적인자료로활용하였다는점에서기존대부분연구와차별화된다. 세번째로말뭉치를활용한위계구조설정은최근의연구추세에발맞춘방법론이다. 어휘의자동습득에관한최근의연구경향은단순히언어자원에서특정언어정보를뽑아내는것에그치지않고이를재가공하여보다넓은범위의활용가능성을지니는자원을생성하는것이다 (Dorr and Jones, 1996; Gamallo et al., 2001; Korhonen et al., 2003). 아울러 HPSG기반의시스템구현연구의측면에서도언어자원의활용은단기간에우수한성과를낼수있는방법론으로여러차례검토된바있으며, 따라서위둘째이유와마찬가지로최근의추세에맞물린연구흐름이라할수있다. 대표적으로 Cramer and Zhang(2010) 에서는독일어구문분석말뭉치인 Tiger Treebank 에서문법을자동도출하여 HPSG/MRS 기반독일어문법인 Cheetah 를제시하였다. Miyao and Tsujii(2008) 은 Penn English Treebank에서 HPSG 문법을반자동도출한확률기반 HPSG 분석기 Enju 를제시하였으며, 마찬가지의방법론으로 Yu et al.(2010) 에서는중국어 HPSG 문법을구성하였다. 즉, HPSG기반의시스템을구현하는데있어서실증적인언어자원을활용하는것은이미검증된방법론에속한다. 네번째로는언어학적연구를수행하는데, 통계를활용한계량적모형을적극적으로도입하였다는데의의가있다. 본연구에서사용된통계적검증모형들은비단하위범주화틀을도출하는데에만국한된것이아니기때문에다른언어현상의분포적특성을살피는데있어서도충분히활용될여지가있다. 계량적검토를통해언어의분포적특질을밝히는일은이론언어학적접근에실증적증거를제시하는일이될것이다. 끝으로실제시스템의성능을향상시킬수있는구체적인방안에대한조사와모형개발이수반되었다는점을들수있다. 즉, 단순히이론적차원의결과제시에그치지않고, 이결과가실제시스템에어떻게탑재될수있는가를연구의핵심방향으로설정하였다. 이러한연구는한국어자원문법을비롯한실제시스템의개발에중요한토대가될것이다.
33 한국어용언위계구조자동구축 향후과제 향후과제는크게세가지차원에서고려될수있다. 먼저본연구에서는용언의통사적특성만을살피었으나향후연구에서는그에더하여어휘의미적특성까지함께파악되어야할것이다. 이러한판단은비슷한통사적속성을지니는범주는비슷한의미적성향을보인다는관점에따른것이다 ( 송상헌외, 2008; 송상헌 최재웅, 2010). 용언자체의어휘의미적속성이통사적환경에어떠한영향을주고받는지에대한연구와함께 (Dorr and Jones, 1996; Korhonen et al., 2003), 하위범주화의각논항들이해당용언과가지는의미적선택관계가어떠한양상으로존재하는가에대해서도살필수있을것이다 (Gamallo et al., 2001). 두번째로는한국어단일언어자원을뛰어넘어서, 병렬구문분석말뭉치를대상으로한연구역시흥미로운연구가될것이다. 즉, 한국어용언의하위범주화틀이영어또는일본어와같은언어에서는어떠한구조로구현되는가에대한계량적연구는기계번역을비롯한실제시스템개발에중요하게쓰일수있다 (Haugereid and Bond, 2011). 끝으로, 현재까지제시된각결과를실제한국어자원문법을비롯한 HPSG 전산문법에적용하여그성능향상의정도를실험하여야한다 (Song et al. 2010). 또한언어이론에독립적으로통계기반구문분석기의성능에도긍정적인기여를할수있는지의여부역시추후검토의대상이될것이다.
34 234 언어와언어학제 54 집 부록 1: 용언위계구조및빈도 heavy-v 5833 stative-v 976 a-intr 650 a-tr 254 a-np-tr 223 a-abl-tr 1 a-acc-tr 30 a-as-tr 5 a-comp-tr 28 a-com-tr 16 a-con-tr 1 a-dat-tr 60 a-dir-tr 29 a-equ-tr 25 a-loc-tr 1 a-nom-tr 17 a-src-tr 10 a-s-tr 12 a-v-tr 19 a-ditr 72 a-np-np-ditr 36 a-acc-dat-ditr 1 a-acc-dir-ditr 1 a-acc-src-ditr 2 a-nom-as-ditr 2 a-nom-com-ditr 6 a-nom-comp-ditr 15 a-nom-dat-ditr 1 a-nom-dir-ditr 2 a-nom-equ-ditr 6 a-s-np-ditr 13 a-s-abl-ditr 1 a-s-as-ditr 1 a-s-com-ditr 2 a-s-comp-ditr 1 a-s-dat-ditr 5 a-s-equ-ditr 2 a-s-src-ditr 1 a-v-np-ditr 23 a-v-as-ditr 1 a-v-com-ditr 2 a-v-comp-ditr 2 a-v-dat-ditr 9 a-v-dir-ditr 6 a-v-src-ditr 3 non-stative-v 4857 v-intr 1010 v-tr 3231 v-np-tr 3124 v-abl-tr 13 v-acc-tr 1987 v-as-tr 12 v-comp-tr 12 v-com-tr 59 v-con-tr 2 v-dat-tr 549 v-dir-tr 284 v-equ-tr 31 v-inst-tr 8 v-loc-tr 22 v-nom-tr 33 v-src-tr 112 v-s-tr 59 v-v-tr 48 v-ditr 616 v-np-np-ditr 405 v-acc-abl-ditr 7 v-acc-as-ditr 8 v-acc-com-ditr 7 v-acc-comp-ditr 7 v-acc-dat-ditr 135 v-acc-dir-ditr 128 v-acc-equ-ditr 8 v-acc-inst-ditr 10 v-acc-loc-ditr 16 v-acc-src-ditr 48 v-nom-abl-ditr 4 v-nom-com-ditr 6 v-nom-comp-ditr 4 v-nom-dat-ditr 6 v-nom-dir-ditr 4 v-nom-equ-ditr 7 v-s-np-ditr 91 v-s-as-ditr 3 v-s-com-ditr 2 v-s-comp-ditr 1 v-s-dat-ditr 26 v-s-dir-ditr 26 v-s-equ-ditr 2 v-s-src-ditr 31 v-v-np-ditr 120 v-v-abl-ditr 1 v-v-com-ditr 4 v-v-comp-ditr 3 v-v-dat-ditr 39 v-v-dir-ditr 33 v-v-equ-ditr 10 v-v-loc-ditr 1 v-v-src-ditr 29
35 한국어용언위계구조자동구축 235 참고문헌 김영희 (2004) 논항의판별기준. 한글 266: 김종복 (2004) 한국어구구조문법 한국문화사. 송상헌 전지은 최재웅 (2008) 영어형용사 + 전치사구구문의의미적제약 - ICE-GB와 WordNet을활용한통계적검증 -. 언어와언어학 41: 송상헌 최재웅 (2010) 영어동사의의미적유사도와논항선택사이의연관성 : ICE-GB와 WordNet을이용한통계적검증. 언어와정보 14(1): 채희락 (1996) 하- 의특성과경술어구문. 어학연구 32: Brent, M. R. (1993) "From Grammar to Lexicon: Unsupervised Learning of Lexical Syntax". Computational Linguistics 19: Briscoe, T. & J. Carroll (1997) "Automatic Extraction of Subcategorization from Corpora". Proceedings of the 5th Conference on Applied Natural Language. Washington, DC. Carroll, J., M. Guido, & T. Briscoe (1998) "Can Subcategorisation Probabilities Help a Statistical Parser?" Proceedings of the 6th ACL/SIGDAT Workshop on Very Large Corpora. Montreal, Canada. Carroll, J. & A. C. Fang (2005) "The Automatic Acquisition of Verb Subcategorisations and Their Impact on the Performance of an HPSG Parser". Lecture Notes in Computer Science 3248: Chae, H. (2000) "Complements vs. Adjuncts (in Korean)". Studies in Modern Grammar 19: Chesley, P. & S. Salmon-Alt (2006) "Automatic Extraction of Subcategorization Frames for French". Proceedings of the Language Resources and Evaluation Conference (LREC).
36 236 언어와언어학제 54 집 Genua, Italy. Choi, H. (2010) "The Distinction of Argument and Adjunct as a Gradient Notion". Language and Information 14: Cramer, B. & Z. Yi (2010) "Constraining Robust Constructions for Broad-Coverage Parsing with Precision Grammars". Proceedings of the 23rd International Conference on Computational Linguistics. Beijing, China. Dorr, B. J. & J. Doug (1996) "Role of Word Sense Disambiguation in Lexical Acquisition: Predicting Semantics from Syntactic Cues". Proceedings of the 16th conference on Computational Linguistics. Copenhagen, Denmark. Erk, K. (2007) "A Simple, Similarity-based Model for Selectional Preferences". Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics. Prague, Czech Republic. Gamallo, P., A. Agustini, & G. P. Lopes (2001) "Selection Restrictions Acquisition from Corpora". Lecture Notes in Computer Science 2258: Haugereid, P. & F. Bond (2011) "Extracting Transfer Rules for Multiword Expressions from Parallel Corpora". Proceedings of the Workshop on Multiword Expressions: from Parsing and Generation to the Real World (MWE 2011). Portland, Oregon. Korhonen, A., G. Gorrell & D. McCarthy (2000) "Statistical Filtering and Subcategorization Frame Acquisition". Proceedings of the 2000 Joint SIGDAT Conference on Empirical Methods in Natural Language Processing and Very Large Corpora. Hong Kong. Korhonen, A., Y. Krymolowski & Z. Marx (2003) "Clustering Polysemic Subcategorization Frame Distributions
37 한국어용언위계구조자동구축 237 Semantically" Proceedings of the 41st Annual Meeting on Association for Computational Linguistics. Sapporo, Japan. Levin, B. (1993) English Verb Classes and Alternations: a Preliminary Investigation. University Of Chicago Press. Manning, C. D. (1993) "Automatic Acquisition of a Large Subcategorization Dictionary from Corpora". Proceedings of the 31st Annual Meeting of the Association for Computational Linguistics. Columbus, Ohio. Marcus, M. P., M. A. Marcinkiewicz, & B. Santorini (1993) "Building a Large Annotated Corpus of English: the Penn Treebank". Journal of Computational Linguistics 19: Miyao, Y. & J. Tsujii (2008) "Feature Forest Models for Probabilistic HPSG Parsing". Computational Linguistics 34(1): Roland, D. & D. Jurafsky (1998) "How Verb Subcategorization Frequencies are Affected by Corpus Choice". Proceedings of the 17th International Conference on Computational Linguistics. Morristown, NJ, USA. Sag, I. A., T. Wasow, & E. M. Bender (2003) Syntactic Theory: A Formal Introduction. CSLI Publications. Sarkar, A. & D. Zeman (2000) "Automatic Extraction of Subcategorization Frames for Czech" Proceedings of the 18th Conference on Computational Linguistics. Saarbrücken, Germany. Song, S. & J. Choe (2008) "Automatic Construction of Korean Verbal Type Hierarchy using Treebank" Proceedings of the 15th International Conference on Head-Driven Phrase Structure Grammar. Keihanna, Japan. Song, S. & J. Jeon (2008). "The Xavier Module - Information
38 238 언어와언어학제 54 집 Processing of Treebanks" Proceedings of the International Conference of Cognitive Science Seoul, Korea. Song, S., J. Kim, F. Bond, and J. Yang (2010) "Development of the Korean Resource Grammar: Towards Grammar Customization" Proceedings of the 8th Workshop on Asian Language Resources. Beijing, China. Smadja, F., K. R. McKeown, & V. Hatzivassiloglou (1996) "Translating Collocations for Bilingual Lexicons: a Statistical Approach". Computational Linguistics 22: Tsunakawa, T. & H. Kaji (2010) "Augmenting a Bilingual Lexicon with Information for Word Translation Disambiguation". Proceedings of the 8th Workshop on Asian Language Resources. Beijing, China. Utsuro, T., T. Miyata, & Y. Matsumoto (1998) "General-to-Specific Model Selection for Subcategorization Preference". Proceedings of the 17th International Conference on Computational Linguistics. Morristown, NJ, USA. Yu, K., Y. Miyao, X. Wang, T. Matsuzaki, & J. Tsujii (2010) "Semi-Automatically Developing Chinese HPSG Grammar from the Penn Chinese Treebank for Deep Parsing". Proceedings of the 23rd International Conference on Computational Linguistics, Beijing, China. [ ] 서울특별시성북구안암동고려대학교문과대학언어학과 sanghoun@gmail.com / jchoe@korea.ac.kr 논문접수 : 2011년 12월 30일수정완료 : 2012년 2월 16일게재확정 : 2012년 2월 17일
KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion
KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion 요약 본연구에서는, 웹문서로부터특정상품에대한의견문장을분석하는오피니언마이닝 (Opinion
More information자연언어처리
제 7 장파싱 파싱의개요 파싱 (Parsing) 입력문장의구조를분석하는과정 문법 (grammar) 언어에서허용되는문장의구조를정의하는체계 파싱기법 (parsing techniques) 문장의구조를문법에따라분석하는과정 차트파싱 (Chart Parsing) 2 문장의구조와트리 문장 : John ate the apple. Tree Representation List
More information국어 순화의 역사와 전망
전문용어의국어화 강현화 1. 들어가기 이해할 수 있는 쉬운 언어 사용의 전형을 만들고자 노력하고 있다. 따라서 본고는 전문 용어의 사용자가 전문가뿐만 아니라 일반인도 포 될 수 있다는 데에서 출발한다. 이러한 출발점을 시작으로 과연 전문 함 용어의 국어화가 어떻게 나아가야 하는지에 대해 고민해 보고자 한다. 2. 전문 용어 연구의 쟁점 2.1. 전문 용어
More informationC# Programming Guide - Types
C# Programming Guide - Types 최도경 lifeisforu@wemade.com 이문서는 MSDN 의 Types 를요약하고보충한것입니다. http://msdn.microsoft.com/enus/library/ms173104(v=vs.100).aspx Types, Variables, and Values C# 은 type 에민감한언어이다. 모든
More information이보고서는 2010 년한국언론진흥재단의언론진흥기금을지원받아수행한것입니다. 보고서의내용은한국언론진흥재단의공식견해가아닌연구자의연구결과임을밝힙니다. 목 차 요약문 ⅳ Ⅰ. 서론 1 5 6 7 7 11 13 14 14 16 18 21 29 40-1 - 47 47 48 66 68 69 70 70 71 72 72 73 74-2 - < 표 > 목차 표 1 대한매일신보보급부수
More information#7단원 1(252~269)교
7 01 02 254 7 255 01 256 7 257 5 10 15 258 5 7 10 15 20 25 259 2. 어휘의 양상 수업 도우미 참고 자료 국어의 6대 방언권 국어 어휘의 양상- 시디(CD) 수록 - 감광해, 국어 어휘론 개설, 집문당, 2004년 동북 방언 서북 방언 중부 방언 서남 방언 동남 방언 제주 방언 어휘를 단어들의 집합이라고 할 때,
More information완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에
1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에대하여 AB=BA 1 가성립한다 2 3 (4) 이면 1 곱셈공식및변형공식성립 ± ± ( 복호동순 ), 2 지수법칙성립 (은자연수 ) < 거짓인명제 >
More information조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a
조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a) b) 조사연구 주제어 패널조사 횡단면가중치 종단면가중치 선형혼합모형 일반화선형혼 합모형
More information<B3EDB9AEC0DBBCBAB9FD2E687770>
(1) 주제 의식의 원칙 논문은 주제 의식이 잘 드러나야 한다. 주제 의식은 논문을 쓰는 사람의 의도나 글의 목적 과 밀접한 관련이 있다. (2) 협력의 원칙 독자는 필자를 이해하려고 마음먹은 사람이다. 따라서 필자는 독자가 이해할 수 있는 말이 나 표현을 사용하여 독자의 노력에 협력해야 한다는 것이다. (3) 논리적 엄격성의 원칙 감정이나 독단적인 선언이
More informationPowerPoint Presentation
Dependency Parser 자연언어처리 Probabilistic CFG (PCFG) - CFG - PCFG with saw with saw astronomers ears saw stars telescope astronomers ears saw stars telescope PCFG example Repeated work Parsing PCFG: CKY CKY
More information<B3EDB4DC28B1E8BCAEC7F6292E687770>
1) 초고를읽고소중한조언을주신여러분들게감사드린다. 소중한조언들에도불구하고이글이포함하는오류는전적으로저자개인의것임을밝혀둔다. 2) 대표적인학자가 Asia's Next Giant: South Korea and Late Industrialization, 1990 을저술한 MIT 의 A. Amsden 교수이다. - 1 - - 2 - 3) 계량방법론은회귀분석 (regression)
More information<BBE7C8B8C0FBC0C7BBE7BCD2C5EBBFACB1B820C3D6C1BEBAB8B0EDBCAD2E687770>
국립국어원 2007-01-42 사회적의사소통연구 : 성차별적언어표현사례조사및대안마련을위한연구 국립국어원 한국여성정책연구원 제출문 국립국어원장귀하 국립국어원의국고보조금지원으로수행한 사회적의사 소통연구 : 성차별적언어표현사례조사및대안마련을위한 연구 의결과보고서를작성하여제출합니다. 한국여성정책연구원 안상수 백영주, 양애경, 강혜란, 윤정주 목 차 연구개요 선행연구의고찰
More information212 52,.,. 1),. (2007), (2009), (2010 ), Buzássyová, K.(1999), Bauer, L.(2001:36), Štekauer, P.(2001, 2002), Fernández-Domínguez(2009:88-91) (parole),
- - Jung, Handero. 2011. 08. The formation and listedness of nonce words - Focused on wordization of syntactic construction -. Korean Linguistics 52, 211-241. This paper aims to examine the formation and
More information지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월
지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., 2004 5 2009 12 KOSPI200.,. * 2009. 지능정보연구제 16 권제 1 호 2010 년 3 월 김선웅 안현철 社 1), 28 1, 2009, 4. 1. 지능정보연구제 16 권제 1 호 2010 년 3 월 Support
More information08( ) CPLV15-64.hwp
ISSN 2383-6318(Print) / ISSN 2383-6326(Online) KIISE Transactions on Computing Practices, Vol. 22, No. 2, pp. 107-112, 2016. 2 http://dx.doi.org/10.5626/ktcp.2016.22.2.107 세종전자사전과준지도식학습방법을이용한용언의어의중의성해소
More information(b) 미분기 (c) 적분기 그림 6.1. 연산증폭기연산응용회로
Lab. 1. I-V Characteristics of a Diode Lab. 6. 연산증폭기가산기, 미분기, 적분기회로 1. 실험목표 연산증폭기를이용한가산기, 미분기및적분기회로를구성, 측정및 평가해서연산증폭기연산응용회로를이해 2. 실험회로 A. 연산증폭기연산응용회로 (a) 가산기 (b) 미분기 (c) 적분기 그림 6.1. 연산증폭기연산응용회로 3. 실험장비및부품리스트
More information도약종합 강의목표 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 점향상시킵니다. 강의대상다음과같은분들에게가장적합합니다. -현재토익점수 500점에서 600점대이신분들에게가장좋습니다. -정기토익을 2-3번본적이있으신분
도약종합 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 100-200점향상시킵니다. -정기토익을 2-3번본적이있으신분. -수업도많이들어봤고, 문제도많이풀었지만문법정리가제대로되지않은분. 강의특징수업시간에토익과관련없는사적인잡담으로시간낭비하지않는수업입니다. LC : 파트별집중정리한문제풀이로유형을익혀나가는수업입니다. RC
More information연구보고서 2009-05 일반화선형모형 (GLM) 을이용한 자동차보험요율상대도산출방법연구 Ⅰ. 요율상대도산출시일반화선형모형활용방법 1. 일반화선형모형 2 연구보고서 2009-05 2. 일반화선형모형의자동차보험요율산출에적용방법 요약 3 4 연구보고서 2009-05 Ⅱ. 일반화선형모형을이용한실증분석 1. 모형적용기준 < > = 요약 5 2. 통계자료및통계모형
More information278 경찰학연구제 12 권제 3 호 ( 통권제 31 호 )
여성경찰관의직업윤리의식결정요인분석 * An Analysis of Determinantal Factors Influencing Professional Ethical Standards of South Korean Police Women 신문희 ** 이영민 *** Ⅰ. 서론 Ⅱ. 이론적배경 Ⅲ. 연구방법 Ⅳ. 연구결과 Ⅴ. 결론 Ⅰ. 서론 278 경찰학연구제 12
More informationMicrosoft PowerPoint - e pptx
Import/Export Data Using VBA Objectives Referencing Excel Cells in VBA Importing Data from Excel to VBA Using VBA to Modify Contents of Cells 새서브프로시저작성하기 프로시저실행하고결과확인하기 VBA 코드이해하기 Referencing Excel Cells
More information슬라이드 1
1 언어의두가지모습과언어학 5 1. 언어수행 (linguistic performance): 실제대화상황에 서사용하는언어 (the actual use of language in concrete situations) 2. 언어능력 (linguistic competence): 머릿속에저장되어 있는언어지식 (the mental knowledge that a speaker
More informationSoftware Requirrment Analysis를 위한 정보 검색 기술의 응용
EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템 김석환 * 이청재 정상근 이근배 포항공과대학교 컴퓨터공학과 지능소프트웨어연구실 {megaup, lcj80, hugman, gblee}@postech.ac.kr An Example-Based Natural Language System for EPG Information Access Seokhwan Kim
More information저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할
저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More information<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>
25 강. 수열의극한참거짓 2 두수열 { }, {b n } 의극한에대한 < 보기 > 의설명중옳은것을모두고르면? Ⅰ. < b n 이고 lim = 이면 lim b n =이다. Ⅱ. 두수열 { }, {b n } 이수렴할때 < b n 이면 lim < lim b n 이다. Ⅲ. lim b n =0이면 lim =0또는 lim b n =0이다. Ⅰ 2Ⅱ 3Ⅲ 4Ⅰ,Ⅱ 5Ⅰ,Ⅲ
More information고3-02_비문학_2_사회-해설.hwp
비문학 기출 제재별 문제 모음 (2007~2011학년도 학력평가) 정답 및 해설 사회 2 비문학 사회 01 사회 2011 학년도 10 월학력평가 정답과해설 사회 1 2012 학년도 11 월모의평가 ( 대전 ) 1. 이해한내용으로추론하는능력을파악하는문제이다. 1 7. 유사한사례를파악한다. 5 [ 오답풀이 ] 2. 이해한내용을바탕으로적용할수있는능력을파악하는문제이다.
More informationchap 5: Trees
5. Threaded Binary Tree 기본개념 n 개의노드를갖는이진트리에는 2n 개의링크가존재 2n 개의링크중에 n + 1 개의링크값은 null Null 링크를다른노드에대한포인터로대체 Threads Thread 의이용 ptr left_child = NULL 일경우, ptr left_child 를 ptr 의 inorder predecessor 를가리키도록변경
More informationR을 이용한 텍스트 감정분석
R Data Analyst / ( ) / kim@mindscale.kr (kim@mindscale.kr) / ( ) ( ) Analytic Director R ( ) / / 3/45 4/45 R? 1. : / 2. : ggplot2 / Web 3. : slidify 4. : 5. Matlab / Python -> R Interactive Plots. 5/45
More informationEnglish Language and Linguistics 20(2) 93 영어우향전위구문에대한소고 말뭉치자료를중심으로 김옥기 김종복 경희대학교 서론 영어에서흔히사용되는이른바전위구문 은아래 에서제시된좌향전위구문 과 와같은우향전위구문 으로구분될수있다 위예문에서알수있듯이두
English Language and Linguistics 20(2) 93 영어우향전위구문에대한소고 말뭉치자료를중심으로 김옥기 김종복 경희대학교 서론 영어에서흔히사용되는이른바전위구문 은아래 에서제시된좌향전위구문 과 와같은우향전위구문 으로구분될수있다 위예문에서알수있듯이두구문은서로표면구조상명확한차이점을보이고 있다 의 경우명사구 는이와공지시 하는요소 본논문은 년
More informationstep 1-1
Written by Dr. In Ku Kim-Marshall STEP BY STEP Korean 1 through 15 Action Verbs Table of Contents Unit 1 The Korean Alphabet, hangeul Unit 2 Korean Sentences with 15 Action Verbs Introduction Review Exercises
More informationEA0015: 컴파일러
5 Context-Free Grammar 무엇을공부하나? 앞에서배운 " 정규식 " 은언어의 " 어휘 (lexeme)" 를표현하는도구로사용되었다. 언어의 " 구문 (syntax)" 은 " 정규언어 " 의범위를벗어나기때문에 " 정규식 " 으로표현이불가능하다. 본장에서배우는 " 문맥자유문법 " 은언어의 " 구문 (syntax)" 을표현할수있는도구이다. 어떤 " 문맥자유문법
More information이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다
이장에서사용되는 MATLAB 명령어들은비교적복잡하므로 MATLAB 창에서명령어를직접입력하지않고확장자가 m 인 text 파일을작성하여실행을한다. 즉, test.m 과같은 text 파일을만들어서 MATLAB 프로그램을작성한후실행을한다. 이와같이하면길고복잡한 MATLAB 프로그램을작성하여실행할수있고, 오류가발생하거나수정이필요한경우손쉽게수정하여실행할수있는장점이있으며,
More informationLinguistic Research 28(2), 문법성과문법모델링 : 영어목적어외치구문의변이형을중심으로 * 1 조세연 ( 강원대학교 ) Cho, Sae-Youn Grammaticality and Grammar Modelling: Variati
Linguistic Research 28(2), 289-309 문법성과문법모델링 : 영어목적어외치구문의변이형을중심으로 * 1 조세연 ( 강원대학교 ) Cho, Sae-Youn. 2011. Grammaticality and Grammar Modelling: Variations in English Object Extraposition. Linguistic Research
More informationKD2002-27-02.hwp
개인의 지식창출시스템 구축을 위한 개념화 모델 16) 요 약 정보의 홍수를 이루고 있는 지식 정보사회에서 자신에게 가장 적합한 정보를 신속하게 받아들이 고, 이를 유의미한 지식으로 변형하여 적절한 상황에 활용할 수 있는 지식창출 능력은 매우 중요하 다. 현재까지 지식의 속성이나 인지활동은 여러 학자들에 의해 다양한 접근방법으로 연구되어 왔으 나, 이러한 연구들을
More information언어연구25_고성연_편집본.hwp
LKB 를이용한한국어자유어순의구현 고성연 ( 언어학과박사과정 ) 1. 머리말 2. 한국어의자유어순과 HPSG의논항가자질구조 3. LKB에기반한한국어의자유어순분석 3.1. 단층구조분석 (Flat Structure Analysis) 3.2. 양분단선구조분석 (Binary Linear Structure Analysis) 3.3. 양분병렬구조분석 (Binary Parallel
More informationFGB-P 학번수학과권혁준 2008 년 5 월 19 일 Lemma 1 p 를 C([0, 1]) 에속하는음수가되지않는함수라하자. 이때 y C 2 (0, 1) C([0, 1]) 가미분방정식 y (t) + p(t)y(t) = 0, t (0, 1), y(0)
FGB-P8-3 8 학번수학과권혁준 8 년 5 월 9 일 Lemma p 를 C[, ] 에속하는음수가되지않는함수라하자. 이때 y C, C[, ] 가미분방정식 y t + ptyt, t,, y y 을만족하는해라고하면, y 는, 에서연속적인이계도함수를가지게확 장될수있다. Proof y 은 y 의도함수이므로미적분학의기본정리에의하여, y 은 y 의어떤원시 함수와적분상수의합으로표시될수있다.
More informationMicrosoft PowerPoint - 26.pptx
이산수학 () 관계와그특성 (Relations and Its Properties) 2011년봄학기 강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계
More information2002년 2학기 자료구조
자료구조 (Data Structures) Chapter 1 Basic Concepts Overview : Data (1) Data vs Information (2) Data Linear list( 선형리스트 ) - Sequential list : - Linked list : Nonlinear list( 비선형리스트 ) - Tree : - Graph : (3)
More informationMicrosoft Word - 4장_처짐각법.doc
동아대학교토목공학과구조역학 4. 처짐각법 변위법 (Slope Deflection ethod Displacement ethod) Objective of this chapter: 처짐각법의기본개념. What will be presented: 처짐각법을이용한다차부정정보해석 처짐각법을이용한다차부정정골조해석 Theoretical background 미국미네소타대학의
More informationlkh
XML 을이용한주석말뭉치의구조화와활용 이기황 연세대학교 kihwang.lee@yonsei.ac.kr 1. 머리말 이글에서는구조화문서의마크업을위한메타언어인 XML(eXtensible Markup Language) 를이용하여주석말뭉치를구조화하고, 이를언어연구에활용하는방법을몇 가지예를통하여제시하고자한다. 현재문화관광부및국립국어원에서는 21 세기세종계획 을통하여대규모의언어
More informationProblem New Case RETRIEVE Learned Case Retrieved Cases New Case RETAIN Tested/ Repaired Case Case-Base REVISE Solved Case REUSE Aamodt, A. and Plaza, E. (1994). Case-based reasoning; Foundational
More information2014 년도사업계획적정성재검토보고서 차세대바이오그린 21 사업
2014 년도사업계획적정성재검토보고서 차세대바이오그린 21 사업 목차 i 목 차 iv 목차 표목차 목차 v vi 목차 목차 vii 그림목차 viii 목차 요 약 요약 1 요 약 제 1 장사업개요및조사방법 4 차세대바이오그린 21 사업사업계획적정성재검토보고서 : * ( 15 ) 요약 5 : 6 차세대바이오그린 21 사업사업계획적정성재검토보고서 요약 7 8
More information<B0A3C3DFB0E828C0DBBEF7292E687770>
초청연자특강 대구가톨릭의대의학통계학교실 Meta analysis ( 메타분석 ) 예1) The effect of interferon on development of hepatocellular carcinoma in patients with chronic hepatitis B virus infection?? -:> 1998.1 ~2007.12.31 / RCT(2),
More information2017 년 6 월한국소프트웨어감정평가학회논문지제 13 권제 1 호 Abstract
2017 년 6 월한국소프트웨어감정평가학회논문지제 13 권제 1 호 Abstract - 31 - 소스코드유사도측정도구의성능에관한비교연구 1. 서론 1) Revulytics, Top 20 Countries for Software Piracy and Licence Misuse (2017), March 21, 2017. www.revulytics.com/blog/top-20-countries-software
More informationMicrosoft Word - FunctionCall
Function all Mechanism /* Simple Program */ #define get_int() IN KEYOARD #define put_int(val) LD A val \ OUT MONITOR int add_two(int a, int b) { int tmp; tmp = a+b; return tmp; } local auto variable stack
More information영어동사의의미적유사도와논항선택사이의연관성 : ICE-GB 와 WordNet 을이용한통계적검증 송상헌 최재웅 University of Washington 고려대학교 Sanghoun Song and Jae-Woong Choe The Strength of the
영어동사의의미적유사도와논항선택사이의연관성 : ICE-GB 와 WordNet 을이용한통계적검증 송상헌 최재웅 University of Washington 고려대학교 Sanghoun Song and Jae-Woong Choe. 2010. The Strength of the Relationship between Semantic Similarity and the Subcategorization
More informationMicrosoft PowerPoint Relations.pptx
이산수학 () 관계와그특성 (Relations and Its Properties) 2010년봄학기강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계
More information............ ......
3 N.P 하모닉드라이브 의 작동원리 서큘러스플라인 웨이브제네레이터 플렉스플라인 플렉스플라인은 웨이브제네레 이터에 의해 타원형상으로 탄 성변형되어 이로인해 타원의 장축부분에서는 서큘러스플라 인과 이가 맞물리고 단축부분 에서는 이가 완전히 떨어진 상태로
More information< B3EDB9AEB8F1C2F728332D362936BFF92E687770>
KIPS Tr. Software and Data Eng. Vol.3, No.6 pp.219~230 pissn: 2287-5905 동형이의어분별에의한한국어의존관계분석 219 http://dx.doi.org/10.3745/ktsde.2014.3.6.219 An Analysis of Korean Dependency Relation by Homograph Disambiguation
More informationchap 5: Trees
Chapter 5. TREES 목차 1. Introduction 2. 이진트리 (Binary Trees) 3. 이진트리의순회 (Binary Tree Traversals) 4. 이진트리의추가연산 5. 스레드이진트리 (Threaded Binary Trees) 6. 히프 (Heaps) 7. 이진탐색트리 (Binary Search Trees) 8. 선택트리 (Selection
More information에너지경제연구 Korean Energy Economic Review Volume 9, Number 2, September 2010 : pp. 1~18 가격비대칭성검정모형민감도분석 1
에너지경제연구 Korean Energy Economic Review Volume 9, Number 2, September 2010 : pp. 1~18 가격비대칭성검정모형민감도분석 1 2 3 < 표 1> ECM 을이용한선행연구 4 5 6 7 and 8 < 표 2> 오차수정모형 (ECM1~ECM4) 9 10 < 표 3> 민감도분석에쓰인더미변수 11 12 < 표
More informationMicrosoft PowerPoint - ch09 - 연결형리스트, Stack, Queue와 응용 pm0100
2015-1 프로그래밍언어 9. 연결형리스트, Stack, Queue 2015 년 5 월 4 일 교수김영탁 영남대학교공과대학정보통신공학과 (Tel : +82-53-810-2497; Fax : +82-53-810-4742 http://antl.yu.ac.kr/; E-mail : ytkim@yu.ac.kr) 연결리스트 (Linked List) 연결리스트연산 Stack
More informationadfasdfasfdasfasfadf
C 4.5 Source code Pt.3 ISL / 강한솔 2019-04-10 Index Tree structure Build.h Tree.h St-thresh.h 2 Tree structure *Concpets : Node, Branch, Leaf, Subtree, Attribute, Attribute Value, Class Play, Don't Play.
More informationKMC.xlsm
제 7 장. /S 에필요한내용 1] IGBT 취급시주의사항 ) IGBT 취급시주의 1) 운반도중에는 Carbon Cross로 G-E를단락시킵니다. 2) 정전기가발생할수있으므로손으로 G-E 및주단자를만지지마십시요. 3) G-E 단자를개방시킨상태에서직류전원을인가하지마십시요. (IGBT 파손됨 ) 4) IGBT 조립시에는사용기기나인체를접지시키십시요. G2 E2 E1
More information에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -
에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 - . - 2 - . 1. - 3 - [ 그림 1] 도시가스수요와실질 GDP 추이 - 4 - - 5 - - 6 - < 표 1>
More information저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할
저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More informationMicrosoft PowerPoint - chap06-2pointer.ppt
2010-1 학기프로그래밍입문 (1) chapter 06-2 참고자료 포인터 박종혁 Tel: 970-6702 Email: jhpark1@snut.ac.kr 한빛미디어 출처 : 뇌를자극하는 C프로그래밍, 한빛미디어 -1- 포인터의정의와사용 변수를선언하는것은메모리에기억공간을할당하는것이며할당된이후에는변수명으로그기억공간을사용한다. 할당된기억공간을사용하는방법에는변수명외에메모리의실제주소값을사용하는것이다.
More informationPoison null byte Excuse the ads! We need some help to keep our site up. List 1 Conditions 2 Exploit plan 2.1 chunksize(p)!= prev_size (next_chunk(p) 3
Poison null byte Excuse the ads! We need some help to keep our site up. List 1 Conditions 2 Exploit plan 2.1 chunksize(p)!= prev_size (next_chunk(p) 3 Example 3.1 Files 3.2 Source code 3.3 Exploit flow
More informationiii. Design Tab 을 Click 하여 WindowBuilder 가자동으로생성한 GUI 프로그래밍환경을확인한다.
Eclipse 개발환경에서 WindowBuilder 를이용한 Java 프로그램개발 이예는 Java 프로그램의기초를이해하고있는사람을대상으로 Embedded Microcomputer 를이용한제어시스템을 PC 에서 Serial 통신으로제어 (Graphical User Interface (GUI) 환경에서 ) 하는프로그램개발예를설명한다. WindowBuilder:
More informationPowerPoint 프레젠테이션
How to produce ChemML and MathML 조윤상 ( 과편협기획운영위원 ) 1 Applications of XML Applications of XML RDF (Resource Description Framework) : 자원의정보를표현하기위한규격, 구문및구조에대한공통적인규칙을지원. RSS (Rich Site Summary) : 뉴스나블로그사이트에서주로사용하는콘텐츠표현방식.
More informationCh 1 머신러닝 개요.pptx
Chapter 1. < > :,, 2017. Slides Prepared by,, Biointelligence Laboratory School of Computer Science and Engineering Seoul National University 1.1 3 1.2... 7 1.3 10 1.4 16 1.5 35 2 1 1.1 n,, n n Artificial
More informationChap 6: Graphs
5. 작업네트워크 (Activity Networks) 작업 (Activity) 부분프로젝트 (divide and conquer) 각각의작업들이완료되어야전체프로젝트가성공적으로완료 두가지종류의네트워크 Activity on Vertex (AOV) Networks Activity on Edge (AOE) Networks 6 장. 그래프 (Page 1) 5.1 AOV
More information김기남_ATDC2016_160620_[키노트].key
metatron Enterprise Big Data SKT Metatron/Big Data Big Data Big Data... metatron Ready to Enterprise Big Data Big Data Big Data Big Data?? Data Raw. CRM SCM MES TCO Data & Store & Processing Computational
More information3. 다음은카르노맵의표이다. 논리식을간략화한것은? < 나 > 4. 다음카르노맵을간략화시킨결과는? < >
. 변수의수 ( 數 ) 가 3 이라면카르노맵에서몇개의칸이요구되는가? 2칸 나 4칸 다 6칸 8칸 < > 2. 다음진리표의카르노맵을작성한것중옳은것은? < 나 > 다 나 입력출력 Y - 2 - 3. 다음은카르노맵의표이다. 논리식을간략화한것은? < 나 > 4. 다음카르노맵을간략화시킨결과는? < > 2 2 2 2 2 2 2-3 - 5. 다음진리표를간략히한결과
More information경영학석사학위논문 투자발전경로이론의가설검증 - 한국사례의패널데이타분석 년 8 월 서울대학교대학원 경영학과국제경영학전공 김주형
저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More information저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물
저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 귀하는, 이저작물의재이용이나배포의경우, 이저작물에적용된이용허락조건을명확하게나타내어야합니다.
More informationAnalysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in Univ
Analysis of objective and error source of ski technical championship Jin Su Seok 1, Seoung ki Kang 1 *, Jae Hyung Lee 1, & Won Il Son 2 1 yong in University & 2 Kang Won University [Purpose] [Methods]
More information<30352DC0CCC7F6C8F1343628B1B3292DBFACB1B8BCD2B1B3C1A42E687770>
한국학연구 46(2013.9.30), pp.125-165 고려대학교 한국학연구소 어휘 차원에서의 강조 실현 방식과 그 특징 1)이현희 * 국문초록 이 논문에서는 사전 뜻풀이에 강조 를 포함하는 표제어들을 중심으로 어휘 차원에서 나타나는 강조 표현의 유형과 기능, 특징 등을 살펴보았 다. 을 기준으로 뜻풀이에 강조 를 포함하는 표제어는 200여
More information04김호걸(39~50)ok
Journal of Environmental Impact Assessment, Vol. 22, No. 1(2013) pp.39~50 Prediction of Landslides Occurrence Probability under Climate Change using MaxEnt Model Kim, Hogul* Lee, Dong-Kun** Mo, Yongwon*
More informationMicrosoft PowerPoint - 27.pptx
이산수학 () n-항관계 (n-ary Relations) 2011년봄학기 강원대학교컴퓨터과학전공문양세 n-ary Relations (n-항관계 ) An n-ary relation R on sets A 1,,A n, written R:A 1,,A n, is a subset R A 1 A n. (A 1,,A n 에대한 n- 항관계 R 은 A 1 A n 의부분집합이다.)
More information제 12강 함수수열의 평등수렴
제 강함수수열의평등수렴 함수의수열과극한 정의 ( 점별수렴 ): 주어진집합 과각각의자연수 에대하여함수 f : 이있다고가정하자. 이때 을집합 에서로가는함수의수열이라고한다. 모든 x 에대하여 f 수열 f ( x) lim f ( x) 가성립할때함수수열 { f } 이집합 에서함수 f 로수렴한다고한다. 또 함수 f 을집합 에서의함수수열 { f } 의극한 ( 함수 ) 이라고한다.
More informationPowerPoint 프레젠테이션
2017. 9. 11 헬스커뮤니케이션 : 헬스캠페인목표와수용자의사회 심리적요인 헬스커뮤니케이션주체자들의 소통의목표는? 헬스커뮤니케이션주체자들의 소통의목표는? 수용자의변화 헬스커뮤니케이션주체자들 수용자들의변화 의료서비스제공자 : 건강행동변화, 의사결정정부 : 인식, 태도, 행동변화제약, 건강식품, 뷰티 : 구매 Effect: 수용자반응 Hierarchy 모델커뮤니케이션효과란사전에소통주체자가메시지를통해얻고자미리의도했던반응.
More information27 2, 17-31, , * ** ***,. K 1 2 2,.,,,.,.,.,,.,. :,,, : 2009/08/19 : 2009/09/09 : 2009/09/30 * 2007 ** *** ( :
27 2, 17-31, 2009. -, * ** ***,. K 1 2 2,.,,,.,.,.,,.,. :,,, : 2009/08/19 : 2009/09/09 : 2009/09/30 * 2007 ** *** (: dminkim@cau.ac.kr) 18 한국교육문제연구제 27 권 2 호, 2009. Ⅰ. (,,, 2004). (,, 2006).,,, (Myrick,
More information중간고사
중간고사 예제 1 사용자로부터받은두개의숫자 x, y 중에서큰수를찾는알고리즘을의사코드로작성하시오. Step 1: Input x, y Step 2: if (x > y) then MAX
More informationCC......-.........hwp
방송연구 http://www.kbc.go.kr/ 프로그램 선택은 다단계적인 과정을 거칠 것이라는 가정에서 출발한 본 연 구는 TV시청을 일상 여가행위의 연장선상에 놓고, 여러 다양한 여가행위의 대안으로서 TV시청을 선택하게 되는 과정과, TV를 시청하기로 결정할 경우 프로그램 선택은 어떤 과정을 거쳐서 이루어지는지 밝히고자 했다. 27) 연구 결과, TV시청
More information한국어교재_중급1-앞-인쇄용.indd
발 간 등 록 번 호 이민자를 위한 한국어와 한국문화 한국어와 한국문 화 이민자를 위한 이민자를 위한 한국어와 한국문화 중급 1 중급 1 본 교재는 사회통합프로그램 한국어 과정 전용교재입니다. 11-1270000-000624-01 M E S S A G E P R O L O G U E C O N T E N T S 02 03 04 08 10 lesson 13
More information강의계획서 과목 : JUN s TOEIC 700+( 도약 ) 2017년 3차강사 : 황준선 교재 : ETS 토익기본서 (RC&LC)+ 수업부교재 (JUN s TOEIC 700+) + 품사별추가문제 +Mini Test 수업목표 : LC & RC 필수기본전략수립및 GRAM
강의계획서 과목 : JUN s TOEIC 700+( 도약 / 단과 ) 2017년 3차강사 : 황준선 교재 : ETS 토익기본서 (RC)+ 수업부교재 (JUN s Toeic 700+)+ 추가문제 + 품사별추가문제 수업목표 : 총체적문장구조의이해 & 확립을통한품사 + 어휘유형 100% 정답및 Part 7 Key Word Location 훈련을통한 350+ 목표
More information<33C2F731323239292DC5D8BDBAC6AEBEF0BEEEC7D02D3339C1FD2E687770>
텍스트언어학 39, 2015, pp. 283~311 한국 대중가요 가사의 문체 분석 장소원(서울대) Chang, Sowon, 2015. The stylistic Analysis of the lyrics of Korean popular song. Textlinguistics 39. The sociological approach, one of the methods
More informationexample code are examined in this stage The low pressure pressurizer reactor trip module of the Plant Protection System was programmed as subject for
2003 Development of the Software Generation Method using Model Driven Software Engineering Tool,,,,, Hoon-Seon Chang, Jae-Cheon Jung, Jae-Hack Kim Hee-Hwan Han, Do-Yeon Kim, Young-Woo Chang Wang Sik, Moon
More information878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu
한 국 통 계 학 회 논 문 집 2012, 19권, 6호, 877 884 DOI: http://dx.doi.org/10.5351/ckss.2012.19.6.877 Maximum Tolerated Dose Estimation Applied Biased Coin Design in a Phase Ⅰ Clinical Trial Yu Kim a, Dongjae Kim
More informationJournal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: : * Research Subject
Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp.91-116 DOI: http://dx.doi.org/10.21024/pnuedi.29.1.201903.91 : * Research Subject Trend Analysis on Educational Innovation with Network
More informationJournal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to
Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp.353-376 DOI: http://dx.doi.org/10.21024/pnuedi.29.1.201903.353 (LiD) -- * Way to Integrate Curriculum-Lesson-Evaluation using Learning-in-Depth
More informationPowerPoint 프레젠테이션
03 모델변환과시점변환 01 기하변환 02 계층구조 Modeling 03 Camera 시점변환 기하변환 (Geometric Transformation) 1. 이동 (Translation) 2. 회전 (Rotation) 3. 크기조절 (Scale) 4. 전단 (Shear) 5. 복합변환 6. 반사변환 7. 구조변형변환 2 기하변환 (Geometric Transformation)
More information어휘의미추측전략을활용한자기주도적어휘학습방안 16) 유민애 * < 次例 > Ⅰ. Ⅱ. Ⅲ. Ⅳ. Ⅰ. 서론 1).,,,. * 1) (Hymes). (Canale & Swain) (grammatical competence), (sociolinguistic competenc
어휘의미추측전략을활용한자기주도적어휘학습방안 16) 유민애 * < 次例 > Ⅰ. Ⅱ. Ⅲ. Ⅳ. Ⅰ. 서론 1).,,,. * 1) (Hymes). (Canale & Swain) (grammatical competence), (sociolinguistic competence), (discourse competence), (strategic competence).
More informationePapyrus PDF Document
1. 의식곡, 행사곡, 시상곡, 팡파레 2. 애창곡 모음 3. 제목별 모음 4. 동요, 만화영화 주제곡, 경음악, 효과음 5. 민요, 가곡, 군가, 캐롤 6. Pop Song 7. English Kids Song 8. 일본곡 한글인터넷주소 : 반주기 노래목록집 및 노래반주기에 수록된 곡은 사전예고없이 변경 또는 삭제될 수 있습니다. 4532 4530 2491
More informationFrama-C/JESSIS 사용법 소개
Frama-C 프로그램검증시스템소개 박종현 @ POSTECH PL Frama-C? C 프로그램대상정적분석도구 플러그인구조 JESSIE Wp Aorai Frama-C 커널 2 ROSAEC 2011 동계워크샵 @ 통영 JESSIE? Frama-C 연역검증플러그인 프로그램분석 검증조건추출 증명 Hoare 논리에기초한프로그램검증도구 사용법 $ frama-c jessie
More informationKDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경
KDI정책포럼제221호 (2010-01) (2010. 2. 10) 내용문의 : 이재준 (02-958-4079) 구독문의 : 발간자료담당자 (02-958-4312) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. http://www.kdi.re.kr 우리나라경기변동성에대한요인분석및시사점 이재준 (KDI 부연구위원 ) * 요 약,,, 1970. * (,
More information저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할
저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,
More information제 3강 역함수의 미분과 로피탈의 정리
제 3 강역함수의미분과로피탈의정리 역함수의미분 : 두실수 a b 와폐구갂 [ ab, ] 에서 -이고연속인함수 f 가 ( a, b) 미분가능하다고가정하자. 만일 f '( ) 0 이면역함수 f 은실수 f( ) 에서미분가능하고 ( f )'( f ( )) 이다. f '( ) 에서 증명 : 폐구갂 [ ab, ] 에서 -이고연속인함수 f 는증가함수이거나감소함수이다 (
More information(2) 다중상태모형 (Hyunoo Shim) 1 / 2 (Coninuous-ime Markov Model) ➀ 전이가일어나는시점이산시간 : = 1, 2,, 4,... [ 연속시간 : 아무때나, T 1, T 2... * 그림 (2) 다중상태모형 ➁ 계산과정 이산시간 : 전이력 (force of ransiion) 정의안됨 전이확률 (ransiion probabiliy)
More information강의 개요
DDL TABLE 을만들자 웹데이터베이스 TABLE 자료가저장되는공간 문자자료의경우 DB 생성시지정한 Character Set 대로저장 Table 생성시 Table 의구조를결정짓는열속성지정 열 (Clumn, Attribute) 은이름과자료형을갖는다. 자료형 : http://dev.mysql.cm/dc/refman/5.1/en/data-types.html TABLE
More information2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관
2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관 2015 개정교육과정에따른정보과평가기준개발연구 연구협력진 머리말 연구요약 차례 Ⅰ 서론 1 Ⅱ 평가준거성취기준, 평가기준, 성취수준, 예시평가도구개발방향 7 Ⅲ 정보과평가준거성취기준, 평가기준, 성취수준, 예시평가도구의개발 25 Ⅳ 정보과평가준거성취기준, 평가기준, 성취수준, 예시평가도구의활용방안
More information정보기술응용학회 발표
, hsh@bhknuackr, trademark21@koreacom 1370, +82-53-950-5440 - 476 - :,, VOC,, CBML - Abstract -,, VOC VOC VOC - 477 - - 478 - Cost- Center [2] VOC VOC, ( ) VOC - 479 - IT [7] Knowledge / Information Management
More information제 2 기 (2011 년 ~2014 년 ) 지역사회복지계획
제 2 기 (2011 년 ~2014 년 ) 지역사회복지계획 제 2 기지역사회복지계획 (2011 년 ~2014 년 ) 제출문 2010. 6. 제 2 기지역사회복지계획 (2011~2014) 제 2 기지역사회복지계획 (2011~2014) 제 2 기지역사회복지계획 (2011~2014) 제 2 기지역사회복지계획 (2011~2014) 제 2 기지역사회복지계획
More information80 경찰학연구제 13 권제 2 호 ( 통권제 34 호 ) Ⅱ. 이론적논의와선행연구검토
범죄억제력의효과적발현모델연구 - 억제이론의집결지해체사례적용 분석을중심으로 - A Study on the Model for Effective Crime Deterrence : - Application and Analysis of Deterrence Theory to the Case of Eradicating the Red-light District - 서준배
More informationMicrosoft PowerPoint - 알고리즘_5주차_1차시.pptx
Basic Idea of External Sorting run 1 run 2 run 3 run 4 run 5 run 6 750 records 750 records 750 records 750 records 750 records 750 records run 1 run 2 run 3 1500 records 1500 records 1500 records run 1
More informationSequences with Low Correlation
레일리페이딩채널에서의 DPC 부호의성능분석 * 김준성, * 신민호, * 송홍엽 00 년 7 월 1 일 * 연세대학교전기전자공학과부호및정보이론연구실 발표순서 서론 복호화방법 R-BP 알고리즘 UMP-BP 알고리즘 Normalied-BP 알고리즘 무상관레일리페이딩채널에서의표준화인수 모의실험결과및고찰 결론 Codig ad Iformatio Theory ab /15
More information장애인건강관리사업
장애인건강관리사업 2013. 2013 : : ( ) : ( ) ( ) ( ) : ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 1.. 2.. 제1장. 연구개요 1 제2장. 1세부과제 : 장애인건강상태평가와모니터링 10 - i - 제3장. 2세부과제 : 장애인만성질환위험요인조사연구 117 - ii - 4장.
More informationIndex Process Specification Data Dictionary
Index Process Specification Data Dictionary File Card Tag T-Money Control I n p u t/o u t p u t Card Tag save D e s c r i p t i o n 리더기위치, In/Out/No_Out. File Name customer file write/ company file write
More informationA Hierarchical Approach to Interactive Motion Editing for Human-like Figures
단일연결리스트 (Singly Linked List) 신찬수 연결리스트 (linked list)? tail 서울부산수원용인 null item next 구조체복습 struct name_card { char name[20]; int date; } struct name_card a; // 구조체변수 a 선언 a.name 또는 a.date // 구조체 a의멤버접근 struct
More informationOCW_C언어 기초
초보프로그래머를위한 C 언어기초 4 장 : 연산자 2012 년 이은주 학습목표 수식의개념과연산자및피연산자에대한학습 C 의알아보기 연산자의우선순위와결합방향에대하여알아보기 2 목차 연산자의기본개념 수식 연산자와피연산자 산술연산자 / 증감연산자 관계연산자 / 논리연산자 비트연산자 / 대입연산자연산자의우선순위와결합방향 조건연산자 / 형변환연산자 연산자의우선순위 연산자의결합방향
More information