[PyConKR2017] 노가다 없는 텍스트 분석을 위한 한국어 NLP
|
|
- 상진 기
- 6 years ago
- Views:
Transcription
1 노가다없는텍스트분석을위한한국어 NLP 파이콘코리아 2017 김현중 1
2 노가다없는텍스트분석을위한한국어 NLP Hyunjoong Kim 2
3 KoNLPy 는 Python 에서사용할수있는한국어자연어처리패키지 from konlpy.tag import Kkma kkma = Kkma() print(kkma.nouns(u' 질문이나건의사항은깃헙이슈트래커에남겨주세요.')) [ 질문, 건의, 건의사항, 사항, 깃헙, 이슈, 트래커 ] print(kkma.pos(u' 오류보고는실행환경, 에러메세지와함께설명을최대한상세히!^^')) [( 오류, NNG), ( 보고, NNG), ( 는, JX), ( 실행, NNG), ( 환경, NNG), (,, SP), ( 에러, NNG), ( 메세지, NNG), ( 와, JKM), ( 함께, MAG), ( 설명, NNG), ( 을, JKO), ( 최대한, NNG), ( 상세히, MAG), (!, SF), (^^, EMO)] * 3
4 미등록단어문제 새롭게만들어진단어들은인식이잘되지않습니다 from konlpy.tag import Kkma, Twitter kkma = Kkma() twitter = Twitter() kkma.pos( 파이콘에서엔엘피이야기를합니다 ) 파이 /NNG, 콘 /NNG, 에서 /JKM, 엔엘피 /NNG, 이야기 /NNG, 를 /JKO, 하 /VV, ㅂ시다 /EF twitter.pos( 파이콘에서엔엘피이야기를합니다 ) 파 /Noun, 이콘 /Noun, 에서 /Josa, 엔 /Josa, 엘피 /Noun, 이야기 /Noun, 를 /Josa, 합 /Verb, 시 /PreEomi, 다 /Eomi 4
5 미등록단어문제 새롭게만들어진단어들은인식이잘되지않습니다 from konlpy.tag import Kkma, Twitter kkma = Kkma() twitter = Twitter() kkma.pos( 너무너무너무는아이오아이의노래에요 ) 너무 /MAG, 너무너무 /MAG, 는 /JX, 아이오 /NNG, 아이 /NNG, 의 /JKG, 노래 /NNG, 에 /JKM, 요 /JX twitter.pos( 너무너무너무는아이오아이의노래에요 ) 너무 /Noun, 너무 /Noun, 너무 /Noun, 는 /Josa, 아이오 /Noun, 아이 /Noun, 의 /Josa, 노래 /Noun, 에요 /Josa 5
6 미등록단어문제 이를해결하기위하여사용자사전을추가하여사용합니다 주로이작업은품사판별을한뒤, 빈도수가높은단어들중에서잘못처리된단어를고르는방식입니다 이반복적 / 노동집약적인과정을최대한자동화하는게목표입니다 6
7 우리가다룰이야기 사용자사전을사람이만들지말고, 데이터기반으로추출할것입니다 여러단어추출기법들중 cohesion 에대하여살펴봅니다. 단어중에서도명사는따로추출할것입니다 명사는새로운단어가가장많이생성되고사용도가장많이되는품사입니다 7
8 Part 1: 단어추출 + 토크나이징 Part 2: 명사추출 부록 : KoNLPy + 사용자사전 8
9 단어추출 + 토크나이징 9
10 단어추출 우리도뉴스나글을읽으면서새로운단어들을쉽게학습합니다 단어는 ( 특히명사는 ) 경계에특징이있습니다. 우리는이를이용하여통계기반으로단어를추출합니다 단, 1 음절단어는제외합니다. 단어길이가 1 이면봐도무슨말인지해석하기힘듧니다 (= 모호합니다 ) 10
11 Cohesion (Character n-gram) 한국어의의미를지니는단어 ( 명사 / 동사 / 형용사 / 부사 ) 는어절왼쪽에있습니다 짜장면 / 명사 + 을 / 조사 먹 / 동사 + 었어 / 어미 11
12 Cohesion (Character n-gram) 맥락이충분히주어지지않으면다음에등장할글자의확률이작습니다 한글자 ( 아 ) 는매우모호한문맥입니다 > 아니 % 아이 한글자는특별한문맥을가지기가어렵습니다 > 아이 % > 아시 8.06 % > 아닌 4.74 % > 아파 4.43 % > 아직 3.85 % 12
13 Cohesion (Character n-gram) 맥락이충분히주어지지않으면다음에등장할글자의확률이작습니다 > 아이폰 % 아이오 어떤경우는두글자라하더라도다양한맥락에서등장하기도합니다 > 아이들 % > 아이디 9.66 % > 아이돌 6.77 % > 아이뉴 6.77 % > 아이오 6.53 % 13
14 Cohesion (Character n-gram) Subword 다음에등장할글자가쉽게예상된다면 ( 확률이높다면 ) 아직단어가 끝나지않았다는의미입니다 > 아이오아 % 아이오아 문맥이명확해질수록이전단어 다음글자확률이높아집니다 > 아이오닉 7.49 % > 아이오와 3.26 % > 아이오빈 0.65 % > 아이오페 0.33 % > 아이오케 0.33 % 14
15 Cohesion (Character n-gram) Subword 다음에등장할글자가쉽게예상된다면 ( 확률이높다면 ) 아직단어가 끝나지않았다는의미입니다 아이오아이 > 아이오아이 % 문맥이확실하면다음글자의등장확률이높습니다 15
16 Cohesion (Character n-gram) 단어의경계를넘으면다음글자에대한확률이다시작아집니다 > 아이오아이의 % 아이오아이는 단어경계뒤에는다양한조사 / 어미들이등장합니다 > 아이오아이는 % > 아이오아이와 % > 아이오아이가 % > 아이오아이에 9.52 % > 아이오아이까 1.36 % 16
17 Cohesion (Character n-gram) 단어의점수 (cohesion) 를아래처럼정의해봅니다 cohesion(c 1:n ) = n 1 n 1 i=1 P(c 1:i+1 c 1:i, ) P c 1:2 c 1 = #c 1:2 #c 1 cohesion( 아이오아이 ) = { p( 아 아이 ) * p( 아이 아이오 ) * p( 아이오 아이오아 ) * p( 아이오아 아이오아이 ) 학습은오로직 string count } 1/(5-1) 17
18 Cohesion (Character n-gram) 어절의왼쪽부터 subword 의빈도수를세어봅니다. docs = [ 파이콘에서발표를합니다, ] from collections import defaultdict count= defaultdict(lambda: 0) for doc in docs: for word in doc.split(): n = len(word) for e in range(1, n+1): count[word[:e]] += 1 18
19 Cohesion (Character n-gram) Subword 의빈도수와 P(AB A) 를계산해봅니다 word = ' 아이오아이는 n = len(word) for e in range(2, n+1): w = word[:e] f = count[w] p = f/count[:e-1] 아이, 아이오, 아이오아, 아이오아이, 아이오아이는, f=4910, p=0.15 f=307, p=0.06 f=270, p=0.88 f=270, p=1.00 f=40, p=0.15 print('{:6}, f={}, p={:.2}'. format(w, f, p)) 19
20 Cohesion (Character n-gram) 단어의점수 (cohesion) 를아래처럼구현해봅니다 def cohesion(w): return pow(count[w]/count[w[0]], 1/(len(w)-1)) 아이, 아이오, f=4910, s=0.15 f=307, s=0.10 word = ' 아이오아이가 n = len(word) for e in range(2, n+1): w = word[:e] f = count[w] s = cohesion(w) print('{:6}, f={}, s={:.2}'. format(w, f, s)) 아이오아, 아이오아이, f=270, s=0.20 f=270, s=0.30 아이오아이가, f=18, s=0.22 #c 1:4 #c 1 = #c 1:2 #c 1 #c 1:3 #c 1:2 #c 1:4 #c 1:3 단어로선택 20
21 Cohesion (Character n-gram) 단어의점수 (cohesion) 를아래처럼구현해봅니다 def cohesion(w): return pow(count[w]/count[w[0]], 1/(len(w)-1)) 아이, 아이오, f=4910, s=0.15 f=307, s=0.10 word = ' 아이오아이가 n = len(word) for e in range(2, n+1): w = word[:e] f = count[w] s = cohesion(w) print('{:6}, f={}, s={:.2}'. format(w, f, s)) 아이오아, 아이오아이, f=270, s=0.20 f=270, s=0.30 아이오아이가, f=18, s=0.22 #c 1:4 #c 1 = #c 1:2 #c 1 #c 1:3 #c 1:2 #c 1:4 #c 1:3 단어로선택 21
22 Tokenizer 단어를잘인식할수있다면토크나이징도쉽게할수있습니다 토크나이징은여러개의단어로이뤄진문장 / 어절에서단어를구분하는것 띄어쓰기오류정도에따라다른토크나이징전략을사용할수있습니다 22
23 L-Tokenizer 띄어쓰기가잘되어있다면, 어절의왼쪽에서부터 단어의점수가가장큰 subword 를기준으로어절을나눕니다 def ltokenize(w): n = len(w) if n <= 2: return (w, '') tokens = [] for e in range(2, n+1): tokens.append(w[:e], w[e:], cohesion(w[:e])) tokens = sorted(tokens, key=lambda x:-x[2]) return tokens[0][:2] (' 뉴스 ', ' 의 ') (' 기사 ', ' 를 ') (' 이용 ', ' 했던 ') (' 예시 ', ' 입니다 ') sent = 뉴스의기사를이용했던예시입니다 ' for word in sent.split(): print( ltokenize(word) ) 23
24 Max Score Tokenizer 띄어쓰기가잘되어있지않다면아는단어부터잘라내면됩니다 cohesions = {' 파스 ': 0.3, ' 파스타 ': 0.7, ' 좋아요 ': 0.2, ' 좋아 ':0.5} score = lambda x: cohesions.get(x, 0) tokenize(' 파스타가좋아요 ') [(' 파스 ', 0, 2, 0.3), (' 파스타 ', 0, 3, 0.7), (' 스타 ', 1, 3, 0), (' 스타가 ', 1, 4, 0), (' 타가 ', 2, 4, 0), (' 타가좋 ', 2, 5, 0), (' 가좋 ', 3, 5, 0), (' 가좋아 ', 3, 6, 0), (' 좋아 ', 4, 6, 0.5), (' 좋아요 ', 4, 7, 0.2), (' 아요 ', 5, 7, 0)] [(' 파스타 ', 0, 3, 0.7), (' 좋아 ', 4, 6, 0.5), (' 파스 ', 0, 2, 0.3), (' 좋아요 ', 4, 7, 0.2), (' 스타 ', 1, 3, 0), (' 스타가 ', 1, 4, 0), (' 타가 ', 2, 4, 0), (' 타가좋 ', 2, 5, 0), (' 가좋 ', 3, 5, 0), (' 가좋아 ', 3, 6, 0), (' 아요 ', 5, 7, 0)] [(' 파스타 ', 0, 3, 0.7), (' 좋아 ', 4, 6, 0.5), (' 파스 ', 0, 2, 0.3), (' 좋아요 ', 4, 7, 0.2), (' 스타 ', 1, 3, 0), (' 스타가 ', 1, 4, 0), (' 타가 ', 2, 4, 0), (' 타가좋 ', 2, 5, 0), (' 가좋 ', 3, 5, 0), (' 가좋아 ', 3, 6, 0), (' 아요 ', 5, 7, 0)] Subword 별 score 계산 (subword, begin, end, score) Score 기준으로정렬최고점수의단어선택, 위치가겹치는단어제거 24
25 Max Score Tokenizer 띄어쓰기가잘되어있지않다면아는단어부터잘라내면됩니다 cohesions = {' 파스 ': 0.3, ' 파스타 ': 0.7, ' 좋아요 ': 0.2, ' 좋아 ':0.5} score = lambda x: cohesions.get(x, 0) [ 파스타 ] 가좋아요 [ 파스타 ] 가 [ 좋아 ] 요 [(' 파스타 ', 0, 3, 0.7), (' 좋아 ', 4, 6, 0.5), (' 파스 ', 0, 2, 0.3), (' 좋아요 ', 4, 7, 0.2), (' 스타 ', 1, 3, 0), (' 스타가 ', 1, 4, 0), (' 타가 ', 2, 4, 0), (' 타가좋 ', 2, 5, 0), (' 가좋 ', 3, 5, 0), (' 가좋아 ', 3, 6, 0), (' 아요 ', 5, 7, 0)] [(' 파스타 ', 0, 3, 0.7), (' 좋아 ', 4, 6, 0.5), (' 파스 ', 0, 2, 0.3), (' 좋아요 ', 4, 7, 0.2), (' 스타 ', 1, 3, 0), (' 스타가 ', 1, 4, 0), (' 타가 ', 2, 4, 0), (' 타가좋 ', 2, 5, 0), (' 가좋 ', 3, 5, 0), (' 가좋아 ', 3, 6, 0), (' 아요 ', 5, 7, 0)] [ 파스타, 가, 좋아, 요 ] 25
26 Max Score Tokenizer 확실히아는단어라면 scores 에최고점수를줄수있습니다 cohesions = {' 파스 ': 0.3, ' 파스타 ': 0.7, ' 좋아요 ': 0.2, ' 좋아 ':0.5, 아이오아이 :1.0} score = lambda x:cohesions.get(x, 0) 26
27 soynlp Cohesion, Branching Entropy 를포함한, 단어추출에관련된함수들을 github 에구현해두었습니다. from soynlp import DoublespaceLineCorpus from soynlp.word import WordExtractor corpus = DoublespaceLineCorpus(fname, iter_sent=true) word_extractor = WordExtractor(corpus, min_count=10) words = word_extractor.extract() 27
28 soynlp extract() 는단어경계와관련된점수들이계산되어있는 dict를 return 합니다 words = word_extractor.extract() words[ 드라마 '] Scores(cohesion_forward= , cohesion_backward= , left_branching_entropy= , right_branching_entropy= , left_accessor_variety=128, right_accessor_variety=136, leftside_frequency=2375, rightside_frequency=1284) 28
29 soynlp Tokenizer 역시구현되어있습니다 from soynlp.tokenizer import LTokenizer scores = {w:s.cohesion_forward for w, s in words.items()} tokenizer = LTokenizer(scores=scores) tokenizer.tokenize( 뉴스의기사를이용했던예시입니다 ') [ 뉴스, 의, 기사, 를, 이용, 했던, 예시, 입니다 ] 29
30 soynlp 사전이없이도데이터기반으로토크나이저를학습하면잘작동합니다 현재분석중인데이터에해당알고리즘을적용한예시입니다 from soynlp.tokenizer import MaxScoreTokenizer scores = {w:s.cohesion_forward for w, s in words.items()} tokenizer = MaxScoreTokenizer(scores=scores) tokenizer.tokenize( 맛있는짜파게티파스타일식초밥소바김볶다먹고싶어라일단김밥천국으로고고 ') [' 맛있 ', ' 는 ', ' 짜파게티 ', ' 파스타 ', ' 일식 ', ' 초밥 ', ' 소바 ', ' 김볶 ', ' 다 ', ' 먹고 ', ' 싶어 ', ' 라 ', ' 일단 ', ' 김밥천국 ', ' 으로 ', ' 고고 '] 30
31 명사추출 31
32 명사 지금까지분석할데이터를기반으로, 그데이터에서사용되는 단어를추출하는방법을이야기했습니다 이번에는 { 파스타, 좋아 } 와같은단어에서 파스타 라는명사만선택하는 방법을알아봅니다 32
33 A 는명사일까? 어제 A 라는가게에가봤어 A 에서보자 A 로와줘 명사우측에등장하는글자분포를이용하여 A 가명사임을유추할수있다 33
34 L R graph 어절은 L + [R] 구조로나눌수있습니다 발표 + 를 하 + 면서 데이터에서모든어절들을두개의 subwords 로나눈뒤연결하면 L R graph 를만들수있습니다 34
35 L R graph L 드라마 frequency ( 드라마 를 ) 를 R 파이콘 의 발표 로 파이 에서 콘에서 시작했 지마 먹 었어 고서 달리 35
36 L R graph 드라마파이콘발표파이 를의로에서 명사들의오른쪽에는 콘에서 시작했지마조사들이주로연결되어있습니다 었어먹고서달리 36
37 L R graph 드라마 동사 / 형용사들의오른쪽에는 를어미들이파이콘주로연결되어있습니다의 발표파이 시작했먹달리 로에서콘에서 지마었어고서 37
38 L R graph 드라마 L 이제대로된단어가아니면 를오른쪽에도파이콘조사 / 어미가아닌 R이연결됩니다의 발표파이 시작했먹달리 로에서콘에서 지마었어고서 38
39 Noun Extraction L R graph 를만들면명사가눈에보입니다 lrgraph = defaultdict(lambda: defaultdict(lambda: 0)) for doc in docs: for w in doc.split(): n = len(w) for e in range(1, n+1): lrgraph[ w[ :e] ][ w[e: ] ] += 1 def get_r(l): return sorted( lrgraph[l].items(), key=lambda x:-x[1]) get_r( 드라마 ) [('', 1268), (' 를 ', 164), (' 다 ', 152), (' 의 ', 140), (' 로 ', 138), (' 에서 ', 98), (' 와 ', 62), (' 는 ', 55), (' 에 ', 55), (' 가 ', 48), (' 이다 ', 24), (' 인 ', 14), ] 39
40 Noun Extraction L R graph: [ 명사 + 조사 ], [ 동사 + 어미 ], [ 틀린단어 + 틀린단어 ] get_r( 드라마 ') get_r(' 시작했 ') get_r(' 드라 ') [('', 1268), [(' 다 ', 567), [(' 마 ', 1268), (' 를 ', 164), (' 고 ', 73), (' 마를 ', 164), (' 다 ', 152), (' 다고 ', 61), (' 마다 ', 152), (' 의 ', 140), (' 습니다 ', 42), (' 마의 ', 140), (' 로 ', 138), (' 는데 ', 26), (' 마로 ', 138), (' 에서 ', 98), (' 으며 ', 16), (' 마에서 ', 98), (' 와 ', 62), (' 지만 ', 15), (' 기 ', 65), (' 는 ', 55), (' 던 ', 12), (' 마와 ', 62), (' 에 ', 55), (' 어요 ', 10), (' 마는 ', 55), (' 가 ', 48), (' 다는 ', 7), (' 마에 ', 55), (' 이다 ', 24), (' 으나 ', 5), (' 마가 ', 48), (' 인 ', 14), (' 죠 ', 4), (' 이브 ', 28), ] ] ] 40
41 Noun Extraction L R graph: [ 명사 + 조사 ], [ 동사 + 어미 ], [ 틀린단어 + 틀린단어 ] get_r(' 드라마 ') get_r(' 시작했 ') get_r(' 드라 ') [('', 1268), [(' 다 ', 567), [(' 마 ', 1268), (' 를 ', 164), (' 고 ', 73), (' 마를 ', 164), (' 다 ', 152), (' 다고 ', 61), (' 마다 ', 152), (' 의 ', 140), (' 습니다 ', 42), (' 마의 ', 140), (' 로 ', 138), (' 는데 ', 26), (' 마로 ', 138), (' 에서 ', 98), (' 으며 ', 16), (' 마에서 ', 98), (' 와 ', 62), (' 지만 ', 15), (' 기 ', 65), (' 는 ', 55), (' 던 ', 12), (' 마와 ', 62), (' 에 ', 55), (' 어요 ', 10), (' 마는 ', 55), (' 가 ', 48), (' 다는 ', 7), (' 마에 ', 55), (' 이다 ', 24), (' 으나 ', 5), (' 마가 ', 48), (' 인 ', 14), (' 죠 ', 4), (' 이브 ', 28), ] ] ] 41
42 Noun Extraction L R graph: [ 명사 + 조사 ], [ 동사 + 어미 ], [ 틀린단어 + 틀린단어 ] get_r(' 드라마 ') get_r(' 시작했 ') get_r(' 드라 ') [('', 1268), [(' 다 ', 567), [(' 마 ', 1268), (' 를 ', 164), (' 고 ', 73), (' 마를 ', 164), (' 다 ', 152), (' 다고 ', 61), (' 마다 ', 152), (' 의 ', 140), (' 습니다 ', 42), (' 마의 ', 140), (' 로 ', 138), (' 는데 ', 26), (' 마로 ', 138), (' 에서 ', 98), (' 으며 ', 16), (' 마에서 ', 98), (' 와 ', 62), (' 지만 ', 15), (' 기 ', 65), (' 는 ', 55), (' 던 ', 12), (' 마와 ', 62), (' 에 ', 55), (' 어요 ', 10), (' 마는 ', 55), (' 가 ', 48), (' 다는 ', 7), (' 마에 ', 55), (' 이다 ', 24), (' 으나 ', 5), (' 마가 ', 48), (' 인 ', 14), (' 죠 ', 4), (' 이브 ', 28), ] ] ] 42
43 Noun Extraction R 의분포를이용하여 L 의명사점수를계산할수있습니다 r_scores = {' 은 ': 0.5, 었다 ': -0.9, } def noun_score(l): (norm, score, _total) = (0, 0, 0) for R, frequency in get_r(l): _total += frequency if not R in r_scores: continue norm += frequency score += frequency * r_scores[r] score = score / norm if norm else 0 prop = norm / _total if _total else 0 return score, prop S L l = f l, r S R(r) r L R f(l, r) 드라마 를 (164) 다 (152) 의 (140) 로 (138) 에서 (98) 와 (62) 43
44 Noun Extraction R 의분포를이용하여 L 의명사점수를계산할수있습니다 ( 명사점수, 알려진 R 비율 ) = noun_score( Word ) noun_score(' 드라마 ) (0.574, 0.921) noun_score( 시작했 ) (-0.976, 0.999) noun_score( 드라 ) (-0.661, 0.579) 틀린단어뒤에는조사 / 어미들이아닌글자들이등장 44
45 Noun Extraction R 점수는세종말뭉치를이용하여계산합니다 세종말뭉치의품사가태깅된정보로부터 L R 구조의테이블을만듭니다... 예술가의예술가 /NNG+ 의 /JKG 113 예술가는예술가 /NNG+ 는 /JX 45 예술가가예술가 /NNG+ 가 /JKS 43 예술가들의예술가 /NNG+ 들 /XSN+ 의 /JKG 단어품사명사동사 단어 / R - 는 - 의 - 고 - 었다 -었던 예술가 먹
46 Noun Extraction 명사의빈도를고려하여 R 앞에명사가등장할점수를계산합니다 품사명사명사동사형용사 단어 / R - 는 - 의 - 고 - 었다 -구나 예술가 나이 들 춥 품사빈도수 ( 비율 ) 명사 704,197 (0.838) 품사빈도수보정빈도수점수 명사 ^ 명사 136,598 (0.162) ^명사 = 20 * (0.838/0.162) = ( ) / ( ) 46
47 soynlp 후처리과정이추가된명사추출기를구현하였습니다 from soynlp.noun import LRNounExtractor noun_extractor = LRNounExtractor(min_count=50) nouns = noun_extractor.train_extract(corpus, minimum_noun_score=0.5) nouns[ 설입 ] NounScore(frequency=67, score=0.926, known_r_ratio=0.529) nouns[ 드라마 ] NounScore(frequency=4976, score=0.522, known_r_ratio=0.601) 47
48 KoNLPy + 사용자사전 48
49 사용자사전 + 템플릿매칭을이용한토크나이징 / 품사판별 명사 / 단어에대해서사용자사전을만든다면, 내가임의의템플릿을 만들어서템플릿매칭으로아는단어들을처리할수도있습니다 custom_dictionary = {'Noun': [ 파이콘 ', ' 엔엘피 ', ' 아이오아이 ', ' 너무너무너무 ']} templates = [('Noun', 'Noun'), ('Noun', 'Josa'), ('Noun', 'Noun', Josa')] 49
50 사용자사전 + 템플릿매칭을이용한토크나이징 / 품사판별 custom_dictionary = {'Noun': [' 파이콘 ', ' 엔엘피 ', ' 아이오아이 ', ' 너무너무너무 ']} templates = [('Noun', 'Noun'), ('Noun', 'Josa'), ('Noun', 'Noun', Josa')] [ 파이콘 ][ 에서 ] [ 엔엘피 ][ 이야기 ][ 를 ] 합시다 (Noun, Josa) (Noun, Noun, Josa) Unknown KoNLPy 에넘기자 * 빨간색은사용자에의하여추가된사전에서매칭 * 파란색은 KoNLPy 의트위터분석기에포함되어있는사전에서매칭 50
51 사용자사전 + 템플릿매칭을이용한토크나이징 / 품사판별 customized_konlpy 에사전 / 템플릿추가를쉽게할수있도록 KoNLPy 를 래핑해두었습니다 from ckonlpy.tag import Twitter tagger = Twitter() tagger.add_dictionary([' 파이콘 ', ' 엔엘피 ', ' 아이오아이 ', ' 너무너무너무 '], 'Noun') tagger.pos(' 파이콘에서엔엘피이야기를합시다 ') tagger.pos(' 너무너무너무는아이오아이의노래에요 ') [(' 파이콘 ', 'Noun'), (' 에서 ', Josa'), (' 엔엘피 ', 'Noun'), (' 이야기 ', 'Noun'), (' 를 ', 'Josa'), (' 합 ', 'Verb'), (' 시 ', 'PreEomi'), (' 다 ', 'Eomi')] [(' 너무너무너무 ', 'Noun'), (' 는 ', 'Josa'), (' 아이오아이 ', 'Noun'), (' 의 ', 'Josa'), (' 노래 ', 'Noun'), (' 에요 ', 'Josa')] 51
52 정리 데이터기반으로스스로단어 / 명사를추출하고, 이를그대로이용하거나 KoNLPy 와결합하여텍스트를처리하는방법에대하여이야기하였습니다 아직도좀더좋은단어 / 명사추출기와토크나이저를연구하고있습니다 조금더편한데이터분석을, 분석준비가아닌분석에더많이집중하는데 도움이되었으면좋겠습니다 52
PowerPoint 프레젠테이션
파이썬을이용한빅데이터수집. 분석과시각화 Part 2. 데이터시각화 이원하 목 차 1 2 3 4 WordCloud 자연어처리 Matplotlib 그래프 Folium 지도시각화 Seabean - Heatmap 03 07 16 21 1 WORDCLOUD - 자연어처리 KoNLPy 형태소기반자연어처리 http://www.oracle.com/technetwork/java/javase/downloads/index.html
More information이보고서는 2010 년한국언론진흥재단의언론진흥기금을지원받아수행한것입니다. 보고서의내용은한국언론진흥재단의공식견해가아닌연구자의연구결과임을밝힙니다. 목 차 요약문 ⅳ Ⅰ. 서론 1 5 6 7 7 11 13 14 14 16 18 21 29 40-1 - 47 47 48 66 68 69 70 70 71 72 72 73 74-2 - < 표 > 목차 표 1 대한매일신보보급부수
More information<C5D8BDBAC6AEBEF0BEEEC7D02D3336C1FD2E687770>
텍스트언어학 36, 2014, pp. 149~177 빅데이터 적정 텍스트 추출을 위한 언어학적 접근 - 학교폭력 관련 텍스트를 중심으로- 남길임(경북대) 송현주(계명대) 이수진(경북대) Nam, Kilim, Song, Hyunju, Lee, Soojin 2014. Linguistic approach for Document Classification on Big
More information제5장 형태소분석
제 5 장형태소분석 형태소분석 형태소의정의 의미가있는최소의단위 (minimally meaningful unit) 문법적, 관계적인뜻을나타내는단어또는단어의부분 형태소분석 단어 ( 또는어절 ) 를구성하는각형태소분리 분리된형태소의기본형및품사정보추출 2 형태소분석과정 형태소분석과정 분석후보생성 문법규칙에맞는후보생성 형태소분리와기본형추정 분석후보로부터옳은결과선택 형태소끼리의결합제약조건만족
More informationC:/Users/Kuk/Documents/Laboratory/TR/ tr(a)/TR ¾ç½Ä.dvi
Python 환경에서한글형태소분석기패키지 KoNLPy 사용법 Guide of KoNLPy for Korean Morpheme Analyzer with Python 박보국 부산대학교전자전기컴퓨터공학과 limited10@pusan.ac.kr Abstract Python은자연언어처리에서굉장히인기있는언어중하나다. Python에는 NLTK(The Natural Language
More informationfl 2
1 fl 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69
More information1
1 2 3 4 5 6 b b t P A S M T U s 7 m P P 8 t P A S M T U s 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 Chapter 1 29 1 2 3 4 18 17 16 15 5 6 7 8 9 14 13 12 11 10 1 2 3 4 5 9 10 11 12 13 14 15
More information단순 베이즈 분류기
단순베이즈분류기 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 단순베이즈분류기 1 / 14 학습내용 단순베이즈분류 구현 예제 박창이 ( 서울시립대학교통계학과 ) 단순베이즈분류기 2 / 14 단순베이즈분류 I 입력변수의값이 x = (x 1,..., x p ) 로주어졌을때 Y = k일사후확률 P(Y = k X 1 = x 1,..., X p =
More information1
2/33 3/33 4/33 5/33 6/33 7/33 8/33 9/33 10/33 11/33 12/33 13/33 14/33 15/33 16/33 17/33 5) 입력을 다 했으면 확인 버튼을 클릭합니다. 6) 시작 페이지가 제대로 설정이 되었는지 살펴볼까요. 익스플로러를 종료하고 다시 실행시켜 보세요. 시작화면에 야후! 코리아 화면이 뜬다면 설정 완료..^^
More informationPART 8 12 16 21 25 28
PART 8 12 16 21 25 28 PART 34 38 43 46 51 55 60 64 PART 70 75 79 84 89 94 99 104 PART 110 115 120 124 129 134 139 144 PART 150 155 159 PART 8 1 9 10 11 12 2 13 14 15 16 3 17 18 19 20 21 4 22 23 24 25 5
More information자연언어처리
제 7 장파싱 파싱의개요 파싱 (Parsing) 입력문장의구조를분석하는과정 문법 (grammar) 언어에서허용되는문장의구조를정의하는체계 파싱기법 (parsing techniques) 문장의구조를문법에따라분석하는과정 차트파싱 (Chart Parsing) 2 문장의구조와트리 문장 : John ate the apple. Tree Representation List
More informationBY-FDP-4-70.hwp
RS-232, RS485 FND Display Module BY-FDP-4-70-XX (Rev 1.0) - 1 - 1. 개요. 본 Display Module은 RS-232, RS-485 겸용입니다. Power : DC24V, DC12V( 주문사양). Max Current : 0.6A 숫자크기 : 58mm(FND Size : 70x47mm 4 개) RS-232,
More informationView Licenses and Services (customer)
빠른 빠른 시작: 시작: 라이선스, 라이선스, 서비스 서비스 및 주문 주문 이력 이력 보기 보기 고객 가이드 Microsoft 비즈니스 센터의 라이선스, 서비스 및 혜택 섹션을 통해 라이선스, 온라인 서비스, 구매 기록 (주문 기록)을 볼 수 있습니다. 시작하려면, 비즈니스 센터에 로그인하여 상단 메뉴에서 재고를 선택한 후 내 재고 관리를 선택하십시오. 목차
More information8장 문자열
8 장문자열 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 8 장문자열 1 / 24 학습내용 문자열 (string) 훑기 (traversal) 부분추출 (slicing) print 함수불변성 (immutablity) 검색 (search) 세기 (count) Method in 연산자비교 박창이 ( 서울시립대학교통계학과 ) 8 장문자열 2 /
More information지도상 유의점 m 학생들이 어려워하는 낱말이 있으므로 자세히 설명해주도록 한다. m 버튼을 무리하게 조작하면 고장이 날 위험이 있으므로 수업 시작 부분에서 주의를 준다. m 활동지를 보고 어려워하는 학생에게는 영상자료를 접속하도록 안내한다. 평가 평가 유형 자기 평가
수업주제 경찰 출동! (버튼, LED, 버저 사용하기) 9 / 12 차시 수업의 주제와 목표 본 수업에서는 이전 차시에 배웠던 블록들의 기능을 복합적으로 활용한다. 스위치 기능을 가진 버튼을 활용하여 LED와 버저를 동시에 작동시키도록 한다. 각 블록들을 함께 사용하는 프로젝트를 통해 각각의 기능을 익히고 보다 다양한 활용 방법을 구상할 수 있다. 교수 학습
More informationMicrosoft PowerPoint - chap04-연산자.pptx
int num; printf( Please enter an integer: "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num = %d\n", num); } 1 학습목표 수식의 개념과 연산자, 피연산자에 대해서 알아본다. C의 를 알아본다. 연산자의 우선 순위와 결합 방향에
More information프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음
프로그래밍개론및실습 2015 년 2 학기프로그래밍개론및실습과목으로본내용은강의교재인생능출판사, 두근두근 C 언어수업, 천인국지음을발췌수정하였음 CHAPTER 9 둘중하나선택하기 관계연산자 두개의피연산자를비교하는연산자 결과값은참 (1) 아니면거짓 (0) x == y x 와 y 의값이같은지비교한다. 관계연산자 연산자 의미 x == y x와 y가같은가? x!= y
More information윙윙_포트폴리오_3
TOBIGS TEAM PROJECT 감성분석을통한키워드기반대한민국정치흐름파악 2017.07.15 구혜인김서연연다인허능호 INDEX 주제선정배경 데이터수집및전처리 데이터분석 결론및제언 1 주제선정배경 1 주제선정배경 데이터 수집 데이터수집 2 1) 신문사수집기준 전국신문사발행부수순위와네이버의뉴스스탠드목록을바탕으로총 8 개의신문사를선정하였다. à 조선일보, 동아일보,
More information정부3.0 국민디자인단 운영을 통해 국민과의 소통과 참여로 정책을 함께 만들 수 있었고 그 결과 국민 눈높이에 맞는 다양한 정책 개선안을 도출하며 정책의 완성도를 제고할 수 있었습니다. 또한 서비스디자인 방법론을 각 기관별 정부3.0 과제에 적용하여 국민 관점의 서비스 설계, 정책고객 확대 등 공직사회에 큰 반향을 유도하여 공무원의 일하는 방식을 변화시키고
More information아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상
Android 용 Brother Image Viewer 설명서 버전 0 KOR 아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상표입니다. Android는
More information강창훈
51 4. 2 4?? 1 3B 1 1 3 1 1?? C 3? /3 A 23 C 3? /3 A 23 C 3? /3 A 23 1 2 3 3 1 1 3 1 C 3? A3 /3 A 23.1? A3 /3 A 23. / / 23? / / 1.1 Microsoft Bot Framework? 마이크로소프트사의소프트웨어기반봇개발프레임워크. Bot Framework 는강력하고인텔리전트한봇을구축하고연결하며테스트,
More information<32332D322D303120B9E6BFB5BCAE20C0CCB5BFC1D6312D32302E687770>
방 영 석 이 동 주 최근 들어 소셜커머스가 차세대 전자상거래 모형으로 부상하고 있다 년 국내에 첫 등장한 이래 소셜커머스 시장 규모는 년 조 원에 달했고 년 조 원을 넘어섰다 온라인 쇼핑몰 혹은 이마켓플레이스 등으로 대표되는 기존의 전 자상거래 모형은 일반적으로 판매자가 상품 가격 과 거래 형태를 제안하고 구매자가 해당 거래를 선택적으로 수용하는 일방향 모형의
More information741034.hwp
iv v vi vii viii ix x xi 61 62 63 64 에 피 소 드 2 시도 임금은 곧 신하들을 불러모아 나라 일을 맡기고 이집트로 갔습니다. 하 산을 만난 임금은 그 동안 있었던 일을 말했어요. 원하시는 대로 일곱 번째 다이아몬드 아가씨를
More informationWeb Scraper in 30 Minutes 강철
Web Scraper in 30 Minutes 강철 발표자 소개 KAIST 전산학과 2015년부터 G사에서 일합니다. 에서 대한민국 정치의 모든 것을 개발하고 있습니다. 목표 웹 스크래퍼를 프레임웍 없이 처음부터 작성해 본다. 목표 웹 스크래퍼를 프레임웍 없이 처음부터 작성해 본다. 스크래퍼/크롤러의 작동 원리를 이해한다. 목표
More informationPHP & ASP
단어장프로젝트 프로젝트2 단어장 select * from address where address like '% 경기도 %' td,li,input{font-size:9pt}
More information국내외 장애인 텔레비전 방송 현황 연구
응답비율(%) 5 4 3 2 5 4 3 2 1 1 0 20 40 60 80 100 응답비율(%) 교육 10 교양 오락 스포츠 드라마 30 50 50 70 교육 교양 오락 스포츠 드라마 뉴스 뉴스 95 0 20 40 60 80 100 응답비율(%) 교육 5 교양 오락 스포츠 드라마 10 50 60 80 교육 교양 오락 스포츠 드라마 뉴스 뉴스 95 0 20 40
More informationLet G = (V, E) be a connected, undirected graph with a real-valued weight function w defined on E. Let A be a set of E, possibly empty, that is includ
알고리즘설계와분석 (CSE3081(2 반 )) 기말고사 (2016년 12월15일 ( 목 ) 오전 9시40분 ~) 담당교수 : 서강대학교컴퓨터공학과임인성 < 주의 > 답안지에답을쓴후제출할것. 만약공간이부족하면답안지의뒷면을이용하고, 반드시답을쓰는칸에어느쪽의뒷면에답을기술하였는지명시할것. 연습지는수거하지않음. function MakeSet(x) { x.parent
More information<30352DC0CCC7F6C8F1343628B1B3292DBFACB1B8BCD2B1B3C1A42E687770>
한국학연구 46(2013.9.30), pp.125-165 고려대학교 한국학연구소 어휘 차원에서의 강조 실현 방식과 그 특징 1)이현희 * 국문초록 이 논문에서는 사전 뜻풀이에 강조 를 포함하는 표제어들을 중심으로 어휘 차원에서 나타나는 강조 표현의 유형과 기능, 특징 등을 살펴보았 다. 을 기준으로 뜻풀이에 강조 를 포함하는 표제어는 200여
More information<B3EDB9AEC0DBBCBAB9FD2E687770>
(1) 주제 의식의 원칙 논문은 주제 의식이 잘 드러나야 한다. 주제 의식은 논문을 쓰는 사람의 의도나 글의 목적 과 밀접한 관련이 있다. (2) 협력의 원칙 독자는 필자를 이해하려고 마음먹은 사람이다. 따라서 필자는 독자가 이해할 수 있는 말이 나 표현을 사용하여 독자의 노력에 협력해야 한다는 것이다. (3) 논리적 엄격성의 원칙 감정이나 독단적인 선언이
More information1809_2018-BESPINGLOBAL_Design Guidelines_out
베스핀글로벌 디자인 가이드라인 베스핀글로벌은 경험과 기술을 바탕으로 고객에게 신뢰를 주는 기업이기를 지향합니다. 모든 서비스와 소통채널에서 우리의 가치를 일관되게 표현하도록 합니다. SIGNATURE SIGNATURE + SLGAN SIGNATURE [CHINA] SIGNATURE + SYMBL 2018년 1.ver 베스핀글로벌 디자인 가이드라인 디자인 가이드라인을
More informationBig Data Analysis Using RHINO
Big Data Analysis using RHINO ICEC 2016 HoF-02 Aug. 19(Fri.) 14:00-15:30 Sukjae Choi Research Professor, Humanitas Big Data Research Center 목차 형태소분석 3 RHINO 특징 13 RHINO 이용 18 부록 : Java, Eclipse, R, R Studio
More informationC++ Programming
C++ Programming 예외처리 Seo, Doo-okok clickseo@gmail.com http://www.clickseo.com 목 차 예외처리 2 예외처리 예외처리 C++ 의예외처리 예외클래스와객체 3 예외처리 예외를처리하지않는프로그램 int main() int a, b; cout > a >> b; cout
More information게시판 스팸 실시간 차단 시스템
오픈 API 2014. 11-1 - 목 차 1. 스팸지수측정요청프로토콜 3 1.1 스팸지수측정요청프로토콜개요 3 1.2 스팸지수측정요청방법 3 2. 게시판스팸차단도구오픈 API 활용 5 2.1 PHP 5 2.1.1 차단도구오픈 API 적용방법 5 2.1.2 차단도구오픈 API 스팸지수측정요청 5 2.1.3 차단도구오픈 API 스팸지수측정결과값 5 2.2 JSP
More information2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관
2015 개정교육과정에따른정보과평가기준개발연구 연구책임자 공동연구자 연구협력관 2015 개정교육과정에따른정보과평가기준개발연구 연구협력진 머리말 연구요약 차례 Ⅰ 서론 1 Ⅱ 평가준거성취기준, 평가기준, 성취수준, 예시평가도구개발방향 7 Ⅲ 정보과평가준거성취기준, 평가기준, 성취수준, 예시평가도구의개발 25 Ⅳ 정보과평가준거성취기준, 평가기준, 성취수준, 예시평가도구의활용방안
More informationC 언어 프로그래밊 과제 풀이
과제풀이 (1) 홀수 / 짝수판정 (1) /* 20094123 홍길동 20100324 */ /* even_or_odd.c */ /* 정수를입력받아홀수인지짝수인지판정하는프로그램 */ int number; printf(" 정수를입력하시오 => "); scanf("%d", &number); 확인 주석문 가필요한이유 printf 와 scanf 쌍
More information도약종합 강의목표 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 점향상시킵니다. 강의대상다음과같은분들에게가장적합합니다. -현재토익점수 500점에서 600점대이신분들에게가장좋습니다. -정기토익을 2-3번본적이있으신분
도약종합 -토익 700점이상의점수를목표로합니다. -토익점수 500점정도의학생들이 6주동안의수업으로 100-200점향상시킵니다. -정기토익을 2-3번본적이있으신분. -수업도많이들어봤고, 문제도많이풀었지만문법정리가제대로되지않은분. 강의특징수업시간에토익과관련없는사적인잡담으로시간낭비하지않는수업입니다. LC : 파트별집중정리한문제풀이로유형을익혀나가는수업입니다. RC
More information2015 경제ㆍ재정수첩
Contents 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Part 01 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 Part 02 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62
More informationJava ...
컴퓨터언어 1 Java 제어문 조성일 조건문 : if, switch 어떠한조건을조사하여각기다른명령을실행 if 문, switch 문 if 문 if - else 문형식 if 문형식 if ( 조건식 ) { 명령문 1; 명령문 2;... if ( 조건식 ) { 명령문 1; 명령문 2;... else { 명령문 a; 명령문 b;... 예제 1 정수를입력받아짝수와홀수를판별하는프로그램을작성하시오.
More information750 1,500 35
data@opensurvey.co.kr 750 1,500 35 Contents Part 1. Part 2. 1. 2. 3. , 1.,, 2. skip 1 ( ) : 2 ( ) : 10~40 (, PC, ) 1 : 70 2 : 560 1 : 2015. 8. 25~26 2 : 2015. 9. 1 4 10~40 (, PC, ) 500 50.0 50.0 14.3 28.6
More information중간고사
중간고사 예제 1 사용자로부터받은두개의숫자 x, y 중에서큰수를찾는알고리즘을의사코드로작성하시오. Step 1: Input x, y Step 2: if (x > y) then MAX
More information2002년 2학기 자료구조
자료구조 (Data Structures) Chapter 1 Basic Concepts Overview : Data (1) Data vs Information (2) Data Linear list( 선형리스트 ) - Sequential list : - Linked list : Nonlinear list( 비선형리스트 ) - Tree : - Graph : (3)
More informationNLTK 6: 텍스트 분류 학습 (` `%%%`#`&12_`__~~~ౡ氀猀攀)
nltk.org/book/ch06.html gender_features word last_letter word[-1] word >>> def gender_features(word):... return { last_letter : word[-1]} >>> gender_features( Shrek ) { last_letter : k } nltk.corpus.names
More informationDIY 챗봇 - LangCon
without Chatbot Builder & Deep Learning bage79@gmail.com Chatbot Builder (=Dialogue Manager),. We need different chatbot builders for various chatbot services. Chatbot builders can t call some external
More informationMicrosoft PowerPoint - MonthlyInsighT-2018_9월%20v1[1]
* 넋두리 * 저는주식을잘한다고생각합니다. 정확하게는주식감각이있다는것이맞겠죠? 예전에애널리스트가개인주식을할수있었을때수익률은엄청났었습니다 @^^@. IT 먼쓸리가 4주년이되었습니다. 2014년 9월부터시작하였으니지난달로만 4년이되었습니다. 4년간누적수익률이최선호주는 +116.0%, 차선호주는 -29.9% 입니다. 롱-숏으로계산하면 +145.9% 이니나쁘지않은숫자입니다.
More informationMicrosoft PowerPoint - Java7.pptx
HPC & OT Lab. 1 HPC & OT Lab. 2 실습 7 주차 Jin-Ho, Jang M.S. Hanyang Univ. HPC&OT Lab. jinhoyo@nate.com HPC & OT Lab. 3 Component Structure 객체 (object) 생성개념을이해한다. 외부클래스에대한접근방법을이해한다. 접근제어자 (public & private)
More information기술통계
기술통계 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 기술통계 1 / 17 친구수에대한히스토그램 I from matplotlib import pyplot as plt from collections import Counter num_friends = [100,49,41,40,25,21,21,19,19,18,18,16, 15,15,15,15,14,14,13,13,13,13,12,
More informationRNN & NLP Application
RNN & NLP Application 강원대학교 IT 대학 이창기 차례 RNN NLP application Recurrent Neural Network Recurrent property dynamical system over time Bidirectional RNN Exploit future context as well as past Long Short-Term
More information오빠두엑셀 E-Book [VBA 1-7] VBA Method 란무엇인가 >> VBA 개체 Method ( 함수 ) Copyright 2018 by 오빠두 0
>> VBA 개체 Method ( 함수 ) Copyright 2018 by 오빠두 0 1. VBA 에서 Method( 함수 ) 란무엇인가? VBA 기초강의잘따라오고계시나요? 이전강의까지개체 (Object) 를자동차에, 속성 (Property) 을자동차의속성에비유하였습니다. 그럼함수 (Method) 는무엇일까요? 개체 (Object:= 자동차 ) 가무엇인지속성
More informationMicrosoft PowerPoint - chap05-제어문.pptx
int num; printf( Please enter an integer: "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num = %d\n", num); 1 학습목표 제어문인,, 분기문에 대해 알아본다. 인 if와 switch의 사용 방법과 사용시 주의사항에 대해 알아본다.
More information4. #include <stdio.h> #include <stdlib.h> int main() { functiona(); } void functiona() { printf("hihi\n"); } warning: conflicting types for functiona
이름 : 학번 : A. True or False: 각각항목마다 True 인지 False 인지적으세요. 1. (Python:) randint 함수를사용하려면, random 모듈을 import 해야한다. 2. (Python:) '' (single quote) 는한글자를표현할때, (double quote) 는문자열을표현할때사용한다. B. 다음에러를수정하는방법을적으세요.
More information슬라이드 1
기초 PYTHON 프로그래밍 14. 함수 - 1 1. 함수 2. 파이썬내장함수 3. 사용자정의함수 4. 함수의인수와반환값 5. 함수의위치와 main 작성하기 1. 함수 블랙박스 (black box) 함수는입력과출력을갖는 black box이다. 주어진입력에대해서어떤과정을거쳐출력이나오는지가숨겨져있다. >>> print('hello world') Hello world
More informationSIGPLwinterschool2012
1994 1992 2001 2008 2002 Semantics Engineering with PLT Redex Matthias Felleisen, Robert Bruce Findler and Matthew Flatt 2009 Text David A. Schmidt EXPRESSION E ::= N ( E1 O E2 ) OPERATOR O ::=
More information?
01 02 03 04 05 01 02 03 01 02 03 01 02 PART 8 9 10 11 PART 12 14 15 16 17 18 19 20 21 22 23 24 25 PART 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 ppm 50 51 PART 52 54 55 56 57 58
More informationPowerPoint 프레젠테이션
Translation Song 1 Finger Family 한글 해석 p.3 아빠 손가락, 아빠 손가락. p.4 p.5 엄마 손가락, 엄마 손가락. p.6 p.7 오빠 손가락, 오빠 손가락. p.8 p.9 언니 손가락, 언니 손가락. p.10 p.11 아기 손가락, 아기 손가락. p.12 p.13 p.14-15 재미있게 부르기 (Sing and Play Time)
More informationMicrosoft PowerPoint - gnu-w06-python_[실습]_day13-turtle-shape
DAY 13 거북이그래픽응용하기 모두의파이썬 20 일만에배우는프로그래밍기초 거북이그래픽응용하기 01 자주사용하는거북이그래픽명령어 02 03 키보드로거북이를조종해서그림그리기 마우스로거북이를조종해서그림그리기 2 1. 자주사용하는거북이그래픽명령어 자주사용하는거북이그래픽명령어 2 함수설명사용예 pos( ) / position( ) xcor( ), ycor( ) goto(x,
More informationSecure Programming Lecture1 : Introduction
Malware and Vulnerability Analysis Lecture1 Malware Analysis #1 Agenda 악성코드정적분석 악성코드분석 악성코드정적분석 정적분석 임의의코드또는응용프로그램을실행하지않고분석 ASCII 문자열 (ex. URL) API 리스트 Packing VT 기타등등 정적분석 : 파일식별 악성으로의심되는파일의형태식별 file
More information강의계획서 과목 : JUN s TOEIC 700+( 도약 ) 2017년 3차강사 : 황준선 교재 : ETS 토익기본서 (RC&LC)+ 수업부교재 (JUN s TOEIC 700+) + 품사별추가문제 +Mini Test 수업목표 : LC & RC 필수기본전략수립및 GRAM
강의계획서 과목 : JUN s TOEIC 700+( 도약 / 단과 ) 2017년 3차강사 : 황준선 교재 : ETS 토익기본서 (RC)+ 수업부교재 (JUN s Toeic 700+)+ 추가문제 + 품사별추가문제 수업목표 : 총체적문장구조의이해 & 확립을통한품사 + 어휘유형 100% 정답및 Part 7 Key Word Location 훈련을통한 350+ 목표
More informationAPI STORE 키발급및 API 사용가이드 Document Information 문서명 : API STORE 언어별 Client 사용가이드작성자 : 작성일 : 업무영역 : 버전 : 1 st Draft. 서브시스템 : 문서번호 : 단계 : Docum
API STORE 키발급및 API 사용가이드 Document Information 문서명 : API STORE 언어별 Client 사용가이드작성자 : 작성일 : 2012.11.23 업무영역 : 버전 : 1 st Draft. 서브시스템 : 문서번호 : 단계 : Document Distribution Copy Number Name(Role, Title) Date
More informationKMC.xlsm
제 7 장. /S 에필요한내용 1] IGBT 취급시주의사항 ) IGBT 취급시주의 1) 운반도중에는 Carbon Cross로 G-E를단락시킵니다. 2) 정전기가발생할수있으므로손으로 G-E 및주단자를만지지마십시요. 3) G-E 단자를개방시킨상태에서직류전원을인가하지마십시요. (IGBT 파손됨 ) 4) IGBT 조립시에는사용기기나인체를접지시키십시요. G2 E2 E1
More information<443A5C4C C4B48555C B3E25C32C7D0B1E25CBCB3B0E8C7C1B7CEC1A7C6AE425CBED0C3E0C7C1B7CEB1D7B7A55C D616E2E637070>
#include "stdafx.h" #include "Huffman.h" 1 /* 비트의부분을뽑아내는함수 */ unsigned HF::bits(unsigned x, int k, int j) return (x >> k) & ~(~0
More information¼øâÁö¿ª°úÇÐÀÚ¿ø
13 1. 객사(전라북도 유형문화재 제48호) 객사는 영조 35년(1759년)에 지어진 조선 후기의 관청 건물입니다. 원래는 가운데의 정당을 중심으로 왼쪽에 동대청, 오른쪽에 서대청, 앞쪽에 중문과 외문 그리고 옆쪽에 무랑 등으로 이 루어져 있었으나, 지금은 정당과 동대청만이 남아있습니다. 정당에서는 전하 만만세 라고 새 긴 궐패를 모시고 매월 초하루와 보름날,
More informationR을 이용한 텍스트 감정분석
R Data Analyst / ( ) / kim@mindscale.kr (kim@mindscale.kr) / ( ) ( ) Analytic Director R ( ) / / 3/45 4/45 R? 1. : / 2. : ggplot2 / Web 3. : slidify 4. : 5. Matlab / Python -> R Interactive Plots. 5/45
More information확률 및 분포
확률및분포 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 확률및분포 1 / 15 학습내용 조건부확률막대그래프히스토그램선그래프산점도참고 박창이 ( 서울시립대학교통계학과 ) 확률및분포 2 / 15 조건부확률 I 첫째가딸일때두아이모두딸일확률 (1/2) 과둘중의하나가딸일때둘다딸일확률 (1/3) 에대한모의실험 >>> from collections import
More informationuntitled
시스템소프트웨어 : 운영체제, 컴파일러, 어셈블러, 링커, 로더, 프로그래밍도구등 소프트웨어 응용소프트웨어 : 워드프로세서, 스프레드쉬트, 그래픽프로그램, 미디어재생기등 1 n ( x + x +... + ) 1 2 x n 00001111 10111111 01000101 11111000 00001111 10111111 01001101 11111000
More informationPathEye 공식 블로그 다운로드 받으세요!! 지속적으로 업그래이드 됩니다. 여러분의 의견을 주시면 개발에 반영하겠 습니다.
PathEye Mobile Ver. 0.71b 2009. 3. 17 By PathEye 공식 블로그 다운로드 받으세요!! http://blog.patheye.com 지속적으로 업그래이드 됩니다. 여러분의 의견을 주시면 개발에 반영하겠 습니다. PathEye 설치 1/3 최종 배포 버전을 다 운로드 받습니다. 다운로드된 파일은 CAB 파일입니다. CAB 파일에는
More information<BFB9BCFAB0E6BFB5C1F6BFF8BCBEC5CD5F BFB9BCFAB0E6BFB520C4C1BCB3C6C FB3BBC1F628C3D6C1BEBBF6BAAFC8AF292E706466>
FAQ www.artsdb.or.kr www.artsdb.or.kr Part 1 Part 2 012 012 013 013 014 018 019 019 023 024 025 029 031 041 048 048 050 051 059 060 060 066 072 072 074 075 077 078 078 082 087 089 090 090 092 FAQ Part
More informationstep 1-1
Written by Dr. In Ku Kim-Marshall STEP BY STEP Korean 1 through 15 Action Verbs Table of Contents Unit 1 The Korean Alphabet, hangeul Unit 2 Korean Sentences with 15 Action Verbs Introduction Review Exercises
More informationlkh
XML 을이용한주석말뭉치의구조화와활용 이기황 연세대학교 kihwang.lee@yonsei.ac.kr 1. 머리말 이글에서는구조화문서의마크업을위한메타언어인 XML(eXtensible Markup Language) 를이용하여주석말뭉치를구조화하고, 이를언어연구에활용하는방법을몇 가지예를통하여제시하고자한다. 현재문화관광부및국립국어원에서는 21 세기세종계획 을통하여대규모의언어
More informationMicrosoft PowerPoint - 3장-MS SQL Server.ppt [호환 모드]
MS SQL Server 마이크로소프트사가윈도우운영체제를기반으로개발한관계 DBMS 모바일장치에서엔터프라이즈데이터시스템에이르는다양한플랫폼에서운영되는통합데이터관리및분석솔루션 2 MS SQL Server 개요 3.1 MS SQL Server 개요 클라이언트-서버모델을기반으로하는관계 DBMS로서윈도우계열의운영체제에서만동작함 오라클관계 DBMS보다가격이매우저렴한편이고,
More informationWindows Server 2012
Windows Server 2012 Shared Nothing Live Migration Shared Nothing Live Migration 은 SMB Live Migration 방식과다른점은 VM 데이터파일의위치입니다. Shared Nothing Live Migration 방식은 Hyper-V 호스트의로컬디스크에 VM 데이터파일이위치합니다. 반면에, SMB
More information*캐릭부속물
Character Industry White Paper 2010 18 19 1-1-1 1-1-2 1-1-3 20 21 1-1-4 1-1-5 22 23 1-1-6 1-1-7 24 25 1-1-8 26 27 1-1-10 28 29 1-1-11 1-1-12 30 31 1-1-13 32 33 1-1-14 1-1-15 34 35 36 37 1-1-16 1-1-17
More information국어 순화의 역사와 전망
전문용어의국어화 강현화 1. 들어가기 이해할 수 있는 쉬운 언어 사용의 전형을 만들고자 노력하고 있다. 따라서 본고는 전문 용어의 사용자가 전문가뿐만 아니라 일반인도 포 될 수 있다는 데에서 출발한다. 이러한 출발점을 시작으로 과연 전문 함 용어의 국어화가 어떻게 나아가야 하는지에 대해 고민해 보고자 한다. 2. 전문 용어 연구의 쟁점 2.1. 전문 용어
More informationMicrosoft Word - ijungbo1_13_02
[ 인터넷정보관리사필기 ] 기출문제 (11) 1 1. 지금부터인터넷정보관리사필기기출문제 (11) 를풀어보겠습니다. 2. 홈페이지제작할때유의할점으로가장거리가먼것은무엇일까요? 3. 정답은 ( 라 ) 입니다. 홈페이지제작시유의할점으로는로딩속도를고려하며, 사용자중심의인터페이스로제작하고, 이미지의크기는적당하게조절하여야한다. [ 인터넷정보관리사필기 ] 기출문제 (11)
More information수식모드수식의표현법 수학식표현 조남운 조남운 수학식표현
조남운 mailto:namun.cho@gmail.com 2008.2.20 AMS-TEX 미국수학회 (American Mathematical Society) 에서만든수학패키지 대부분의수학표현은 AMS-TEX 을이용하고있음. 자세한내용은 AMS-TEX 매뉴얼을참조할것. http://www.ams.org/tex/amstex.html AMS-TEX 패키지선언 \usepackage{amssymb,
More information22-12324-4TEL:3668-3114 FAX:742-3387 TEL:3668-3120 FAX:745-9476 TEL:3668-3109, 2279-0867~8 TEL:3668-3127 TEL:3668-3123, 3128, 3162 www.saeki.co.kr, www.pentaximaging.co.kr Small 의 큰 스타일을 경험하다 당신의 카메라만으로도,
More informationXcrypt 내장형 X211SCI 수신기 KBS World 채널 설정법
[ X211S CI 위성방송수신기 - KBS World 채널 설정법 ] 세기위성 T: 82-2-2231-7989, F: 82-2-2232-6373 http://www.sekisat.com webmaster@sekisat.com 주의사항 구매 전에, 위의 X211S CI 수신기의 재고가 당사에 충분히 있는지, 미리 확인바랍니다. 본 제품은 Xcrypt
More information슬라이드 1
UNIT 16 예외처리 로봇 SW 교육원 3 기 최상훈 학습목표 2 예외처리구문 try-catch-finally 문을사용핛수있다. 프로그램오류 3 프로그램오류의종류 컴파일에러 (compile-time error) : 컴파일실행시발생 럮타임에러 (runtime error) : 프로그램실행시발생 에러 (error) 프로그램코드에의해서해결될수없는심각핚오류 ex)
More informationKCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion
KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion 요약 본연구에서는, 웹문서로부터특정상품에대한의견문장을분석하는오피니언마이닝 (Opinion
More informationPowerPoint Template
16-1. 보조자료템플릿 (Template) 함수템플릿 클래스템플릿 Jong Hyuk Park 함수템플릿 Jong Hyuk Park 함수템플릿소개 함수템플릿 한번의함수정의로서로다른자료형에대해적용하는함수 예 int abs(int n) return n < 0? -n : n; double abs(double n) 함수 return n < 0? -n : n; //
More informationW7_Business_ 제품설계
6가지 테마와 24단계 창업 프로그램 벤처창업 (START-UP) Week 7: 스타트업 바이블 Step 20, 21, 22, 23 ; 어떤 과정을 거쳐 제품을 기획하고 설계할까? Hansoo Kim, Ph.D YUST MIS / E-Biz Research Center / BNC ?????,!????,? (Linchpin,, )?? ),, SASA : :,,
More informationuntitled
if( ) ; if( sales > 2000 ) bonus = 200; if( score >= 60 ) printf(".\n"); if( height >= 130 && age >= 10 ) printf(".\n"); if ( temperature < 0 ) printf(".\n"); // printf(" %.\n \n", temperature); // if(
More information17장 클래스와 메소드
17 장클래스와메소드 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 17 장클래스와메소드 1 / 18 학습내용 객체지향특징들객체출력 init 메소드 str 메소드연산자재정의타입기반의버전다형성 (polymorphism) 박창이 ( 서울시립대학교통계학과 ) 17 장클래스와메소드 2 / 18 객체지향특징들 객체지향프로그래밍의특징 프로그램은객체와함수정의로구성되며대부분의계산은객체에대한연산으로표현됨객체의정의는
More information10(833-) SAA13-24.hwp
한국어 어휘의미망 U-WIN을 이용한 한국어 복합명사 의미 분석 833 한국어 어휘의미망 U-WIN을 이용한 한국어 복합명사 의미 분석 [Semantic Analysis of Korean Compound Noun using Lexical Semantic Network(U-WIN)] 배영준 옥 철 영 (Young-Jun Bae) (Cheol-Young Ock)
More informationMicrosoft PowerPoint - WiseNLU(ETRI, 임수종) 배포본
WiseNLU: 지식처리를 위한 자연어 의미 이해 기술 2015. 8. 21. 임수종/이충희/임준호/김현기 ETRI 지식마이닝연구실 1/69 1/63 과제개념 : WiseQA 복잡한자연어로기술된문제의의미를이해하고정답을추론하여생성함 자연어질문 연구목표 자연어질의응답 문제이해정답후보추론최적정답생성 정답, 근거, 정확도 휴먼피드백 자연어어휘 / 문장 / 문맥간의미이해기술개발
More informationPolly_with_Serverless_HOL_hyouk
{ } "Version":"2012-10-17", "Statement":[ { "Effect":"Allow", "Action":[ "polly:synthesizespeech", "dynamodb:query", "dynamodb:scan", "dynamodb:putitem", "dynamodb:updateitem", "sns:publish", "s3:putobject",
More informationchap 5: Trees
5. Threaded Binary Tree 기본개념 n 개의노드를갖는이진트리에는 2n 개의링크가존재 2n 개의링크중에 n + 1 개의링크값은 null Null 링크를다른노드에대한포인터로대체 Threads Thread 의이용 ptr left_child = NULL 일경우, ptr left_child 를 ptr 의 inorder predecessor 를가리키도록변경
More informationPage 2 of 5 아니다 means to not be, and is therefore the opposite of 이다. While English simply turns words like to be or to exist negative by adding not,
Page 1 of 5 Learn Korean Ep. 4: To be and To exist Of course to be and to exist are different verbs, but they re often confused by beginning students when learning Korean. In English we sometimes use the
More informationOCW_C언어 기초
초보프로그래머를위한 C 언어기초 4 장 : 연산자 2012 년 이은주 학습목표 수식의개념과연산자및피연산자에대한학습 C 의알아보기 연산자의우선순위와결합방향에대하여알아보기 2 목차 연산자의기본개념 수식 연산자와피연산자 산술연산자 / 증감연산자 관계연산자 / 논리연산자 비트연산자 / 대입연산자연산자의우선순위와결합방향 조건연산자 / 형변환연산자 연산자의우선순위 연산자의결합방향
More informationWINDOW FUNCTION 의이해와활용방법 엑셈컨설팅본부 / DB 컨설팅팀정동기 개요 Window Function 이란행과행간의관계를쉽게정의할수있도록만든함수이다. 윈도우함수를활용하면복잡한 SQL 들을하나의 SQL 문장으로변경할수있으며반복적으로 ACCESS 하는비효율역
WINDOW FUNCTION 의이해와활용방법 엑셈컨설팅본부 / DB 컨설팅팀정동기 개요 Window Function 이란행과행간의관계를쉽게정의할수있도록만든함수이다. 윈도우함수를활용하면복잡한 SQL 들을하나의 SQL 문장으로변경할수있으며반복적으로 ACCESS 하는비효율역시쉽게해결할수있다. 이번화이트페이퍼에서는 Window Function 중순위 RANK, ROW_NUMBER,
More informationMicrosoft PowerPoint Python-Function.pptx
: 같은코딩을두번하지맙시다. 순천향대학교컴퓨터공학과이상정 순천향대학교컴퓨터공학과 1 학습내용 프로그램이커질수록코드는복잡 복잡한코드는읽기도어렵고유지보수도어려움 함수 (function) 를사용하여복잡함을관리 함수는코드덩어리로프로그램안에서필요할때사용 코드의재사용이편리 함수는공통된행위를따로분리 코드를더읽기쉽고관리하기좋게만듦 유지보수 (maintenance) 가편리
More information¹Ì¼ú-°¢·ÐÁß¿ä³»¿ëb74öÁ¤2š
1 PART 04 >> 4 2 3 PART 04 >> 4 4 5 PART 04 >> 4 6 7 PART 04 >> 4 8 9 PART 04 >> 4 10 11 PART 04 >> 4 12 13 PART 04 >> 4 14 15 PART 04 >> 4 16 17 PART 04 >> 4 18 19 PART 04 >> 4 20 21 PART 04 >> 4 22 23
More information비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2
비트연산자 1 1 비트와바이트 비트와바이트 비트 (Bit) : 2진수값하나 (0 또는 1) 를저장할수있는최소메모리공간 1비트 2비트 3비트... n비트 2^1 = 2개 2^2 = 4개 2^3 = 8개... 2^n 개 1 바이트는 8 비트 2 2 진수법! 2, 10, 16, 8! 2 : 0~1 ( )! 10 : 0~9 ( )! 16 : 0~9, 9 a, b,
More informationJournal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: : * Research Subject
Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp.91-116 DOI: http://dx.doi.org/10.21024/pnuedi.29.1.201903.91 : * Research Subject Trend Analysis on Educational Innovation with Network
More informationLab 3. 실습문제 (Single linked list)_해답.hwp
Lab 3. Singly-linked list 의구현 실험실습일시 : 2009. 3. 30. 담당교수 : 정진우 담당조교 : 곽문상 보고서제출기한 : 2009. 4. 5. 학과 : 학번 : 성명 : 실습과제목적 : 이론시간에배운 Singly-linked list를실제로구현할수있다. 실습과제내용 : 주어진소스를이용해 Singly-linked list의각함수를구현한다.
More information