PowerPoint Presentation

Size: px
Start display at page:

Download "PowerPoint Presentation"

Transcription

1 데이터전처리 Data Preprocessing

2 06 데이터축소

3 목차 1. 데이터큐브집계 2. 속성부분집합선택 3. 차원축소 4. 수량축소 데이터전처리 (Data Preprocessing) - 06 데이터축소 3

4 데이터축소Data Reduction 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 방대한양의데이터를대상으로복잡하게데이터를분석하고마이닝기법을적용한다면매우많은시간이소요되어분석이비현실적임 데이터축소필요 데이터축소전략 차원적축소 dimensionality reduction : 데이터인코딩스키마를적용하여압축되거나축소된표현제공 수치적축소 numerosity reduction : 모수적모형 parametric model 이나비모수적모형 non-parametric model 을사용한데이터대체 모수적모형 parametric model : 모수의특성을활용하는모형으로모집단이정규분포를띤다는가정하에표본통계량으로모집단통계량을추정 비모수적모형 non-parametric model : 모수의특성을활용하지않는모형으로군집화, 표본추출, 히스토그램등이대표적인예 축소된데이터집합에대한데이터분석결과는원본데이터집합에대한데이터분석결과와거의동일한결과를산출해야함

5 1. 데이터큐브집계

6 데이터큐브Data Cube 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 데이터큐브는데이터웨어하우스 Data Warehouse 에서나오는용어 다차원집계정보를의미 데이터큐브를구성하는각셀은다차원공간에서데이터포인트에일치하는집계된데이터 aggregated data 를가짐 원천데이터를여러관점에서추상화시켜데이터축소를구현 데이터큐브는사전계산 precomputed 되고, 요약된 summarized 데이터에신속히접근할수있도록하며, 다양한데이터분석처리가가능 데이터전처리 (Data Preprocessing) - 06 데이터축소 6

7 데이터웨어하우스Data Warehouse Other sources Metadata Monitor & Integrator OLAP Server Analysis Operational DBs CDC Extract Transform Load Refresh Data Warehouse Service Query Reports Data Mining Copy DBs ODS OLAP Server Data Sources Data Storage OLAP Engine Front-End Tools 데이터전처리 (Data Preprocessing) - 06 데이터축소 7

8 데이터큐브예제 (MOLAP) Hierarchy Dimension Date/Time Aug. Dec. clothing food cosmetics Measures count() sum() average() Product Dimension books doll electronics Cell accessory Incheon Gangwon-do Daejeon Korea U.S.A Hierarchy Address Dimension 데이터전처리 (Data Preprocessing) - 06 데이터축소 8

9 데이터큐브슬라이싱예제 (MOLAP) Dimension Dec. Date/Time 2017 Aug. Product Dimension clothing food Incheon Gangwon-do Daejeon Korea U.S.A Address Dimension 데이터전처리 (Data Preprocessing) - 06 데이터축소 9

10 데이터큐브슬라이싱예제 (MOLAP) Dimension 2016 Date/Time 2017 clothing food cosmetics Product Dimension books doll electronics accessory Korea U.S.A Address Dimension 데이터전처리 (Data Preprocessing) - 06 데이터축소 10

11 데이터큐브예제 연도 총판매수 차원데이터모델과큐브 지역 = 원주 지역 = 춘천 지역 = 강릉 연도 TV 컴퓨터 냉장고 TV 컴퓨터 냉장고 TV 컴퓨터 냉장고 차원데이터모델 연도 TV 컴퓨터 냉장고 TV 컴퓨터냉장고 2차원데이터모델과큐브 강릉춘천원주 TV 컴퓨터냉장고 연도, 품목 연도 연도, 품목, 지역 연도, 지역 품목 모두 (all) 3 차원데이터큐브 3 차원큐브격자 품목, 지역 지역 3 큐보이드 2 큐보이드 1 큐보이드 0 큐보이드 데이터전처리 (Data Preprocessing) - 06 데이터축소 11

12 데이터큐브예제 (ROLAP) R A B C D A B C D M a 1 b 1 c 1 d 1 a 1 b 1 c 1 d 1 1 a 1 b 1 c 1 d 2 a 1 b 1 c 1 d 2 1 a 1 b 2 c 1 d 3 a 1 b 2 c 1 d 3 1 a 1 b 2 c 2 d 1 a 1 b 2 c 2 d 1 1 a 1 b 2 c 2 d 2 a 1 b 2 c 2 d 2 1 a 1 b 2 c 2 d 3 a 1 b 2 c 2 d 3 1 SELECT A, B, C, D, COUNT(M) FROM R CUBE BY A, B, C, D; cell a 1, b 2 ; 3 SELECT A, B, C, COUNT(M) FROM R cuboid ACD GROUP BY A, B, C; A B C M A B D M A C D M B C D M a 1 b 1 c 1 2 a 1 b 1 d 1 1 a 1 c 1 d 1 1 b 1 c 1 d 1 1 a 1 b 2 c 1 1 a 1 b 1 d 2 1 a 1 c 1 d 2 1 b 1 c 1 d 2 1 a 1 b 2 c 2 1 a 1 b 2 d 1 1 a 1 c 1 d 3 1 b 2 c 1 d 3 1 a 1 b 2 c 2 2 a 1 b 2 d 2 1 a 1 c 2 d 1 1 b 2 c 2 d 1 1 a 1 b 2 d 3 2 a 1 c 2 d 2 1 b 2 c 2 d 2 1 a 1 c 2 d 3 1 b 2 c 2 d 3 1 A B M A C M A D M B C M B D M C D M a 1 b 1 3 a 1 c 1 3 a 1 d 1 2 b 1 c 1 2 b 1 d 1 1 c 1 d 1 1 a 1 b 2 3 a 1 c 2 3 a 1 d 2 2 b 2 c 1 1 b 1 d 2 1 c 1 d 2 1 a 1 d 3 2 b 2 c 2 3 b 2 d 1 1 c 1 d 3 1 b 2 d 2 1 c 2 d 1 1 A M B M C M D M b 2 d 3 2 c 2 d 2 1 a 1 6 b 1 3 c 1 3 d 1 2 c 2 d 3 1 b 2 3 c 2 3 d 2 2 M d 데이터전처리 (Data Preprocessing) - 06 데이터축소 12

13 큐브격자Cube Lattice apex(top) cuboid Highest ABCD Level 4 ABC ABD ACD BCD Level 3 AB AC AD BC BD CD Level 2 A B C D Level 1 Lowest All Level 0 base(bottom) cuboid 데이터전처리 (Data Preprocessing) - 06 데이터축소 13

14 2. 속성부분집합선택

15 속성부분집합선택 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 속성부분집합선택 Attribute Subset Selection 은연관성이낮거나중복되는데이터속성을제거하여데이터집합의크기를줄이는기법을의미 분석하려는데이터가너무많은속성을포함한다면, 데이터분석작업의시간효율이떨어질수밖에없음 속성중에서데이터분석에영향을미치지않거나타속성과중복적성격을가지는것도많이존재 너무많은속성을제거하지않고분석작업을할경우, 분석알고리즘에혼동을줄수도있고, 이로인해분석결과패턴의품질에도악영향을미칠수있음 연관성이낮거나중복된데이터속성 ( 차원 ) 을제거하여데이터집합의크기를줄이는노력이필요 목표는전체속성에가장가까운데이터범주의확률분포와최소의속성집합을찾는것 데이터전처리 (Data Preprocessing) - 06 데이터축소 15

16 최소속성집합찾기 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, n 개의속성들에대해서조합하면 2 n 개의속성조합이가능 소모적탐색법exhausted search 경험적방법 heuristic 데이터전처리 (Data Preprocessing) - 06 데이터축소 16

17 소모적탐색법exhausted search 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 가장쉽게생각할수있는방법 2 n 개의가능한속성조합모두를탐색 n 이증가할수록엄청난비용이발생 데이터전처리 (Data Preprocessing) - 06 데이터축소 17

18 경험적방법 heuristic 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 일반적으로많이사용 검색공간을축소하여탐색 속성공간을탐색하는동안에매회마다최선으로보이는것을선택 ( 탐욕적 greedy ) 전역적으로 globally 최적이될것이라는기대속에지역적으로 locally 최적인해를선택해가는방법 최적혹은최악의속성들은그것들이서로독립적이라고가정하는통계적유의성 statistical significance 검정을통해여주로결정 분류 classification 를위한의사결정트리 decision tree 생성에사용되는정보이득 information gain 과같은속성평가척도를사용가능 데이터전처리 (Data Preprocessing) - 06 데이터축소 18

19 경험적기법의종류 단계적전진선택법 stepwise forward selection : 속성의공집합으로시작해서최적의속성들을하나씩추가하는방법 단계적후진제거법 stepwise backward elimination : 속성의전체집합으로시작해서최악의속성들을하나씩제거하는방법 전진선택법과후진제거법의결합 combination of forward selection and backward elimination : 전진선택법과후진제거법을결합하여각단계마다최선의속성을선택하고최악의선택을제거하는방법 의사결정트리귀납법 decision tree induction : 의사결정트리는데이터마이닝기법중분류 classification 를위해고안되었고, 흐름도 flowchart 와유사한구조를가짐 데이터전처리 (Data Preprocessing) - 06 데이터축소 19

20 의사결정트리decision tree 나무를뒤집은것과같은모양 분기가거듭되면데이터의개수는줄어듬 의사결정트리는분류 classification 와회귀 regression 모두사용가능 NO X 1 > c 1 Root Node YES 범주형또는연속형데이터에대해서예측가능 Root node: 트리의초기지점 Terminal Node NO X 2 > c 2 Intermediate Node YES Terminal node 의수가분리된집합의수 Terminal node 를합하면전체데이터의수와동일 Terminal Node Terminal Node 데이터전처리 (Data Preprocessing) - 06 데이터축소 20

21 의사결정트리예제 데이터전처리 (Data Preprocessing) - 06 데이터축소 21

22 데이터분할 의사결정트리의분기에따라데이터가분할 A 를 B 와 C 로분할 B 는 D 와 E 로분할 Terminal node: C, D, E 전체데이터 A 가부분집합 C, D, E 로분할 데이터전처리 (Data Preprocessing) - 06 데이터축소 22

23 불순도 / 불확실성 타겟변수 Y 가범주형변수인분류나무 분류나무는순도 homogeneity 가증가, 불순도 impurity 혹은불확실성 uncertainty 이최대한감소하도록하는방향으로학습 순도가증가 / 불확실성이감소하면정보이론에서는정보획득 information gain 이라함 데이터전처리 (Data Preprocessing) - 06 데이터축소 23

24 엔트로피 entropy m 개의레코드가속한 A 영역에대한엔트로피 엔트로피예제 m Entropy A = P k log 2 P k Entropy A = log 2 k= log A 영역에속한모든레코드가동일한범주에속한경우엔트로피 0 ( 불확실성최소, 순도최대 ) 반대로범주가둘뿐이고해당개체의수가동일하게반반씩섞여있을경우엔트로피 0.5 ( 불확실성최대, 순도최소 ) A 데이터전처리 (Data Preprocessing) - 06 데이터축소 24

25 엔트로피 entropy 전체영역 A 에서부분집합 R1, R2 로분할 d Entropy A = 엔트로피계산 i=1 R i m P k log 2 P k k=1 Entropy A = log log log log 의사결정트리는구분한뒤각영역의순도 homogeneity 가증가 / 불확실성 ( 엔트로피 ) 가최대한감소하도록하는방향으로학습 1 8 R1 R2 데이터전처리 (Data Preprocessing) - 06 데이터축소 25

26 지니계수Gini Index 지니계수공식 d G.I A = i=1 R i m 1 k=1 p ik 2 오분류오차 misclassification error : 불순도측정이가능하지만미분이불가능하여자주쓰이지않음 데이터전처리 (Data Preprocessing) - 06 데이터축소 26

27 의사결정트리모델학습 재귀적분기 recursive partitioning : 입력변수영역을두개로구분 가지치기 pruning : 너무자세하게구분된영역을통합 Pruning-diagram.jpg 데이터전처리 (Data Preprocessing) - 06 데이터축소 27

28 재귀적분기recursive partitioning 소득주택크기잔디깍기기계여부 Owner Owner Owner Owner Owner Owner Owner Owner Owner Owner Owner Owner 소득 주택크기 잔디깍기기계여부 Non-owner Non-owner Non-owner Non-owner Non-owner Non-owner Non-owner Non-owner Non-owner Non-owner Non-owner Non-owner 데이터전처리 (Data Preprocessing) - 06 데이터축소 28

29 재귀적분기recursive partitioning 설명변수 (X): 소득, 주택크기 종속변수 (Y): 잔디깍기기계구입여부 한변수 ( 주택크기 ) 를기준으로정렬 가능한모든분기점에대해엔트로피 / 지니계수를구해분기전과비교해정보획득을조사 1 번레코드와나머지 2~24 번레코드간의엔트로피계산후분기전엔트로피와비교 이후에 1~2 번레코드와나머지 3~24 번레코드간의엔트로피계산후비교 다른변수인소득을기준으로정렬하고다시같은작업반복 모든경우의수가운데정보획득이가장큰변수와그지점으로첫번째분기를선택 이후같은작업을반복수행 1 회분기에계산하는경우의수 : d n 1, 개체 n 개, 변수 d 개 데이터전처리 (Data Preprocessing) - 06 데이터축소 29

30 재귀적분기recursive partitioning 소득주택크기잔디깍기기계여부 Non-owner Non-owner Non-owner Non-owner Owner Non-owner Owner Non-owner Non-owner Owner Non-owner Non-owner 소득 주택크기 잔디깍기기계여부 Owner Non-owner Owner Owner Non-owner Owner Owner Non-owner Owner Owner Owner Owner 데이터전처리 (Data Preprocessing) - 06 데이터축소 30

31 재귀적분기recursive partitioning 분기전엔트로피 = 1 2 log log = 1 분기후엔트로피 1 24 log log log 분기후정보획득 = = 0.04 데이터전처리 (Data Preprocessing) - 06 데이터축소 31

32 가지치기 pruning Full tree: 모든 terminal node 의순도가 100% 인상태 Full tree 생성후적절한수준에서 terminal node 를결합해주어야함 Terminal node 가너무많으면새로운데이터에대한예측성능인일반화 generalization 능력이매우떨어짐 분기가너무많으면학습데이터에과적합 overfitting 될수있음 의사결정트리의분기수가증가할때, 처음에는새로운데이터에대한오분류율이감소하나일정수준이상이되면우분류율이증가하는현상이발생 이러한문제를해결하기위해검증데이터에대한오분류율이증가하는시점에가지치기수행 의사결정트리에서가지치기는잘라내는개념보다분기를합치는 merge 개념 데이터전처리 (Data Preprocessing) - 06 데이터축소 32

33 가지치기 pruning 데이터전처리 (Data Preprocessing) - 06 데이터축소 33

34 가지치기 pruning 데이터전처리 (Data Preprocessing) - 06 데이터축소 34

35 가지치기비용함수 가지치기비용함수 CC T = Err T + α L(T) CC(T): 의사결정트리의비용복잡도 ( 오류가적으면서 terminal node 수가적은단순한모델일수록작은값 ) ERR(T): 검증데이터에대한오분류율 L(T): terminal node 의수 ( 구조의복잡도 ) α: ERR T 와 L(T) 를결합하는가중치 ( 사용자에의해부여, 보통 0.01~0.1 의값을사용 ) 데이터전처리 (Data Preprocessing) - 06 데이터축소 35

36 3. 차원축소

37 차원축소dimensionality reduction 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 원천데이터의축소판 ( 압축판 ) 을얻기위한데이터부호화또는데이터변환의적용 원천데이터가정보의손실없이압축된다면무손실 loseless 원천데이터의근사치만으로축소된다면손실 lossy 일반적으로많이사용되며효과적인손실차원축소방법 웨이블릿변환wavelet transform 주성분분석principal components analysis 데이터전처리 (Data Preprocessing) - 06 데이터축소 37

38 웨이블릿변환wavelet transform 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 이산웨이블릿변환 discrete wavelet transform, DWT : 데이터벡터 X 를다른수치적벡터 numerically vector X 으로변환 (X 와 X 의길이는동일 ) 각튜플을 n 차원데이터벡터로간주하면, 벡터 X = x 1,x 2,,x n 를각튜플로고려 웨이블릿변환데이터가원천데이터와같은길이 ( 속성수 ) 를가지지만데이터축소로볼수있는것은변환데이터가압축되어보이기때문 웨이블릿계수중가장유력한일부만을저장함으로써데이터근사치를유지 예를들어, 사용자가정한어떤임계값보다큰모든웨이블릿계수들만값을유지하고나머지계수들을 0 으로간주하면, 결과적인데이터표현은매우희소해지며, 데이터희소성 data sparsity 은데이터연산의복잡도를크게감소시킬수있음 데이터의주요특징들은보존하면서도잡음을제거하는역할을하기도하므로데이터정제를위해서도효과적임 데이터전처리 (Data Preprocessing) - 06 데이터축소 38

39 웨이블릿변환wavelet transform 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, %EB%B8%94%EB%A6%BF_%EB%B3%80%ED%99%98 데이터전처리 (Data Preprocessing) - 06 데이터축소 39

40 DWT 적용절차 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 각반복때마다데이터를반으로나눠서계산속도를향상시키는피라미드알고리즘 pyramid algorithm 사용 웨이블릿변환과정은웨이블릿원형함수를적용 원형함수를분석웨이블릿혹은모웨이블릿이라고하며두가지가존재 고주파버전 : 시계열분석에사용 저주파버전 : 빈도분석에사용 데이터전처리 (Data Preprocessing) - 06 데이터축소 40

41 피라미드알고리즘pyramid algorithm 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, ) 입력벡터의길이 L(L n) 을 2 의정수제곱으로만들기위해필요한만큼 0 을패딩으로채움 2) 각변환에두개의함수를적용 합이나가중평균을적용한데이터평활화 smoothing 데이터의세부적인특성을두드러지게하는가중차 weighted difference 계산 3) 데이터벡터 X 의두데이터포인트쌍인 x2i,x2i + 1 에두개의함수가적용되고, 그결과로길이가 L /2 인두데이터셋을생성 빈도분석에사용되는저주파버전 시계열분석에사용되는고주파버전 4) 위과정을길이 L 이 2 가될때까지반복 5) 위반복에서구해진데이터집합으로부터선택된값은변형된데이터의웨이블릿계수로지정 데이터전처리 (Data Preprocessing) - 06 데이터축소 41

42 주성분분석 Principal Components Analysis, PCA 주성분분석 Principal Components Analysis, PCA 은 n 개의속성을가진튜플 (n 차원의데이터벡터 ) 에대하여데이터를표현하는데최적으로사용될수있는 n 차원직교벡터 orthogonal vector 들에대한 k 를찾음 (k n) 감소된차원의공간을갖는데이터공간생성 ( 차원축소 ) 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 데이터전처리 (Data Preprocessing) - 06 데이터축소 42

43 주성분분석절차 C%84%B1%EB%B6%84_%EB%B6%84%EC%84%9D 1. 입력데이터를표준화하여같은범위에속하게함 ( 표준화를통해큰범위를갖는속성들이작은범위를갖는속성들을압도하지않도록하기위함 ) 2. 표준화된입력데이터를위한기저 base 를제공하는직교벡터 orthonormal vector 들을계산이들을주성분 Principal Component 라고하며, 입력데이터는주성분의선형조합linear combination 3. 주성분은중요도의내림차순으로정렬주성분은데이터에대한새로운축의집합으로서의역할 ( 즉, 정렬된첫번째축은가장큰분산을보여주며, 두번째축은그다음으로높은분산을보여주는식 ) 4. 내림차순정렬이되어있어약한주성분 weak principal component 를제거함으로써데이터크기감소 ( 즉, 가장강한성분들을사용함으로써크기가축소된원천데이터의높은근사치구성가능 ) 데이터전처리 (Data Preprocessing) - 06 데이터축소 43

44 주성분분석 Principal Components Analysis, PCA 속성부분집합선택은속성의초기집합의부분집합을유지하며속성집합의크기를줄임 주성분분석 PCA 필수적인속성들의핵심을결합 기대하지않았던관계를보여주기도하여평범하지않은결과해석이가능 비용효과적이며, 순서화된속성이나순서화되지않은속성에두루적용가능 희소데이터와비대칭데이터에모두적용가능 다차원데이터를 2 차원으로축소가능 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 데이터축소기법에서는웨이블릿변환은고차원데이터에더적합하고, PCA 는희소데이터취급에더유리 데이터전처리 (Data Preprocessing) - 06 데이터축소 44

45 회귀모형regression model 주어진데이터의근사치를구하는데사용 선형회귀 linear regression 은확률변수 random variable y 를예측변수 predicator variable 인 x 의선형함수로모형화 : y = wx + b 계수 coefficient w와 b는데이터를분리하는실제선과그선의추정치사이의오류를최소화해주는최소제곱법에의해구할수있음 method of least square 다중회귀 multiple regression 는확률변수 y 가두개이상의예측변수 x 에의해모형화되도록단순선형회귀를확장한것 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, %B6%84%EC%84%9D 데이터전처리 (Data Preprocessing) - 06 데이터축소 45

46 로그-선형모형log-linear model 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, n 개의속성으로표현되는 n 차원에서주어진 n 개의튜플집합을 n 차원공간의한점으로생각하는이산다차원확률분포의근사치를구함 차원조합의가장작은부분집합에기반하여이산화된속성들의집합에대해다차원공간내의각점의확률을평가하는데사용가능 이렇게함으로써저차원공간으로부터고차원공간생성가능 차원축소와데이터평활화에유용 차원축소 : 저차원의점은원래데이터보다적은공간을차지 데이터평활화 : 저차원공간의평가를응집하는것은고차원공간의평가보다표본변동에덜민감 회귀방법이고차원데이터에적용될경우계산비용이기하급수적으로늘어남 로그 - 선형모형은 10 차원정도까지는우수한확장가능성 scalability 를보여줌 데이터전처리 (Data Preprocessing) - 06 데이터축소 46

47 Generalized Linear Models 데이터전처리 (Data Preprocessing) - 06 데이터축소 47

48 4. 수량축소

49 수량축소방법 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 표본추출 sampling 히스토그램 histogram 군집화 clustering 데이터전처리 (Data Preprocessing) - 06 데이터축소 49

50 표본추출 sampling 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 큰데이터집합을많은수의임의데이터샘플 ( 부분집합 ) 로표현가능 대용량데이터집합 D 가 N 개의튜플을포함하고있다고가정 데이터전처리 (Data Preprocessing) - 06 데이터축소 50

51 표본추출 sampling 방법 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 비복원단순무작위표본 Simple Random Sample WithOut Replacement, SRSWOR : D 로부터 N 개의튜플중에서임의의 s 개를취하는방법으로서모든튜플들의표본으로추출될확률은같음 복원단순무작위표본 Simple Random Sample With Replacement With Replacement, SRSWR : 각튜플이 D 로부터추출될때마다기록된후다시제자리로복원 replace 된다는것을제외하면 SRSWOR 와유사, 각튜플은추출된다음에다시추출될수있도록 D 에되돌려짐 집략표본 Cluster Sample : D 에있는튜플들이 M 개의상호배반적군집 cluster 으로묶여있는가운데 s 개의군집을단순무작위로추출 (s < M) 층화표본 Stratified Sample : D 가층 strata 이라불리는상호배반적부분들로분할되어있다면, 각층에서하나씩단순무작위로추출 ( 예, 고객의나이그룹각각에대하여하나의층이생성되어있는고객데이터로부터층화표본을얻음 ) 데이터전처리 (Data Preprocessing) - 06 데이터축소 51

52 히스토그램 histogram 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 구간화를사용하여데이터분포의근사치를구하는데이터축소의전형적형태 속성 A 의데이터를버킷 bucket 혹은빈 bin 이라불리는분리집합 disjoint subset 으로나눔 각버킷이단일한속성값 / 빈도의쌍으로표현되기도하고, 주어진속성에대한연속범위 continuous range 를나타내기도함 히스토그램은희소데이터나밀집데이터모두에효과적, 비대칭적데이터와균일한데이터모두매우효과적 단일속성에대한히스토그램은다중속성에대한것으로확장가능 다차원히스토그램에서는속성간의의존성포착가능 일반적으로 5 개까지의속성을가진데이터의근사치를구하는데효과적이라고알려짐 데이터전처리 (Data Preprocessing) - 06 데이터축소 52

53 버킷결정및속성값분할방법 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 동등폭 Equal-width : 각버킷의범위는균일 동등빈도 Equal-frequency : 각버킷의빈도가일정 ( 각버킷이같은수의데이터표본을포함 ) V- 최적 V-optimal : 최소분산을갖는히스토그램을의미, 히스토그램분산은각버킷이나타내는데이터값들의가중합 weighted sum 이며, 버킷가중치는버킷에있는값들의개수와동일 최대차이 Max-Diff : 인접한값들의각쌍사이의차이를고려, 사용자정의버킷의수 β 에대하여, β 1 개의최대차이를갖는쌍들에대한각쌍사이에버킷경계가정해짐 데이터전처리 (Data Preprocessing) - 06 데이터축소 53

54 군집화 clustering 데이터튜플을객체로간주하고, 각객체들을군집 cluster 이라는그룹으로나눔 한군집내객체들과는유사하면서도다른군집내객체들과는유사하지않도록군집화 유사성은공간내에서객체들이어떻게가까운지의관점에따라거리함수에기반하여정의 클러스터의품질은지름 diameter 의표현으로나타내고, 지름은클러스터의두객체간최대거리로표현 클러스터간중심거리 centroid distance 는클러스터중심간거리로서클러스터품질로대체측정 클러스터의지름은짧을수록 ( 클러스터내객체간의유사성이강할수록 ), 클러스터간중심거리는길수록 ( 클러스터간유사성은약할수록 ) 군집화의품질이높다고볼수있음 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 데이터전처리 (Data Preprocessing) - 06 데이터축소 54

55 데이터전처리 (Data Preprocessing) - 06 데이터축소 55

Overview Decision Tree Director of TEAMLAB Sungchul Choi

Overview Decision Tree Director of TEAMLAB Sungchul Choi Overview Decision Tree Director of TEAMLAB Sungchul Choi 머신러닝의학습방법들 - Gradient descent based learning - Probability theory based learning - Information theory based learning - Distance similarity based

More information

Microsoft PowerPoint - 26.pptx

Microsoft PowerPoint - 26.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2011년봄학기 강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

G Power

G Power G Power 부산대학교통계학과조영석 1. G Power 란? 2. G Power 설치및실행 2.1 G Power 설치 2.2 G Power 실행 3. 검정 (Test) 3.1 가설검정 (Test of hypothesis) 3.2 검정력 (Power) 3.3 효과크기 (Effect size) 3.4 표본수산정 4. 분석 4.1 t- 검정 (t-test) 4.2

More information

Microsoft PowerPoint Relations.pptx

Microsoft PowerPoint Relations.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2010년봄학기강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

Intra_DW_Ch4.PDF

Intra_DW_Ch4.PDF The Intranet Data Warehouse Richard Tanler Ch4 : Online Analytic Processing: From Data To Information 2000. 4. 14 All rights reserved OLAP OLAP OLAP OLAP OLAP OLAP is a label, rather than a technology

More information

adfasdfasfdasfasfadf

adfasdfasfdasfasfadf C 4.5 Source code Pt.3 ISL / 강한솔 2019-04-10 Index Tree structure Build.h Tree.h St-thresh.h 2 Tree structure *Concpets : Node, Branch, Leaf, Subtree, Attribute, Attribute Value, Class Play, Don't Play.

More information

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63> 제 3 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

PowerPoint Presentation

PowerPoint Presentation 데이터전처리 Data Preprocessing 05 데이터통합 목차 1. 개체식별 2. 중복 3. 상관분석 4. 데이터값충돌탐지및해결 데이터전처리 (Data Preprocessing) - 05 데이터통합 3 1. 개체식별 개체식별문제Entity Identification Problem 이현호, Python 과 SQL 을활용한실전데이터전처리, 카오스북, 2018.

More information

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a 조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a) b) 조사연구 주제어 패널조사 횡단면가중치 종단면가중치 선형혼합모형 일반화선형혼 합모형

More information

DW 개요.PDF

DW 개요.PDF Data Warehouse Hammersoftkorea BI Group / DW / 1960 1970 1980 1990 2000 Automating Informating Source : Kelly, The Data Warehousing : The Route to Mass Customization, 1996. -,, Data .,.., /. ...,.,,,.

More information

Microsoft PowerPoint - 알고리즘_5주차_1차시.pptx

Microsoft PowerPoint - 알고리즘_5주차_1차시.pptx Basic Idea of External Sorting run 1 run 2 run 3 run 4 run 5 run 6 750 records 750 records 750 records 750 records 750 records 750 records run 1 run 2 run 3 1500 records 1500 records 1500 records run 1

More information

2002년 2학기 자료구조

2002년 2학기 자료구조 자료구조 (Data Structures) Chapter 1 Basic Concepts Overview : Data (1) Data vs Information (2) Data Linear list( 선형리스트 ) - Sequential list : - Linked list : Nonlinear list( 비선형리스트 ) - Tree : - Graph : (3)

More information

김기남_ATDC2016_160620_[키노트].key

김기남_ATDC2016_160620_[키노트].key metatron Enterprise Big Data SKT Metatron/Big Data Big Data Big Data... metatron Ready to Enterprise Big Data Big Data Big Data Big Data?? Data Raw. CRM SCM MES TCO Data & Store & Processing Computational

More information

Microsoft PowerPoint - 27.pptx

Microsoft PowerPoint - 27.pptx 이산수학 () n-항관계 (n-ary Relations) 2011년봄학기 강원대학교컴퓨터과학전공문양세 n-ary Relations (n-항관계 ) An n-ary relation R on sets A 1,,A n, written R:A 1,,A n, is a subset R A 1 A n. (A 1,,A n 에대한 n- 항관계 R 은 A 1 A n 의부분집합이다.)

More information

확률과통계 강의자료-1.hwp

확률과통계 강의자료-1.hwp 1. 통계학이란? 1.1 수학적 모형 실험 또는 증명을 통하여 자연현상을 분석하기 위한 수학적인 모형 1 결정모형 (deterministic model) - 뉴톤의 운동방정식 : - 보일-샤를의 법칙 : 일정량의 기체의 부피( )는 절대 온도()에 정비례하고, 압력( )에 반비례한다. 2 확률모형 (probabilistic model) - 주사위를 던질 때

More information

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut 경영학을 위한 수학 Fial Eam 5//(토) :-5: 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오.. (각 6점) 다음 적분을 구하시오 4 ( ) (a) ( )4 8 8 (b) d이 성립한다. d C C log log (c) 이다. 양변에 적분을 취하면 log C (d) 라 하자. 그러면 d 4이다. 9 9 4 / si (e) cos si

More information

소성해석

소성해석 3 강유한요소법 3 강목차 3. 미분방정식의근사해법-Ritz법 3. 미분방정식의근사해법 가중오차법 3.3 유한요소법개념 3.4 편미분방정식의유한요소법 . CAD 전처리프로그램 (Preprocessor) DXF, STL 파일 입력데이타 유한요소솔버 (Finite Element Solver) 자연법칙지배방정식유한요소방정식파생변수의계산 질량보존법칙 연속방정식 뉴톤의운동법칙평형방정식대수방정식

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드] 제 11 강 111 자기상관 Autocorrelation 자기상관의본질 11 유효성 (efficiency, accurate estimation/prediction) 을위해서는모든체계적인정보가회귀모형에체화되어있어야함 표본의무작위성 (randomness) 은서로다른관측치들에대한오차항들이상관되어있지말아야함을의미함 자기상관 (Autocorrelation) 은이러한표본의무작위성을위반하게만드는오차항에있는체계적패턴임

More information

(Hyunoo Shim) 1 / 24 (Discrete-time Markov Chain) * 그림 이산시간이다연쇄 (chain) 이다왜 Markov? (See below) ➀ 이산시간연쇄 (Discrete-time chain): : Y Y 의상태공간 = {0, 1, 2,..., n} Y n Y 의 n 시점상태 {Y n = j} Y 가 n 시점에상태 j 에있는사건

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 9 주차 예측모형에대한평가 Assessment of Predictive Model 최종후, 강현철 차례 6. 모형평가의기본개념 6.2 모델비교 (Model Comparison) 노드 6.3 임계치 (Cutoff) 노드 6.4 의사결정 (Decisions) 노드 6.5 기타모형화노드들

More information

(2) 다중상태모형 (Hyunoo Shim) 1 / 2 (Coninuous-ime Markov Model) ➀ 전이가일어나는시점이산시간 : = 1, 2,, 4,... [ 연속시간 : 아무때나, T 1, T 2... * 그림 (2) 다중상태모형 ➁ 계산과정 이산시간 : 전이력 (force of ransiion) 정의안됨 전이확률 (ransiion probabiliy)

More information

methods.hwp

methods.hwp 1. 교과목 개요 심리학 연구에 기저하는 기본 원리들을 이해하고, 다양한 심리학 연구설계(실험 및 비실험 설계)를 학습하여, 독립된 연구자로서의 기본적인 연구 설계 및 통계 분석능력을 함양한다. 2. 강의 목표 심리학 연구자로서 갖추어야 할 기본적인 지식들을 익힘을 목적으로 한다. 3. 강의 방법 강의, 토론, 조별 발표 4. 평가방법 중간고사 35%, 기말고사

More information

Portal_9iAS.ppt [읽기 전용]

Portal_9iAS.ppt [읽기 전용] Application Server iplatform Oracle9 A P P L I C A T I O N S E R V E R i Oracle9i Application Server e-business Portal Client Database Server e-business Portals B2C, B2B, B2E, WebsiteX B2Me GUI ID B2C

More information

15인플레이션01-목차1~9

15인플레이션01-목차1~9 ISSN 87-381 15. 1 15. 1 13 1 1.3 1. 1.8 1.5 1. 1.1 () 1.5 1..1 1.8 1.7 1.3 () 1..7.6...3 (). 1.5 3.6 3.3.9. 6.3 5.5 5.5 5.3.9.9 ().6.3.. 1.6 1. i 6 5 6 5 5 5 3 3 3 3 1 1 1 1-1 -1 13 1 1).6..3.1.3.

More information

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표 Vector Differential: 벡터 미분 Yonhee Lee October 7, 08 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표기법을 정의하는 방법이다 보통 스칼라(scalar)에 대한 미분은 일분수 함수 f : < < 또는 다변수 함수(function

More information

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345]) 수치해석 6009 Ch9. Numerical Itegratio Formulas Part 5. 소개 / 미적분 미분 : 독립변수에대한종속변수의변화율 d vt yt dt yt 임의의물체의시간에따른위치, vt 속도 함수의구배 적분 : 미분의역, 어떤구간내에서시간 / 공간에따라변화하는정보를합하여전체결과를구함. t yt vt dt 0 에서 t 까지의구간에서곡선 vt

More information

abstract.dvi

abstract.dvi 통계자료분석 강희모 2014년 5월 14일 목차 제 1장 여러가지평균비교 1 1.1. 단일표본검정.............................. 2 1.2. 독립인두표본검정........................... 4 1.3. 대응표본검정.............................. 9 제 2 장 분산분석(ANalysis Of VAriance)

More information

PowerPoint Presentation

PowerPoint Presentation 5 불대수 IT CookBook, 디지털논리회로 - 2 - 학습목표 기본논리식의표현방법을알아본다. 불대수의법칙을알아본다. 논리회로를논리식으로논리식을논리회로로표현하는방법을알아본다. 곱의합 (SOP) 과합의곱 (POS), 최소항 (minterm) 과최대항 (mxterm) 에대해알아본다. 01. 기본논리식의표현 02. 불대수법칙 03. 논리회로의논리식변환 04.

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 11 주차 군집분석 Cluster Analysis 최종후, 강현철 차례 8.1 군집분석의개념 8.2 k-평균군집방법 (k-means Clustering) 8.3 군집분석의특징과적용상의문제점 8.4 클러스터링 (Clustering) 노드 8.5 세그먼트프로파일링 (Segment

More information

R t-..

R t-.. R 과데이터분석 집단의차이비교 t- 검정 양창모 청주교육대학교컴퓨터교육과 2015 년겨울 t- 검정 변수의값이연속적이고정규분포를따른다고할때사용 t.test() 는모평균과모평균의 95% 신뢰구간을추청함과동시에가설검증을수행한다. 모평균의구간추정 - 일표본 t- 검정 이가설검정의귀무가설은 모평균이 0 이다 라는귀무가설이다. > x t.test(x)

More information

슬라이드 1

슬라이드 1 빅데이터분석을위한데이터마이닝방법론 SAS Enterprise Miner 활용사례를중심으로 7 주차 회귀분석 Regression Analysis 최종후, 강현철 차례 4.1 선형회귀분석 (Linear Regression Analysis) 4.2 로지스틱회귀분석 (Logistic Regression Analysis) 4.3 회귀분석의특징과제약 4.4 분석사례 -

More information

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016)   ISSN 228 (JBE Vol. 1, No. 1, January 016) (Regular Paper) 1 1, 016 1 (JBE Vol. 1, No. 1, January 016) http://dx.doi.org/10.5909/jbe.016.1.1.60 ISSN 87-9137 (Online) ISSN 16-7953 (Print) a), a) An Efficient Method

More information

<B3EDB4DC28B1E8BCAEC7F6292E687770>

<B3EDB4DC28B1E8BCAEC7F6292E687770> 1) 초고를읽고소중한조언을주신여러분들게감사드린다. 소중한조언들에도불구하고이글이포함하는오류는전적으로저자개인의것임을밝혀둔다. 2) 대표적인학자가 Asia's Next Giant: South Korea and Late Industrialization, 1990 을저술한 MIT 의 A. Amsden 교수이다. - 1 - - 2 - 3) 계량방법론은회귀분석 (regression)

More information

PowerPoint Presentation

PowerPoint Presentation 데이터전처리 Data Preprocessing 02 데이터전처리개요 목차 1. 데이터전처리 2. 데이터품질 3. 데이터전처리단계 데이터전처리 (Data Preprocessing) - 02 데이터전처리개요 3 1. 데이터전처리 데이터분석단계 해석과평가 데이터마이닝 변환 지식 전처리 패턴 선택 목표데이터 전처리된데이터 변환된데이터 데이터 데이터전처리 (Data

More information

Tree 기반의 방법

Tree 기반의 방법 Tree 기반의방법 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) Tree 기반의방법 1 / 25 학습내용 의사결정나무 (decision tree) 회귀나무 (regresion tree) 분류나무 (classification tree) 비교앙상블알고리즘 (ensemble algorithm) 배깅 (bagging) 랜덤포레스트 (random

More information

Microsoft PowerPoint - Ch13

Microsoft PowerPoint - Ch13 Ch. 13 Basic OP-AMP Circuits 비교기 (Comparator) 하나의전압을다른전압 ( 기준전압, reference) 와비교하기위한비선형장치 영전위검출 in > 기준전압 out = out(max) in < 기준전압 out = out(min) 비교기 영이아닌전위검출 기준배터리 기준전압분배기 기준전압제너다이오드 비교기 예제 13-1: out(max)

More information

Microsoft PowerPoint - MDA DA pptx

Microsoft PowerPoint - MDA DA pptx 판별분석개념 Indvdual Drected Technque 측정변수 ( 항목 ) 에의한개체분류 분류되어있는집단간의차이를의미있게설명해줄수있는독립변수들을찾아내어 변수의선형결합으로판별식 (Dscrmnant functon) 을만들어낸다. 이판별식을이용하여분류하고자하는개체의집단을판별 데이터유형 집단변수 : 범주형혹은이진형 판별변수 : 측정형 ( 등간척도포함 ) 사례

More information

<BFACB1B831382D31365FBAF2B5A5C0CCC5CD20BAD0BCAEBFA120C0C7C7D120BFE4C0B2BBEAC1A420B9E6B9FD20BAF1B1B35F33C2F7BCF6C1A E687770>

<BFACB1B831382D31365FBAF2B5A5C0CCC5CD20BAD0BCAEBFA120C0C7C7D120BFE4C0B2BBEAC1A420B9E6B9FD20BAF1B1B35F33C2F7BCF6C1A E687770> Ⅳ. 의사결정나무와 MARS 1. 실손의료보험자료를활용한 CART 분석 가. CART(Classification and Regression Tree) CART는데이터를가장잘분류해주는도구라고할수있는데데이터를잘분류해주는분리변수를선택하고분리지점을정해준다. 그리고가지치기를통해서분류의정도를결정할수있다. 데이터마이닝방법론들중가장널리쓰이는방법론으로반응변수가범주형또는연속형일때가능한의사결정나무의한알고리즘이다.

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선 Point Operation Histogram Modification 김성영교수 금오공과대학교 컴퓨터공학과 학습내용 HISTOGRAM HISTOGRAM MODIFICATION DETERMINING THRESHOLD IN THRESHOLDING 2 HISTOGRAM A simple datum that gives the number of pixels that a

More information

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은 2013 년도연구용역보고서 공공기관임금프리미엄추계 - 2013. 12.- 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한국노동연구원선임연구위원정진호 공공기관임금프리미엄추계 2013. 12. 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영

More information

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포 생존분석의 추정과 비교 : 보충자료 이용희 December, 8 Cotets 생존함수와 위험함수. 생존함수와 위험함수....................................... 예제: 지수분포.......................................... 예제: 와이블분포.........................................

More information

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt 수명분포및신뢰도의 통계적추정 포항공과대학교산업공학과전치혁.. 수명및수명분포 수명 - 고장 까지의시간 - 확률변수로간주 - 통상잘알려진분포를따른다고가정 수명분포 - 확률밀도함수또는 누적 분포함수로표현 - 신뢰도, 고장률, MTTF 등신뢰성지표는수명분포로부터도출 - 수명분포추정은분포함수관련모수의추정 누적분포함수및확률밀도함수 누적분포함수 cumulav dsbuo

More information

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345]) 수치해석 161009 Ch21. Numerical Differentiation 21.1 소개및배경 (1/2) 미분 도함수 : 독립변수에대한종속변수의변화율 y = x f ( xi + x) f ( xi ) x dy dx f ( xi + x) f ( xi ) = lim = y = f ( xi ) x 0 x 차분근사 도함수 1 차도함수 : 곡선의한점에서접선의구배 21.1

More information

Microsoft PowerPoint - SPSS14_모듈별 구성소개

Microsoft PowerPoint - SPSS14_모듈별 구성소개 SPSS 모듈별구성 SPSS Korea 데이타솔루션 1 SPSS 제품구성 C/S 기능별제품구성 SPSS Server SPSS Client 기능 대량의데이터를처리할수있는고성능 machine 에탑재 서버의강력한스칼라처리기능과향상된수행능력을전달 SPSS Client 의처리요구를받아서통계분석작업을수행하는 Multi-thread Backend Engine 통계분석자

More information

자료의 이해 및 분석

자료의 이해 및 분석 어떤실험이나치료의효과를측정할때독립이아닌표본으로부터관찰치를얻었을때처리하는방법 - 동일한개체에어떤처리를하기전과후의자료를얻을때 - 가능한동일한특성을갖는두개의개체에서로다른처리를하여그처리의효과를비교하는방법 (matching) 1 예제 : 혈청 cholesterol 치를줄이기위해서 12 명을대상으로운동과함께식이요법의효과를 측정하기위한실험실시 2 식이요법 - 운동실험전과후의

More information

Oracle Apps Day_SEM

Oracle Apps Day_SEM Senior Consultant Application Sales Consulting Oracle Korea - 1. S = (P + R) x E S= P= R= E= Source : Strategy Execution, By Daniel M. Beall 2001 1. Strategy Formulation Sound Flawed Missed Opportunity

More information

선형모형_LM.pdf

선형모형_LM.pdf 변수선택 8 경제성의 원리로 불리우는 Occam s Razor는 어떤 현상을 설명할 때 불필요한 가정을 해서는 안 된다는 것이다. 같은 현상을 설 명하는 두 개의 주장이 있다면, 간 단한 쪽을 선택하라. 통계학의 유 의성 검정, 유의하지 않은 설명변 수 제거의 근거가 된다. 섹션 1 개요 개념 1) 경험이나 이론에 의해 종속변수에 영향을 미칠 것 같은 설명변수를

More information

자료의 이해 및 분석

자료의 이해 및 분석 표본추출방법 * 실제표본조사 다단계집락표집법, 다단계층화집락표집법 1 확률표본추출방법 1. 단순임의추출법 2. 층화추출법 3. 집락추출법 4. 계통추출법 2 예 ) 원광대학생을대상 (500 명 ) 으로건강조사실시 전수조사 모집단 : 10,000 명 표본조사 : 500 명을어떻게뽑을것인가? 3 1. 단순임의추출법 Simple Random Sampling(SRS

More information

비선형으로의 확장

비선형으로의 확장 비선형으로의확장 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 비선형으로의확장 1 / 30 개요 선형모형은해석과추론에장점이있는반면예측력은제한됨능형회귀, lasso, PCR 등의방법은선형모형을이용하는방법으로모형의복잡도를감소시켜추정치의분산을줄이는효과가있음해석력을유지하면서비선형으로확장다항회귀 (polynomial regression): ( 예 )

More information

Chapter 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리

Chapter 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리 Chapter 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리 Essentials of Management Information Systems Chapter. 5 비즈니스인텔리젼스의기초 : 데이터베이스와정보관리 학습목표 관계형데이터베이스가데이터를어떻게구성하고, 객체지향데이터베이스와어떠한차이가존재하는가? 데이테베이스관리시스템의원리는무엇인가? 기업의성과와의사결정력을향상시키기위한데이터베이스의정보에접근하기위한주요도구와기술들은무엇인가?

More information

Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오.

Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오. Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, 2018 1 Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오. https://docs.scipy.org/doc/numpy-1.15.0/user/quickstart.html https://www.machinelearningplus.com/python/

More information

쉽게 배우는 알고리즘 강의노트

쉽게 배우는 알고리즘 강의노트 쉽게배우는알고리즘 장. 정렬 Sorting http://www.hanbit.co.kr 장. 정렬 Sorting 은유, 그것은정신적상호연관성의피륙을짜는방법이다. 은유는살아있다는것의바탕이다. - 그레고리베이트슨 - 2 - 학습목표 기본정렬알고리즘을이해한다. 정렬을귀납적관점에서볼수있도록한다. 1 장과 2 장에서배운기법을사용해각정렬의수행시간을분석할수있도록한다. 비교정렬의한계를이해하고,

More information

딥러닝 첫걸음

딥러닝 첫걸음 딥러닝첫걸음 4. 신경망과분류 (MultiClass) 다범주분류신경망 Categorization( 분류 ): 예측대상 = 범주 이진분류 : 예측대상범주가 2 가지인경우 출력층 node 1 개다층신경망분석 (3 장의내용 ) 다범주분류 : 예측대상범주가 3 가지이상인경우 출력층 node 2 개이상다층신경망분석 비용함수 : Softmax 함수사용 다범주분류신경망

More information

17장 클래스와 메소드

17장 클래스와 메소드 17 장클래스와메소드 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 17 장클래스와메소드 1 / 18 학습내용 객체지향특징들객체출력 init 메소드 str 메소드연산자재정의타입기반의버전다형성 (polymorphism) 박창이 ( 서울시립대학교통계학과 ) 17 장클래스와메소드 2 / 18 객체지향특징들 객체지향프로그래밍의특징 프로그램은객체와함수정의로구성되며대부분의계산은객체에대한연산으로표현됨객체의정의는

More information

<C5F0B0E82D313132C8A328C0DBBEF7BFEB292E687770>

<C5F0B0E82D313132C8A328C0DBBEF7BFEB292E687770> 2012년 7월 17일 발행 통권 제112호 112 발행인:李圭衡/편집인:金尙勳/주간:金泰詢/발행처:社)退溪學釜山硏究院 (우614-743) 釜山市釜山鎭區田浦洞608-1 819-8587/F.817-4013 出處가 분명한 공직사회 인간이 가지는 인성은 그 특성이 다양하여 일률적으로 판단 한 하기는 쉽지 않다. 그러므로 어떤 관점과 측면에서 논하느냐에

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 System Software Experiment 1 Lecture 5 - Array Spring 2019 Hwansoo Han (hhan@skku.edu) Advanced Research on Compilers and Systems, ARCS LAB Sungkyunkwan University http://arcs.skku.edu/ 1 배열 (Array) 동일한타입의데이터가여러개저장되어있는저장장소

More information

Microsoft Word - EDA_Univariate.docx

Microsoft Word - EDA_Univariate.docx 일변량분석개념 일변량분석은개체의특성을 측정한변수가하나인 통계분석 방법 변수의 종류 ( 수리 통계 ) 이산형 (discrete): 측정결과를셀수있는경우이다. 성별, 직업, 교통량, 나이등이여기해당된다. 연속형 (continuous): 측정결과가무한이 (infinite) 많은변수를연속형형변수라한다. 즉변수의범위 (range) 중어떤구간을설정하더라도측정치가발생할할수있는경우로키,

More information

Chap 6: Graphs

Chap 6: Graphs 그래프표현법 인접행렬 (Adjacency Matrix) 인접리스트 (Adjacency List) 인접다중리스트 (Adjacency Multilist) 6 장. 그래프 (Page ) 인접행렬 (Adjacency Matrix) n 개의 vertex 를갖는그래프 G 의인접행렬의구성 A[n][n] (u, v) E(G) 이면, A[u][v] = Otherwise, A[u][v]

More information

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770> 25 강. 수열의극한참거짓 2 두수열 { }, {b n } 의극한에대한 < 보기 > 의설명중옳은것을모두고르면? Ⅰ. < b n 이고 lim = 이면 lim b n =이다. Ⅱ. 두수열 { }, {b n } 이수렴할때 < b n 이면 lim < lim b n 이다. Ⅲ. lim b n =0이면 lim =0또는 lim b n =0이다. Ⅰ 2Ⅱ 3Ⅲ 4Ⅰ,Ⅱ 5Ⅰ,Ⅲ

More information

An Effective Sentence-Extraction Technique Using Contextual Information and Statistical Approaches for Text Summarization

An Effective Sentence-Extraction Technique Using Contextual Information and  Statistical Approaches for Text Summarization 한국 BI 데이터마이닝학회 2010 추계학술대회 Random Forests 기법을사용한 저수율반도체웨이퍼검출및혐의설비탐색 고태훈, 김동일, 박은정, 조성준 * Data Mining Lab., Seoul National University, hooni915@snu.ac.kr Introduction 반도체웨이퍼의수율 반도체공정과웨이퍼의수율 반도체공정은수백개의프로세스로이루어져있음

More information

Chapter 7 – Classification and Regression Trees

Chapter 7 – Classification and Regression Trees 비선형분류모델링 의사결정나무 Decision Tree 교사학습패러다임 Plant 관측 계측 FDC + 계측치 교사학습패러다임 Plant 관측 계측 FDC + 계측치 학습 모델 ƒ Data (x, y) 교사학습패러다임 Plant 관측 계측 FDC χ FDC + 계측치 학습 모델 ƒ Data (x, y) 계측치 ; ˆy 예측 교사학습패러다임 Plant Data

More information

MATLAB for C/C++ Programmers

MATLAB for C/C++ Programmers 오늘강의내용 (2014/01/16) 회귀분석 1 회귀분석 (Regression Analysis) 2 회귀분석 회귀분석이란? 연관된변수들간의관계를찾는통계적방법 즉, 어떠한변수 x가변수 Y에함수관계를통해영향을미친다는것을찾아내는것 예를들어 강우량 ( 변수 x) 이곡물의수확량 ( 변수 Y) 에미치는영향 화학공정의수율 ( 변수 x) 이촉매의사용량 ( 변수 Y) 에따라어떻게변하는지..

More information

chap x: G입력

chap x: G입력 재귀알고리즘 (Recursive Algorithms) 재귀알고리즘의특징 문제자체가재귀적일경우적합 ( 예 : 피보나치수열 ) 이해하기가용이하나, 비효율적일수있음 재귀알고리즘을작성하는방법 재귀호출을종료하는경계조건을설정 각단계마다경계조건에접근하도록알고리즘의재귀호출 재귀알고리즘의두가지예 이진검색 순열 (Permutations) 1 장. 기본개념 (Page 19) 이진검색의재귀알고리즘

More information

Microsoft PowerPoint - ch10 - 이진트리, AVL 트리, 트리 응용 pm0600

Microsoft PowerPoint - ch10 - 이진트리, AVL 트리, 트리 응용 pm0600 균형이진탐색트리 -VL Tree delson, Velskii, Landis에의해 1962년에제안됨 VL trees are balanced n VL Tree is a binary search tree such that for every internal node v of T, the heights of the children of v can differ by at

More information

Sequences with Low Correlation

Sequences with Low Correlation 레일리페이딩채널에서의 DPC 부호의성능분석 * 김준성, * 신민호, * 송홍엽 00 년 7 월 1 일 * 연세대학교전기전자공학과부호및정보이론연구실 발표순서 서론 복호화방법 R-BP 알고리즘 UMP-BP 알고리즘 Normalied-BP 알고리즘 무상관레일리페이딩채널에서의표준화인수 모의실험결과및고찰 결론 Codig ad Iformatio Theory ab /15

More information

statistics

statistics 수치를이용한자료요약 statistics hmkang@hallym.ac.kr 한림대학교 통계학 강희모 ( 한림대학교 ) 수치를이용한자료요약 1 / 26 수치를 통한 자료의 요약 요약 방대한 자료를 몇 개의 의미있는 수치로 요약 자료의 분포상태를 알 수 있는 통계기법 사용 중심위치의 측도(measure of center) : 어떤 값을 중심으로 분포되어 있는지

More information

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월 지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., 2004 5 2009 12 KOSPI200.,. * 2009. 지능정보연구제 16 권제 1 호 2010 년 3 월 김선웅 안현철 社 1), 28 1, 2009, 4. 1. 지능정보연구제 16 권제 1 호 2010 년 3 월 Support

More information

Microsoft PowerPoint - IPYYUIHNPGFU

Microsoft PowerPoint - IPYYUIHNPGFU 분산분석 분산분석 (ANOVA: ANALYSIS OF VARIANCE) 두개이상의모집단의차이를검정 예 : 회사에서세종류의기계를설치하여동일한제품을생산하는경우, 각기계의생산량을조사하여평균생산량을비교 독립변수 : 다른변수에의해영향을주는변수 종속변수 : 다른변수에의해영향을받는변수 요인 (Factor): 독립변수 예에서의요인 : 기계의종류 (I, II, III) 요인수준

More information

1

1 절대수학 검은 대장간 인문 Blacksmith Day 1 최석호 1. 그림과 같이 A B C D E의 다섯 개의 영역에 빨강, 노랑, 파 랑, 초록의 네 가지 색으로 색칠을 하려고 한다. 네 가지 색 중 한 색 은 두 번 사용하고 나머지 세 가지 색은 한 번씩만 사용하여 칠하는 데, 인접한 영역에는 서로 다른 색을 칠하기로 할 때, 색칠하는 방법 의 수를 구하시오.

More information

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정 . 선형시스템 : GussSedel. 비선형시스템. 선형시스템 : GussSedel (/0) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. GS 방법은선형대수방정식을푸는반복법중에서 가장보편적으로사용되는방법이다. 개의방정식에서 인 ( 대각원소들이모두 0 이아닌 ) 경우를다루자. j j b j j b j j 여기서 j b j j j 현재반복단계

More information

Microsoft PowerPoint - ch07 - 포인터 pm0415

Microsoft PowerPoint - ch07 - 포인터 pm0415 2015-1 프로그래밍언어 7. 포인터 (Pointer), 동적메모리할당 2015 년 4 월 4 일 교수김영탁 영남대학교공과대학정보통신공학과 (Tel : +82-53-810-2497; Fax : +82-53-810-4742 http://antl.yu.ac.kr/; E-mail : ytkim@yu.ac.kr) Outline 포인터 (pointer) 란? 간접참조연산자

More information

표본재추출(resampling) 방법

표본재추출(resampling) 방법 표본재추출 (resampling) 방법 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 표본재추출 (resampling) 방법 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과

More information

슬라이드 1

슬라이드 1 장연립방정식을 풀기위한반복법. 선형시스템 : Guss-Sedel. 비선형시스템 . 선형시스템 : Guss-Sedel (/0) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정식을푸는반복법중에서 가장보편적으로사용되는방법이다. 개의방정식에서 인 ( 대각원소들이모두 0 이아닌 ) 경우를다루자. j j b j b j j j

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 11 곡선과곡면 01 Spline 곡선 02 Spline 곡면 03 Subdivision 곡면 C n 연속성 C 0 연속성 C 1 연속성 2 C 2 연속성 01 Spline 곡선 1. Cardinal Spline Curve 2. Hermite Spline Curve 3. Bezier Spline Curve 4. Catmull-Rom Spline Curve 5.

More information

PowerPoint Presentation

PowerPoint Presentation http://pdd4.webnode.kr/ e-business ch. 9. Big data & IoT Ph.D. Young-Min, Kyoung contents 데이터마이닝 의개요 개요 기계학습 데이터마이닝기법 데이터마이닝 기법기초 개요 C4.5 알고리즘 엔트로피 결정나무규칙생성 Part. 데이터마이닝 Part. 의사결정나무 (Decision Tree)

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

Resampling Methods

Resampling Methods Resampling Methds 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) Resampling Methds 1 / 18 학습내용 개요 CV(crss-validatin) 검증오차 LOOCV(leave-ne-ut crss-validatin) k-fld CV 편의-분산의관계분류문제에서의 CV Btstrap 박창이 ( 서울시립대학교통계학과 )

More information

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다 이장에서사용되는 MATLAB 명령어들은비교적복잡하므로 MATLAB 창에서명령어를직접입력하지않고확장자가 m 인 text 파일을작성하여실행을한다. 즉, test.m 과같은 text 파일을만들어서 MATLAB 프로그램을작성한후실행을한다. 이와같이하면길고복잡한 MATLAB 프로그램을작성하여실행할수있고, 오류가발생하거나수정이필요한경우손쉽게수정하여실행할수있는장점이있으며,

More information

untitled

untitled Math. Statistics: Statistics? 1 What is Statistics? 1. (collection), (summarization), (analyzing), (presentation) (information) (statistics).., Survey, :, : : QC, 6-sigma, Data Mining(CRM) (Econometrics)

More information

금오공대 컴퓨터공학전공 강의자료

금오공대 컴퓨터공학전공 강의자료 데이터베이스및설계 Chap 1. 데이터베이스환경 (#2/2) 2013.03.04. 오병우 컴퓨터공학과 Database 용어 " 데이타베이스 용어의기원 1963.6 제 1 차 SDC 심포지움 컴퓨터중심의데이타베이스개발과관리 Development and Management of a Computer-centered Data Base 자기테이프장치에저장된데이터파일을의미

More information

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각

JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 (   ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각 JAVA 프로그래밍실습 실습 1) 실습목표 - 메소드개념이해하기 - 매개변수이해하기 - 새메소드만들기 - Math 클래스의기존메소드이용하기 ( http://java.sun.com/javase/6/docs/api ) 문제 - 직사각형모양의땅이있다. 이땅의둘레, 면적과대각선의길이를계산하는메소드들을작성하라. 직사각형의가로와세로의길이는주어진다. 대각선의길이는 Math클래스의적절한메소드를이용하여구하라.

More information

PowerPoint Presentation

PowerPoint Presentation Class - Property Jo, Heeseung 목차 section 1 클래스의일반구조 section 2 클래스선언 section 3 객체의생성 section 4 멤버변수 4-1 객체변수 4-2 클래스변수 4-3 종단 (final) 변수 4-4 멤버변수접근방법 section 5 멤버변수접근한정자 5-1 public 5-2 private 5-3 한정자없음

More information

Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft s Bing Search Engine Thore Graepel et al., ICML, 2010 P

Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft s Bing Search Engine Thore Graepel et al., ICML, 2010 P Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft s Bing Search Engine Thore Graepel et al., ICML, 2010 Presented by Boyoung Kim April 25, 2018 Boyoung Kim

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 Computer Vision & Pattern Recognition Lab. 제 9 장영상인식 Computer Vision & Pattern Recognition Lab. 영상인식 Computer Vision & Pattern Recognition Lab. 2 /26 영상인식 일반적인영상인식은매우어려운문제임 제한된환경, 여러가지가정하에서수행 영상의종류를알경우

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 03 모델변환과시점변환 01 기하변환 02 계층구조 Modeling 03 Camera 시점변환 기하변환 (Geometric Transformation) 1. 이동 (Translation) 2. 회전 (Rotation) 3. 크기조절 (Scale) 4. 전단 (Shear) 5. 복합변환 6. 반사변환 7. 구조변형변환 2 기하변환 (Geometric Transformation)

More information

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D>

<4D F736F F F696E74202D2035BBF3C6F2C7FC5FBCF8BCF6B9B0C1FA2E BC8A3C8AF20B8F0B5E55D> 5. 상평형 : 순수물질 이광남 5. 상평형 : 순수물질 상전이 phase transition 서론 ~ 조성의변화없는상변화 5. 상평형 : 순수물질 전이열역학 5. 안정성조건 G ng ng n G G 자발적변화 G < 0 G > G or 물질은가장낮은몰Gibbs 에너지를갖는상 가장안정한상 으로변화하려는경향 5. 상평형 : 순수물질 3 5. 압력에따른Gibbs

More information

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx Mti Matrix 정의 A collection of numbers arranged into a fixed number of rows and columns 측정변수 (p) 개체 x x... x 차수 (nxp) 인행렬matrix (n) p 원소 {x ij } x x... x p X = 열벡터column vector 행벡터row vector xn xn... xnp

More information

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석 동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석 목차 I. 서론 II. 동아시아각국의무역수지, 실질실효환율및 GDP간의관계 III. 패널데이터를이용한 Granger인과관계분석 IV. 개별국실증분석모형및 TYDL을이용한 Granger 인과관계분석 V. 결론 참고문헌 I. 서론 - 1 - - 2 - - 3 - - 4

More information

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ): Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, 207 Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ): binomial distribution은 성공확률이 θ인 시도에서, n번 시행 중 k번 성공할 확률

More information

빅데이터분산컴퓨팅-5-수정

빅데이터분산컴퓨팅-5-수정 Apache Hive 빅데이터분산컴퓨팅 박영택 Apache Hive 개요 Apache Hive 는 MapReduce 기반의 High-level abstraction HiveQL은 SQL-like 언어를사용 Hadoop 클러스터에서 MapReduce 잡을생성함 Facebook 에서데이터웨어하우스를위해개발되었음 현재는오픈소스인 Apache 프로젝트 Hive 유저를위한

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

<C1A62038B0AD20B0ADC0C7B3EBC6AE2E687770>

<C1A62038B0AD20B0ADC0C7B3EBC6AE2E687770> 제 8강 SQL: 관계데이터베이스언어 강의목표 관계데이타베이스언어로서상용 DBMS에서가장널리사용되는 SQL의동작원리에관하여학습하고, 이를이용하여다양한질의문을작성하는방법을습득한다 기대효과 SQL의데이터정의기능을이해한다 SQL의데이터조작기능중질의기능을이해한다 SQL의데이터조작기능중데이터갱신기능을이해한다 SQL의데이터조작기능중뷰및인덱스관련기능을이해한다 SQL 의개요

More information

연구보고서 2009-05 일반화선형모형 (GLM) 을이용한 자동차보험요율상대도산출방법연구 Ⅰ. 요율상대도산출시일반화선형모형활용방법 1. 일반화선형모형 2 연구보고서 2009-05 2. 일반화선형모형의자동차보험요율산출에적용방법 요약 3 4 연구보고서 2009-05 Ⅱ. 일반화선형모형을이용한실증분석 1. 모형적용기준 < > = 요약 5 2. 통계자료및통계모형

More information

(Microsoft PowerPoint - Ch17_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

(Microsoft PowerPoint - Ch17_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345]) 수치해석 6009 Ch7. Polyomial Iterpolatio 다항식보간법 T C ρ kg/m µ N s/m v m /s -40 0 0 50 00 50 00 50 00 400.5.9.0.09 0.946 0.85 0.746 0.675 0.66 0.55.5 0-5.7 0-5.80 0-5.95 0-5.7 0-5.8 0-5.57 0-5.75 0-5.9 0-5.5

More information

untitled

untitled (shared) (integrated) (stored) (operational) (data) : (DBMS) :, (database) :DBMS File & Database - : - : ( : ) - : - : - :, - DB - - -DBMScatalog meta-data -DBMS -DBMS - -DBMS concurrency control E-R,

More information

01

01 2019 학년도대학수학능력시험 9 월모의평가문제및정답 2019 학년도대학수학능력시험 9 월모의평가문제지 1 제 2 교시 5 지선다형 1. 두벡터, 모든성분의합은? [2 점 ] 에대하여벡터 의 3. 좌표공간의두점 A, B 에대하여선분 AB 를 로외분하는점의좌표가 일때, 의값은? [2점] 1 2 3 4 5 1 2 3 4 5 2. lim 의값은? [2점] 4. 두사건,

More information