MATLAB for C/C++ Programmers

Similar documents
MATLAB for C/C++ Programmers

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

비선형으로의 확장

(Microsoft PowerPoint - Ch21_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

슬라이드 1

Microsoft Word - LectureNote.doc

2156년올림픽 100미터육상경기에서여성의우승기록이남성의기록보다빠른첫해로남을수있음 2156년올림픽에서 100m 우승기록은남성의경우 8.098초, 여성은 8.079초로예측 통계적오차 ( 예측구간 ) 를고려하면빠르면 2064년, 늦어도 2788년에는그렇게될것이라고주장 유사

(Microsoft PowerPoint - Ch19_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

(Microsoft PowerPoint - Ch17_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

제 4 장회귀분석

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

시스템경영과 구조방정식모형분석

PowerPoint Presentation

슬라이드 1

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

01

G Power

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

슬라이드 1

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

PowerPoint 프레젠테이션

슬라이드 1

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

소성해석

슬라이드 1

PowerPoint 프레젠테이션

<B4EBC7D0BCF6C7D02DBBEFB0A2C7D4BCF62E687770>

31. 을전개한식에서 의계수는? 를전개한식이 일 때, 의값은? 을전개했을때, 의계수와상수항의합을구하면? 을전개했을때, 의 계수는? 를전개했을때, 상수항을 구하여라. 37

Chapter 연습문제답안. y *sin-*cos*^ep-*/sqrt. y [ ; sinpi/ ; sin*pi ; ] 혹은 [ sinpi/ sin*pi ]. a ais[- ] b et.,., sin. c.. a A는주어진행렬 M의 번째열만을표시하는새로운행렬을나타낸다.

1 1 장. 함수와극한 1.1 함수를표현하는네가지방법 1.2 수학적모형 : 필수함수의목록 1.3 기존함수로부터새로운함수구하기 1.4 접선문제와속도문제 1.5 함수의극한 1.6 극한법칙을이용한극한계산 1.7 극한의엄밀한정의 1.8 연속

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

문제지 제시문 2 보이지 않는 영역에 대한 정보를 얻기 위하여 관측된 다른 정보를 분석하여 역으로 미 관측 영역 에 대한 정보를 얻을 수 있다. 가령 주어진 영역에 장애물이 있는 경우 한 끝 점에서 출발하여 다른 끝 점에 도달하는 최단 경로의 개수를 분석하여 장애물의

<C0E5B7C1BBF328BEEEB8B0C0CCB5E9C0C729202D20C3D6C1BE2E687770>

Microsoft PowerPoint - chap_11_rep.ppt [호환 모드]

슬라이드 1


(Microsoft PowerPoint - Ch6_NumAnalysis.ppt [\310\243\310\257 \270\360\265\345])

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

Python과 함께 배우는 신호 해석 제 5 강. 복소수 연산 및 Python을 이용한 복소수 연산 (제 2 장. 복소수 기초)

<4D F736F F D20B1E2BBF3C5EBB0E85F36C0E55FC7D0BBFD2E646F6378>

선형모형_LM.pdf

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

PowerPoint 프레젠테이션

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx

Microsoft Word - 동태적 모형.doc

슬라이드 1

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

슬라이드 1

Tree 기반의 방법

와플-4년-2호-본문-15.ps

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

<30325FBCF6C7D05FB9AEC7D7C1F62E687770>

제 1 절 two way ANOVA 제1절 1 two way ANOVA 두 요인(factor)의 각 요인의 평균비교와 교호작용(interaction)을 검정하는 것을 이 원배치 분산분석(two way ANalysis Of VAriance; two way ANOVA)이라

¾DÁ ÖÖ„�Àº¨Ö´ä

<B1B9BEEE412E687770>

한국정책학회학회보

고 학년도 9월고수학 1 전국연합학력평가영역문제지 1 1 제 2 교시 수학영역 5 지선다형 3. 두다항식, 에대하여 는? [ 점 ] 1. 의값은? ( 단, ) [ 점 ] 다항식 이 로인수분해될때, 의값은? ( 단,,

슬라이드 1

스무살, 마음껏날아오르기위해, 일년만꾹참자! 2014학년도대학수학능력시험 9월모의평가 18번두이차정사각행렬 가 를만족시킬때, 옳은것만을 < 보기 > 에서있는대로고른것은? ( 단, 는단위행렬이다.) [4점] < 보기 > ㄱ. ㄴ. ㄷ. 2013학년도대학수학능력시험 16번


공간계량경제학을 응용한 사례분석

수도권과비수도권근로자의임금격차에영향을미치는 집적경제의미시적메커니즘에관한실증연구 I. 서론


제 2 교시 2019 학년도 3 월고 1 전국연합학력평가문제지수학영역 1 5 지선다형 1. 의값은? [2점] 일차방정식 의해는? [2 점 ] 두수, 의최대공약수는? [2 점 ] 일차함수 의그래프에서

Chapter 8 단순선형회귀분석과 상관분석

<B1B9BEEE412E687770>

슬라이드 1

Microsoft Word - SPSS_MDA_Ch6.doc

<B0F8BDC4C1A4B8AE2838C2F720BCF6C7D032292E687770>

Microsoft PowerPoint - IPYYUIHNPGFU

가능한연구가설제시 가설 1 : 지지후보의선택은유권자의나이에따라차이가있을것이다. 유권자의나이는지지후보의선택에영향을미칠것이다. 유권자의나이에따라지지후보는다를것이다. 가설 2 : 유권자의사회생활만족도는지지후보의선택에영향을미칠것이다. 지지후보의선택은유권자의사회생활만족도에따라차

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형


제 3강 역함수의 미분과 로피탈의 정리

5. 두함수 log 에대하여옳은것을 < 보기 > 에서모두고르면?5 ) ㄱ. ㄴ. ㄷ. < 보기 > 1 ㄴ 2 ㄷ 3 ㄱ, ㄴ 4 ㄴ, ㄷ 5 ㄱ, ㄴ, ㄷ 7. 인실수 에대하여 log 의지표를 이라할때, 옳 은것을보기에서모두고르면? ( 단, 는 를넘지않는최대의정수이다.

PowerPoint 프레젠테이션

제 12강 함수수열의 평등수렴

커널 방법론

ÀüÀÚÇö¹Ì°æ-Áß±Þ

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

<4D F736F F D20C0C0BFEBB0E8B7AE20C1A B0AD202D20B0E8B7AEB0E6C1A6C7D E646F63>

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

Microsoft PowerPoint - 26.pptx

untitled

2013 학년도수학성취도측정시험 (2013학년도수시모집및외국인특별전형합격자대상 ) 2012년 12월 18일, 고사시간 90분 1번부터 11번까지는단답형이고, 12번부터 16번까지는서술형입니다. 답안지는깨끗한글씨로바르게작성하되, 단답형은답만쓰고, 서술형은풀이과정과답을명시

Microsoft Word - ch2_simple.doc

Microsoft Word - ch3_residual.doc

Microsoft Word - skku_TS2.docx

LM_matrix.pages

딥러닝 첫걸음

6.6) 7.7) tan 8.8) 자연수 10.10) 부등식 두 의전개식에서 의계수는? ) 사건 에대하여 P P 일때, P 의값은? ( 단, 은 의여사건이다.) 일때, tan 의값은? log log 을만족시키

통계적 학습(statistical learning)

Transcription:

오늘강의내용 (2014/01/16) 회귀분석 1

회귀분석 (Regression Analysis) 2

회귀분석 회귀분석이란? 연관된변수들간의관계를찾는통계적방법 즉, 어떠한변수 x가변수 Y에함수관계를통해영향을미친다는것을찾아내는것 예를들어 강우량 ( 변수 x) 이곡물의수확량 ( 변수 Y) 에미치는영향 화학공정의수율 ( 변수 x) 이촉매의사용량 ( 변수 Y) 에따라어떻게변하는지.. 3

변수간의관계 확정적 (deterministic) 관계 두변수사이에수학적공식 y = f(x) 가성립한다는것 함수 f 의상태를모를수도있으나, y 는 x 에따라확정되는것이확실한관계 확률적 (probabilistic) 관계 x의일정한값에대해관측되는 Y의값이일정하게나타나지는않지만, 평균적으로일정한경향을나타내는것 Y = f(x) + ε x 는독립변수, Y 는종속변수, ε 는확률적효과 Note: Y는확률변수이나, x는확률변수가아님 다른용어로, x 를설명변수 (regression variable), Y를반응변수 (response variable) 이라고부르기도함 4

회귀분석을통해 설명변수 ( 독립변수 x) 와반응변수 ( 종속변수 Y) 의관계를수식으로나타내고, 이에대한적합성검증가능 추정된평균반응값에포함된오차의범위 ( 신뢰구간 ) 을얻을수있음 설명변수의값을알면평균반응값을추정하거나, 새로운관측값을예측가능 5

회귀 모형 regression model 변수 간의 관계를 확률적으로 나타낸 것 예를 들어, 키와 폐활량의 관계를 알아보기 위해 20명의 실험 대상에 대해 데이터를 얻음 두 변수간에 선형적인 관계식이 존재함을 알 수 있음: E(Y) = β0 + β1x 6

회귀 모형 확률 오차 ε (random error) 관측 값과 β0 + β1x 간의 차이 다른 변수의 영향이나 측정 오류에 기인 확률 오차를 고려하여 두 변수의 관계는 Y = β0 + β1x + ε 로 나타낼 수 있음 선형 회귀 모형 (linear regression model) 단순 회귀 모형 : Y = β0 + β1 x + ε 다중 선형 회귀 모형 : Y = β0 + β1x1 + β2x2 + β3x3 + + βkxk + ε ε 7

단순회귀모형 Y = β 0 + β 1 x + ε β 0, β 0 : 회귀계수 (regression coefficient) 확률오차 ε 는평균 0, 분산 σ 2 인분포를따른다고가정 Fitting 변수간의관계를회귀모형으로가정한다음, 회귀모형의모수들을추정 최소제곱법 (method of least squares) 모수를추정하는방법중의하나 실험을통해설명변수 x 의여러값 x 1, x 2,, x n 에대응하는반응변수 Y의관측값 y 1, y 2,, y n 을얻었을때오차 ε i 를제곱하여모두합한값을최소로하는추정방법 n Q β 0, β 1 = ε 2 n 2 = y i β 0 β 1 x i i=1 i=1 8

단순회귀모형 최소제곱법 (method of least squares) n Q β 0, β 1 = ε 2 n 2 = y i β 0 β 1 x i i=1 i=1 Q β 0, β 1 을최소화하는 β 0, β 1 을다음연립방정식을계산하여구함 Q β 0,β 1 n = 2 β i=1 y i β 0 β 1 x i = 0 0 Q β 0,β 1 n = 2 β i=1 y i β 0 β 1 x i x i = 0 1 두식을정리하면, β 1 = n i=1(x i x )(y i y) n i=1 (x i x )^2 β 0 = y β 1 x 여기서, x, y 는 x i, y i 의평균 9

Quiz 기계의사용기간 ( 개월수 ) 과정비비용 ( 만원 ) 사이에어떠한관계가있는지알아보기위해기계의사용기간에따른정비비용을조사하였다. (1) 단순회귀모형을통해관계를분석하고, (2) 각데이터들과선형함수를그래프로그리고, (3) 사용기간이 60개월일때정비비용을알아보자. 관측번호 1 2 3 4 5 6 7 8 9 10 사용기간 (x i ) 18 6 30 48 6 36 18 18 30 36 정비비용 (y i ) 25 17 48 58 23 40 30 39 40 60 β 1 = n i=1(x i x )(y i y) n i=1 (x i x )^2 β 0 = y β 1 x 여기서, x, y 는 x i, y i 의평균 통계학응용과이론, 청문각에서발췌 10

Quiz Sol. β 0 = 14.5714, β 1 = 0.9524 11

다중회귀모형 설명변수 (x) 하나만으로반응변수 (Y) 의변화를충분히설명하지 못하여, 여러개의설명변수를사용해야하는경우에사용하는모형 설명변수의수가 k 개인다중회귀모형 Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + + β k x k + ε 각각의회귀계수 β i 는 i 번째설명변수만의변화가반응변수에미치는영향 설명변수의선형결합도다중회귀모형으로분석가능 예를들어, Y = β 0 + β 1 x + β 2 x 2 + β 3 x 3 + ε 의경우, x 1 = x, x 2 =x 2, x 3 =x 3 으로 치환하면다중회귀모형 Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε 으로해석가능 12

다중회귀모형의최소제곱추정 단순회귀모형의최소제곱추정방법과비슷하게계산 Y 1 = β 0 + β 1 x 11 + β 2 x 12 + β 3 x 13 + + β k x 1k + ε 1 Y 2 = β 0 + β 1 x 21 + β 2 x 22 + β 3 x 23 + + β k x 2k + ε 2 Y n = β 0 + β 1 x n1 + β 2 x n2 + β 3 x n3 + + β k x nk + ε n 상기수식을행렬로정의가능 Y = Xβ + ε 이며 Y = [Y1, Y2,, Yn], X = 1 x 11 x 12 x 1k 1 x 21 x 13 x 2k, ε = [ε 1, ε 2,, ε n ] 1 x n1 x n2 x nk 13

다중회귀모형의최소제곱추정 오차의제곱의합이최소가되도록하는회귀계수들을찾음 n 2 Q(β) = i=1 ε i = ε ε = (Y - Xβ) (Y Xβ) 위의식을풀어서정리하면, Q(β) = Y Y β X Y Y Xβ + β X Xβ = Y Y 2β X Y + β X Xβ Q = β 2X Y + 2X Xβ = 0 X Xβ = X Y 따라서최소제곱추정량 β = (X X) -1 X Y 14

다중회귀모형 A 전자회사는전국적으로수백개의대리점을갖고있는데, 각대리점의월매출액 ( 억원 ) 은관할구청의인구수 ( 십만명 ) 와그구역의가구당월평균수입 ( 백만원 ) 에크게영향을받는다고판단된다. 10개의대리점을무작위로뽑아다음과같은자료를얻었다. 이자료를다중회귀모형에 fitting 시켜보자. 대리점번호 1 2 3 4 5 6 7 8 9 10 월매출액 ( y i ) 2.0 1.3 2.4 1.5 0.6 2.0 1.0 2.0 1.3 0.9 인구수 (x i1 ) 3.0 1.1 3.5 2.5 0.6 2.8 1.3 3.3 2.0 1.0 월평균수입 (x i2 ) 3.2 3.0 3.6 2.6 1.9 3.5 2.1 3.4 2.8 2.3 최소제곱추정량 β = (X X) -1 X Y 통계학응용과이론, 청문각에서발췌 15

다중 회귀 모형 대리점 번호 1 2 3 4 5 6 7 8 9 10 월매출액( yi) 2.0 1.3 2.4 1.5 0.6 2.0 1.0 2.0 1.3 0.9 인구수 (xi1) 3.0 1.1 3.5 2.5 0.6 2.8 1.3 3.3 2.0 1.0 월평균수입 (xi2) 3.2 3.0 3.6 2.6 1.9 3.5 2.1 3.4 2.8 2.3 β0 = -0.4503 β1 = 0.3067 β2 = 0.4589 추정 회귀식 y(x1,x2) = -0.4503 + 0.3067 x1 + 0.4589 x2 16

Quiz 국민의생활수준을알아보는지표로총생계비중에서식비가차지하는비율인엥겔지수가있다. 한가계당평균얼마의식비를지출하는지알아보기위해서울에거주하는 10가구를무작위로뽑아월평균식비 ( 단위 : 만원 ) y, 월평균소득 ( 단위 : 만원 ) x 1, 가족의수 ( 단위 : 명 ) x 2, 그리고평균연령 ( 단위 : 세 ) x 3 을조사하여다음과같은자료를얻었다. y 36.2 39.0 81.7 39.0 68.3 106.3 123.9 114.8 97.0 100.2 x1 206.2 218.6 264.6 330.5 334.7 365.6 379.3 456.4 502.7 531.0 x2 1 4 4 2 3 4 5 6 3 7 x3 32 39 41 33 37 31 35 29 27 36 다음의다중회귀모형을가정하고회귀식을추정하라. Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + ε 최소제곱추정량 β = (X X) -1 X Y 통계학응용과이론, 청문각에서발췌 17

Quiz Sol. y 36.2 39.0 81.7 39.0 68.3 106.3 123.9 114.8 97.0 100.2 x1 206.2 218.6 264.6 330.5 334.7 365.6 379.3 456.4 502.7 531.0 x2 1 4 4 2 3 4 5 6 3 7 x3 32 39 41 33 37 31 35 29 27 36 β 0 = 88.7125 β 1 = 0.0517 β 2 = 11.9010 β 3 = -2.1480 추정회귀식 y(x 1,x 2,x 3 ) = 88.7125 + 0.0517 x 1 + 11.9010 x 2-2.1480 x 3 통계학응용과이론, 청문각에서발췌 18

Basic Fitting Tool 주어진데이터에대해다양한 regression model 을적용해볼수있음 19

Basic Fitting Tool β 0 = 14.5714, β 1 = 0.9524 20

Basic Fitting Tool 여러회귀모형의결과를동시에확인가능 21

Quiz 다음자료를포물선회귀모형을이용하여분석하고자한다. Y = β 0 + β 1 x + β 2 x 2 + ε x -3-2 -1 0 1 2 3 y 0 0 1 1 0 0-1 Basic Fitting Tool 을이용하여추정회귀식을구하고, 이를산점도와함께 그려라. 22

Quiz Sol. 다음 자료를 포물선 회귀모형을 이용하여 분석하고자 한다. Y = β0 + β1 x + β2 x 2 + ε x -3-2 -1 0 1 2 3 y 0 0 1 1 0 0-1 Basic Fitting Tool을 이용하여 추정 회귀식을 구하고, 이를 산점도와 함께 그려라. 23

Quiz Sol. polyfit을 이용하는 방법 p = polyfit(x, y, n) (x, y) 좌표의 점, n차 회귀 모형으로 회귀분석 p : 회귀 곡선의 다항식 벡터를 반환 24

톨게이트통과차량 (traffic.txt) 시간 톨게이트 A 톨게이트 B 톨게이트 C 03:00 ~ 04:00 12 11 9 04:00 ~ 05:00 8 14 11 05:00 ~ 06:00 14 17 20 06:00 ~ 07:00 11 13 9 07:00 ~ 08:00 43 51 69 08:00 ~ 09:00 38 88 115 09:00 ~ 10:00 28 36 55 10:00 ~ 11:00 12 12 14 11:00 ~ 12:00 18 27 30 12:00 ~ 13:00 18 19 29 13:00 ~ 14:00 17 15 18 14:00 ~ 15:00 19 36 48 15:00 ~ 16:00 32 47 10 16:00 ~ 17:00 42 65 151 17:00 ~ 18:00 114 145 257 18:00 ~ 19:00 35 58 68 19:00 ~ 20:00 13 9 15 20:00 ~ 21:00 11 12 15 21:00 ~ 22:00 10 9 7 25

다항식 Fitting 톨게이트 C 를통과하는자동차의수를 6 차항을갖는다항식으로 fitting 해보자. 26

다항식이아닌함수로 Fitting 어떤데이터집합의경우, 다항식이아닌다른함수로 fitting 하는것이데이터를 더욱잘표현할수있음 MATLAB 의 polyfit 함수로데이터를 fitting 하기위해서는, 다항식이아닌 fitting 함수를선형으로변형해주어야함 fitting 할함수 선형변환 polyfit 사용법 y = a e mx ln(y) = mx + ln(a) p = polyfit( x, ln(y), 1 ) y = a 10 mx log(y) = mx + log(a) p = polyfit( x, log(y), 1 ) y = m ln(x) + b 그대로사용 p = polyfit( ln(x), y, 1 ) y = m log(x) + b 그대로사용 p = polyfit( log(x), y, 1 ) y = 1 / (mx + b) 1/y = mx + b p = polyfit( x, 1./y, 1) 27

다항식이아닌함수로 Fitting 데이터 plot 선형변환후 Fitting 28

Quiz 다음과같은데이터가있다. 다음데이터는아래와같은수식으로부터만들어낼수있다. 데이터 Fitting 하라. x = linspace(0, 2, 10); y = 1./(5*x+1) + 0.2*rand(1,length(x)); 29

Quiz Sol. 30

보간법 (Interpolation) 31

라그랑지보간법 (Lagrange Interpolation) 보간법은데이터점들사이의값을추정하는방법 평면상에서로다른 n 개의점 (x k, y k ) 가주어진다면, 이들을지나는 ( 최대 ) n 차의 유일한다항식 p 가존재하며, 이다항식 p 는항상주어진 n 개의점을지난다. P x = x x j k y k 이며, j k xk x j 다음을항상만족함 : P x k = y k, k=1..n 예를들어, (0,-5), (1,-6), (2,-1), (3,16) 점을지나는다항식은다음과같다. P x = x 1 x 2 x 3 6 5 + x x 2 x 3 2 6 + x x 1 x 3 2 1 + x x 1 x 2 6 (16) MATLAB 을통해구해보면 32

33

1 차원보간법 yi = interp1(x, y, t, 보간방법 ) xi, yi 데이터쌍 ( 좌표값 ) t 위의데이터에대해보간 (interpolate) 된그래프를그릴때, x축값에해당하는벡터 보간방법 nearest : 가장근접한이웃보간 linear : 선형보간 ( 기본값 ) spline : 3차스플라인보간 pchip : 3차 Hermite 보간 34

각보간법들의차이 35

spline 이용한보간법 주어진데이터점들을지나면서점들사이에부드러운곡선을형성 2차미분이연속이며, 동일한보간제약조건들을만족해야함 다양한방법이있음 1차스플라인 : 붉은색선 2차, 3차스플라인 : 녹색선 ( 포물선 ) spline 함수 : 3차스플라인 연속된두점 x i, x i+1 사이에 3차다항식으로생성되는곡선으로연결 각점에서스플라인라인은 1차 2차미분가능 ( 즉, 구간이부드럽게연결 ) 36

spline p = spline(x, y, t) 데이터 점 (x, y)가 주어지면 해당 데이터 점들을 가지고 spline 을 그림 데이터 점 외에 t로 주어지는 점들에 대해 spline(t) 의 값을 p로 반환 x -2-1 0 1 2 y 0.1429 0.3333 1.0000 1.0000 0.3333 37

pchip spline 과거의비슷 2 차미분을갖지않을수도있음 ( 즉, 구간이부드럽게연결되지않을수도 있음 ) spline 과 pchip 과의차이 spline은 overshoot 가발생할수있음 즉, 데이터가 smooth function 모양인경우에는 overshoot가발생하지않지만, 데이터가 smooth 하지않게배치된경우에는보간된라인이진동함 pchip은 데이터가 smooth 하게배치되지않은경우 overshoot 하지않음 spine보다계산이덜복잡함 38

pchip vs. spline 39

Basic Fitting Tool 이용한보간 40

Quiz 다음데이터들을 spline, linear, pchip 보간법을이용하여그려보자. 각 그래프에데이터점들도함께표시하여보자. x 0 1 2 3 4 5 y 1-0.6240-1.4704 3.2402-0.7363-6.3715 41

Quiz Sol. 다음데이터들을 spline, linear, pchip 보간법을이용하여그려보자. 각 그래프에데이터점들도함께표시하여보자. x 0 1 2 3 4 5 y 1-0.6240-1.4704 3.2402-0.7363-6.3715 42

2 차원보간법 griddata(x, y, z, X, Y, 보간방법 ) 임의의데이터점에대해 2차원보간 x, y, z 입력데이터에대한 x, y, z 좌표값 X, Y 보간할 X-Y plane의 grid 좌표값 보간방법 nearest : 가장근접한이웃보간 linear : 선형보간 ( 기본값 ) cubic : 삼각형기반 3차보간 43

주어진 3 차원데이터의보간 44

보간방법에따른그래프의모양변화 nearest : griddata(x,y,z,x,y, nearest ) nearest : griddata(x,y,z,x,y, natural ) 45

보간 방법에 따른 그래프의 모양 변화 nearest : griddata(x,y,z,x,y, nearest ) natural : griddata(x,y,z,x,y, natural ) linear : griddata(x,y,z,x,y, linear ) 46

47