개의 관측치에 복수의 특성치가 대응될 수 있다는 특징을 가지게 된다. 인도부페 프로세 스로 대표되는 잠재특성모형에 대한 이론 및 응용 연구는 현재 베이지안 연구자들 사이에 가장 뜨거운 주제 중 하나이다. 잠재변수를 이용한 모형화는, 베이지안 모형에서의 핵심적인 기법 중

Size: px
Start display at page:

Download "개의 관측치에 복수의 특성치가 대응될 수 있다는 특징을 가지게 된다. 인도부페 프로세 스로 대표되는 잠재특성모형에 대한 이론 및 응용 연구는 현재 베이지안 연구자들 사이에 가장 뜨거운 주제 중 하나이다. 잠재변수를 이용한 모형화는, 베이지안 모형에서의 핵심적인 기법 중"

Transcription

1 인도부페 프로세스의 소개: 이론과 응용 이영선, 이경재, 이광민, 이재용, and 서진욱 서울대학교 통계학과 서울대학교 컴퓨터공학부 March 6, 05 서론 000년대 초반부터 일단의 컴퓨터 공학자들은 비모수 베이지안 모형이 기계학습(machine learning)분야에 사용될 수 있다는 사실에 주목하였고, 디리크레 프로세스(Dirichlet process; Ferguson, 973), 피트만-요 프로세스(Pitman-Yor process; Pitman과 Yor, 997), 종 추출모형(species sampling model; Pitman, 996) 등을 이용한 혼합모형을 문서 데이터 마이닝(text mining), 이미지 데이터 마이닝(image mining) 등의 문제에 적용하였다. 이들 의 연구는 기계학습 연구자들과 비모수 베이지안 연구자들을 연결시켜주는 역할을 하였다. 즉, 비모수 베이지안 모형이 기계학습 연구자들에게 소개되었고, 기계학습 연구자들이 주로 다루는 응용 문제인 문서 자료와 이미지 자료의 분석과 관련된 문제들이 베이지안 연구자 들에게 소개되는 효과를 가져오게 되었다. 그들은 기존에 존재하는 비모수 베이지안 모형을 새로운 접하게 된 문제들에 적용하 는 것에 그치지 않고, 문제에서 요구되는 것에 따라 다양한 베이지안 모형과 방법론을 개발하였다. 대표적인 모형이 바로 인도부페 프로세스(indian buffet process; Griffiths와 Gharahmani, 006)이다. 인도부페 프로세스는 006년에 Griffiths와 Ghahramani에 의해 처음 제안된 통계모형이다. 디리크레 프로세스나 종추출모형에 기반한 잠재변수모형은 한 개의 관측치와 한 개의 특성치가 대응되는데 반해, 인도부페 프로세스를 이용한 모형은 한

2 개의 관측치에 복수의 특성치가 대응될 수 있다는 특징을 가지게 된다. 인도부페 프로세 스로 대표되는 잠재특성모형에 대한 이론 및 응용 연구는 현재 베이지안 연구자들 사이에 가장 뜨거운 주제 중 하나이다. 잠재변수를 이용한 모형화는, 베이지안 모형에서의 핵심적인 기법 중 하나이다. 디리 크레 프로세스 혼합모형(Dirichlet process mixture model)은 잠재변수의 분포를 디리크레 프로세스에서 추출된 랜덤 확률분포로 모형화하는 방법이고, 디리크레 프로세스 혼합모 형에서 확장된 종추출 혼합 모형(species sampling mixture model)은 잠재변수의 분포를 종추출모형에서 추출한 랜덤 확률분포로 모형화한 것이다. 디리크레 프로세스 혼합모형과 종추출 혼합모형은 주로 군집화의 목적으로 사용되는데, 이러한 방법들은 군집의 개수를 사 전에 고정할 필요가 없으며 모형을 적합하는 과정에서 군집의 개수가 자동으로 추정된다는 장점이 있다. 이 때, 자료의 군집화는 관측치 한 개 마다 하나의 잠재변수(latent variable) 혹은 잠재특성(latent feature)을 대응시켜, 잠재변수의 값이 동일한 관측치들은 동일한 군 집에 속하도록 함으로써 이루어진다. 디리크레 프로세스 혼합모형은, 통계학뿐만 아니라 다양한 분야에 적용되어 엄청난 성공을 거두게 되었고, 따라서 비모수 베이지안 모형의 대표적인 모형으로 자리 잡았다. 하지만, 이러한 방식의 모형화는 관측치끼리 공통된 특성을 가질 수도 있고 서로 다른 특성을 가질 수도 있는 자료에는 사용될 수 없다. 예를 들면, 한 장의 사진은 사람, 나무, 고양이 등 복수의 특성을 포함할 수 있고, 또한 이 특성은 여러 장의 사진이 공통으로 가질 수 있는 특성이 되기도 한다. 잠재특성모형(latent feature model)이란, 이와 같이 한 개의 관측치가 여러 개의 특성을 가질 수 있고, 각 특성이 복수의 관측치의 공통된 특징이 될 수 있는 모형을 통칭한다. 인도부페 프로세스는 잠재특성에 대한 모형화를 위해 만들어진 프로세스이다. 디리크 레 프로세스와 마찬가지로 인도부페 프로세스를 이용한 모형에서는 특성의 개수가 모형을 적합하는 과정에서 자연스럽게 추정된다. 인도부페 프로세스가 무한개의 특성을 가질 수 있다는 성질 때문에, 인도부페프로세스는 잠재특성모형 외에도 다양한 형태의 모형에 적 용될 수 있으며 특히 복잡한 구조를 가진 자료에 적합한 모형을 만드는데 이용될 수 있다. 인도부페 프로세스를 통해 실제 자료에 의해 나타나는 특성의 갯수를 자연스럽게 추정할 수 있다는 점, 그리고 이를 이용한 모형이 복잡한 구조의 자료를 설명하기에 적절하다는 사 실 때문에, 인도부페 프로세스에 관한 연구는 000년 후반부터 베이지안 연구자들의 연구

3 주제 중 큰 축을 담당하게 된다. 인도부페 프로세스에 관한 이론적인 결과 중 하나는 Thibaux와 Jordan이 인도부페 프 로세스와 베타 프로세스의 연관성을 밝힌 것으로, 인도부페 프로세스로 생성된 교환가능한 특성의 디 피네트 측도(de Finetti measure) 가 베타 프로세스가 된다는 사실이다(Thibaux 와 Jordan, 007). 인도부페 프로세스를 이용한 모형의 추론을 위해 마코프체인 몬테카를로 (Markov chain Monte Carlo, MCMC) 알고리듬을 이용할 때 계산 시간이 길어 현실적으로 모형 적합이 어려운 경우들이 있는데, 베타프로세스와 인도부페 프로세스와의 관련성이 밝혀지면서 이러한 문제들을 어느 정도 해결할 수 있는 새로운 마코프체인 몬테카를로 알고리듬들이 등장하게 된다. 현재까지 제안된 인도부페 프로세스의 대표적인 마코프체 인 몬테카를로 알고리듬은, 인도부페 프로세스의 막대자르기(stick-breaking) 성질을 이용 한 알고리듬(Teh 등, 007), 포아송 프로세스(Poisson process)의 성질을 이용한 알고리듬 (Paisley 등, 0) 등이 있다. 그러나 확률적 근사에 기반한 마코프체인 몬테카를로 알고리듬들은 이러한 개선에도 불구하고, 여전히 방대한 양의 자료에 적용하기 어렵다는 문제가 존재했다. 이를 해결하기 위해 마코프체인 몬테카를로 알고리듬의 대안적 방법인 변분 방법(variational method)이 등장하게 된다. 자료의 차원이 클 때, 인도부페 프로세스를 이용한 모형의 추론에 변분방법 을 이용하는 것이 마코프체인 몬테카를로 방법보다 더 효과적일 수 있다는 사실이 연구를 통해 밝혀졌다(Doshi 등, 008). 이와 더불어 컴퓨터의 병렬계산을 이용한 분산처리를 통해, 근사적으로 인도부페 프로세스를 이용한 모형을 추론하려는 노력도 함께 있어 왔다(Doshi 등, 009). 인도부페 프로세스와 베타프로세스와 관계는, 인도부페 프로세스의 확장에도 큰 영향을 주었다. 인도부페 프로세스의 확장은 두 방향으로 진행되고 있는데, 첫째는 인도부페 프로세 스를 두 개 이상의 모수를 가지도록 확장하는 것이고(Teh 등, 009; Griffiths와 Gharahmani 0) 둘째는, 중국식당 프로세스(Chinese restaurant process)와 비슷한 방법으로, 공변량 과의 종속성을 부여하거나 계층성(hierachy)를 고려하여 어떤 특수한 구조를 갖는 인도부페 프로세스의 형태로 확장하는 것이다. 물론 이 둘을 융합한 확장도 생각할 수 있다. 즉, 두 개 이상의 모수를 가지면서 특수한 구조를 갖는 인도부페 프로세스에 대해 고려하는 것을 말한 다. 특수한 구조를 갖는 인도부페 프로세스의 확장으로는 공변량이 존재할 때 공변량 간의 유사성을 바탕으로 비슷한 특성을 공유하게 만드는 종속 인도부페 프로세스(dependent 3

4 IBP, dibp; Williamson, 00), 베타프로세스의 성질을 바탕으로 하여 계층적으로 공변량 종속성 가지게 하는 종속 계층 베타프로세스(hierarchical Beta process, dhbp; Zhou 등, 0), 커널 베타프로세스(kernel Beta process; Ren 등, 0) 등이 있다. 이 논문에서는 인도부페 프로세스에 대해 소개하고자 한다. 장에서는 인도부페 프로세 스의 이론, 3장에서는 인도부페 프로세스를 이용한 베이지안 모형의 계산 방법들을 소개한 다. 4장에서는 모의 자료와 실제 자료에 적용한 예들을 보여주고, 5장에서는 실제 인도부페 프로세스가 이용되고 있는 응용분야에 대해 언급한다. 인도부페 프로세스 이론. 인도부페 프로세스의 유도 잠재특성모형은 다음과 같이 구성된다. 만약 D차원으로 표현 가능한 개의 관측치가 있 다고 하면, 이 관측치는 D차원의 의 행렬로 나타낼 수 있다. 잠재특성모형에서 k 번째 잠재특성을 fk = (fk, fk,, fkd )T 의 벡터로 표현할 때, K개의 잠재특성은 행렬, F = [f f f K ]T 로 나타낼 수 있다. i번째 관측치인 xi = (xi,, xid )T 는 잠재특성으 로부터 영향을 받는다고 가정한다. 즉, p( F )의 형태로 관측치를 모형화할 수 있는 경우, 이를 잠재특성모형이라고 부른다. 일반적으로 F 행렬은 다시 두 개의 요소로 나뉠 수 있다. 하나는 이진행렬인 Z이고, 다른 하나는 각 잠재특성의 가중치를 나타내는 행렬인 V 이다. 이때, F = Z V 로 나타낼 수 있다. 여기서 는 두 행렬의 원소별 곱을 의미한다. Z의 (i, k) 원소인 zik 는 0 또는 의 값을 가지며 이는 i번째 관측치가 k번째 특성을 포함하고 있는지의 여부를 나타낸다. Z 행렬을 간단한 그림으로 나타내면 다음과 같다. Figure : 이진행렬 Z의 도식. 4

5 인도부페 프로세스는 이러한 이진행렬 Z에 가정할 수 있는 모형 중 하나이다. 인도부페 프로세스를 이용하여 Z를 모형화 하는 것의 장점은, 군집 구조를 모형화 하는 중국식당 프로세스와 마찬가지로, 잠재적인 특성의 갯수를 무한한 것으로 가정하며 따라서 특성의 갯수를 자료로부터 자연스럽게 추론할 수 있다는 것이다. 무한개의 특성을 가질 수 있는 특성모형을 무한특성모형(infinite feature model)이라고 부른다. 무한특성모형은 유한특성모형으로부터 유도할 수 있다. 유한특성모형이란 고정된 K개의 특성을 가진 이진행렬에 관한 모형으로, 다음과 같이 나타낼 수 있다. α iid µk Beta, (k =,..., K) K () ind zik µk Bernoulli(µk )(i =,..., n) 위 모형으로부터 계산된 이진행렬 Z의 주변확률은 다음과 같다.! K Z Y Y P (Z) = p(zik µk ) p(µk )dµk = = k= K Y i= B(mk + k= K α Y Γ(mk K α, mk K α B( K, ) + ) () α +K )Γ( mk + ) α Γ( + + K ) k= K 일 때의 ()의 극한분포를 찾기 위해서는 이진행렬의 동등클래스(equivalence class)를 정의할 필요가 있다. 동등클래스는 이진행렬에 대한 lof ( )함수를 이용해서 정의할 수 있으며, 임의의 이진행렬은 이 함수를 통해 왼쪽정렬(left-ordered) 이진행렬로 변환된 다. 왼쪽정렬 이진행렬이란, 열에 의해 표현되는 이진숫자의 크기에 따라 왼쪽에서부터 오른쪽으로 차례로 정렬한 행렬을 뜻한다. 동일한 왼쪽정렬 이진행렬을 갖는 이진행렬들이 동등클래스에 속하며, 이를 [Z]로 표기한다. [Z]의 분포는 다음과 같이 나타낼 수 있다. P ([Z]) = P (Z) Z [Z] K! = Q h=0 K Y α Γ(mk K α +K )Γ( mk + ) α Γ( + + K ) Kh! k= (3) 위 식에서 mk 는 k번째 특성을 가지고 있는 관측치의 갯수를 의미하며, Kh 란 동일한 히스 토리를 갖는 열의 갯수를 뜻한다. 히스토리는 개만큼의 이진수들을 갖는, 즉, 길이가 5

6 인 이진수열의 경우들을 의미한다. 따라서 히스토리의 경우의 수는 모든 값이 0인 경우를 제외하면, 개가 된다. 동일한 히스토리를 가진 열끼리는 순서를 바꿔도 동일한 이 진행렬을 구성하게 되므로, 동일한 히스토리의 갯수를 세어 왼쪽정렬 이진행렬의 확률을 계산하여야 하고 총 K개의 열이 있는 경우에는 결과적으로 (3)와 같은 식으로 정리할 수 있다. 위 동등이진행렬의 확률을 정리하여 K를 극한으로 보내면, + K Y ( mk )!(mk )! P ([Z]) = Q exp{ α } j k=! j= h=0 Kh α K+ (4) 으로 나타낼 수 있다. 여기서 K+ 는 전체 관측치가 갖는 총 특성의 갯수를 뜻한다. 동일한 왼쪽정렬 이진행렬을 갖는 동등클래스에 대한 확률인 (4)는 어떠한 확률과정으 로부터 정의될 수 있는데, 이 확률과정을 바로 인도부페 프로세스라고 부른다. 인도부페 프로세스는 무한개의 요리가 있는 인도부페에서 차례로 들어온 손님이 요리를 선택하는 과정으로 설명할 수 있다. 이진행렬의 행에 해당하는 관측치를 손님, 열에 해당하는 특성 을 요리로 각각 간주한다. 첫 번째 들어온 손님은 P oisson(α)로부터 생성된 갯수만큼의 요리를 왼쪽부터 차례로 선택한다. i번째 손님은 앞선 손님이 선택한 요리들을 mk /i의 확 률로 선택하고, 아무도 선택하지 않은 요리를 P oisson(α/i)의 갯수만큼 선택한다. mk 란 k 번째 요리를 선택한 손님의 수이다. 이러한 과정들을 계속해 나가면 무한개의 특성을 가 진 이진행렬를 생성할 수 있다. 이 프로세스를 통해 생성된 이진행렬 Z는 다음의 확률을 갖는다. K+ Y ( mk )!(mk )! exp{ α } (i) j k=! K! j= α K+ P (Z) = Q i= (i) 위 식에서 K 란 행기준으로 i번째 행에서 처음 나타난 특성의 갯수를 뜻한다. 이진행렬 Z가 위와 같은 확률과정을 따를 때, Z IBP (α)로 표기한다. 인도부페 프로세스로부터 생성되는 이진행렬에 대한 확률을 동일한 왼쪽정렬 이진행렬 을 갖는 동등클래스 대한 확률로 변환하면, + K Y ( mk )!(mk )! P ([Z]) = Q exp{ α } j k=! j= h=0 Kh αk+ 와 같고, 이는 유한특성모형으로부터 유도된 무한특성모형의 동등클래스의 확률과 동일 하다. 6

7 그러나 위에서 정의된 확률과정으로부터 생성된 이진행렬로부터 정의되는 특성은 교환 가능하지 않다. 따라서 Z IBP (α)를 가정했을 때의 모형의 추론을 위해서는, 왼쪽정렬된 형태의 이진행렬을 이용해야한다. 왼쪽정렬 이진행렬은 행에 대해 교환가능하며, 따라서 마코프체인 몬테카를로 알고리듬을 통해서 표집하는 행을 마치 마지막 행인 것처럼 생각할 수 있게 된다.. 베타프로세스와의 관련성 교환가능한 확률변수열 (Z,..., Zn )이 Q라는 분포를 따른다고 가정하면, 디 피네트의 정리 (de Finetti theorem)에 따라 iid Z,..., Z n P P 를 만족하는 측도 P 가 항상 유일하게 존재한다. 즉, 디 피네트 정리란 교환가능한 확률변 수열을 조건부 독립으로 만드는 측도의 존재성에 대한 정리이다. 이는 다시 표현하면 P(Z,..., Zn ) = Z Y n P (Zi )P(dP ) (5) i= 와 같이 쓸 수 있다. 여기서 P는 해당 랜덤원소(random element)의 측도를 나타낸다. 중국레스토랑 프로세스의 경우 (5)을 만족하는 디 피네트 측도가 디리크레 프로세스임이 알려져 있다. 인도부페 프로세스를 따르는 왼쪽정렬 이진행렬은 교환가능하기 때문에 디 피네트 측도가 존재한다는 사실은 보장이 된다. 그러나 그 정확한 모양은 알려지지 않았다. 많은 베이지안 연구자들이 중국레스토랑 프로세스와 인도부페 프로세스의 이론적인 대칭 성을 원했기 때문에 인도부페 프로세스에서도 (5)에 해당하는 측도를 찾는 것이 한동안 큰 관심사였고, 이를 처음 밝힌 것은 Thibaux와 Jordan이었다. 그들은 베타프로세스(Beta process)와 베르누이프로세스(Bernoulli process)의 관련성 을 이용하여 베타프로세스가 인도부페 프로세스로부터 생성된 확률변수열에 대한 디 피 네트 측도가 된다는 것을 보였다. 즉, B가 베타프로세스를 따르고 Z,..., Zn B가 서 로 독립이면서 B를 기저측도(base measure)로 가지는 베르누이프로세스를 따른다고 할 때, Z,..., Zn 의 주변분포가 인도부페 프로세스가 된다는 것을 밝혔다(Thibaux와 Jordan, 007). 7

8 계산 3 인도부페 프로세스를 가정한 모형의 추론을 위한 알고리듬은, 모형의 종류에 따라 그 방법 이 매우 다양하다. 본 논문에서는 가우시안 선형모형(Gaussian linear model)에 대한 추론 알고리듬을 소개한다. 인도부페 프로세스를 이진행렬에 대한 분포로 가정했을 때의 가우시안 선형모형은 다 음과 같다. xi z i, A, σ D (AT z i, σ I)(i =,, ) ak σa D (0, σa I)(k =,, K) Z α IBP (α) 위 모형에서 Z는 각 관측치가 특성을 포함하는지 여부에 대한 이진행렬이며, z i 는 이진 행렬의 i번째 행을 뜻한다. ak 들은 특성으로 이해할 수 있으며, A = [a ak ]T 이고 이를 특성행렬이라고 부른다. xi 는 D차원의 벡터로 i번째 관측치를 뜻하며, = [x xn ]T 은 에 대한 오차의 크기, σa 은 A에 대한 오차의 크기를 뜻하며, α는 인도부페 이다. σ 프로세스의 모수이다. 본 논문에서는 가우시안 선형모형의 추론을 위한 알고리듬으로, 사후분포로부터 모수를 표집하여 추론하는 마코프체인 몬테카를로 방법을 이용한 알고리듬과 사후분포의 근사분 포를 최적화하는 추정값을 직접 찾는 변분방법을 이용한 알고리듬을 소개한다. 마코프체인 몬테카를로 방법을 이용한 알고리듬 중, 인도부페 프로세스에서 생성된 왼쪽정렬 이진행렬 의 교환가능한 성질에 기반한 것을 깁스표집(Gibbs sampling) 알고리듬, 그리고 인도부페 프로세스의 막대자르기 표현에 기반한 알고리듬인 막대자르기 알고리듬이라고 명명한다. 3. 깁스표집 알고리듬 깁스표집 알고리듬을 이용하기 위해서는, 먼저 추론하고자 하는 모수에 대한 사후분포를 구 하여야 한다. 편의를 위해 확률변수 Y 가 주어졌을 때 확률변수 의 조건부 분포를 간략하게 [ Y ]로 표현하자. 이 표현을 이용하면 특성행렬 A와 이진행렬 Z를 추론의 대상이라고 할 때, A와 Z의 사후분포를 [A, Z, σ, σa, α]로 나타낼 수 있다. 여기서 σ, σa, α는 고정된 모수라고 가정하면, 사후분포는 [A, Z ]로 표현할 수 있다. 8

9 사후분포로부터 A와 Z를 표집하는 방법은 두 가지가 있는데, 첫째는 A, Z는 각각의 조건부 사후분포인 [A Z, ]와 [Z A, ]에서 표집하는 것이고, 둘째는 [Z ]에서 Z를 표집하고 [A Z, ]로부터 A를 차례로 표집하는 것이다. 첫 번째 방법을 비붕괴깁스표집 (uncollapsed Gibbs sampler), 두 번째 방법을 붕괴깁스표집(collapsed Gibbs sampler)이라 고 부른다. 구체적인 표집방법은 다음에 설명한다. 3.. 비붕괴깁스표집 알고리듬은 기존에 나타난 특성에 대해 이진행렬의 각 원소를 표집하는 과정과 새로운 특성 을 추가하는 과정, 그리고 A를 표집하는 과정으로 나눌 수 있다. 사후분포로부터 이진행렬 Z를 표집할 때는, 각 관측치에 대한 반복마다 기존에 존재하는 특성들을 포함여부를 결정 하는 과정과 새로운 특성을 얼마나 추가할지를 결정하는 과정이 필요하다. i번째 관측치가 기존에 존재하는 특성을 포함할지에 대한 여부는 m ik p( Z, A) m ik p(zik = 0 z ik, A, ) p( Z, A) p(zik = z ik, A, ) (6) 를 기반으로 한다. 이 식에서 m ik 는, 이진행렬의 k번째 열에서 i번째 원소를 제외한 나머지 원소 중 의 값을 갖는 원소의 갯수를 뜻한다. 새로운 특성은 p(knew ) P oisson(knew ; α )p( Znew, Anew ) (7) 의 확률에 근거하여 표집한다. 이 식에서 Z new, Anew 는 새로운 특성의 갯수만큼 새로 사전 분포로부터 생성된 이진행렬과 특성행렬을 뜻한다. A를 표집하기 위해서는 평균이 µa, 분산이 ΣA 인 행렬 정규분포를 이용한다(Doshi와 Ghahramani,009): σ µa = Z Z + I ZT σa σ T ΣA = σ Z Z + I. σa T 9

10 3.. 붕괴깁스표집 붕괴깁스표집방법은, 비붕괴깁스표집방법에서 자료와 A가 주어진 상황에서 Z를 표집하는 것과 달리, 자료만 주어진 상황에서 Z를 표집하고 그 후 A를 표집하는 방법이다. 붕괴깁스 표집 알고리듬은, 비붕괴깁스표집 알고리듬에서 이진행렬을 표집하는 방법인 (6), (7)에서 p( Z, A)대신 p( Z)를 대입한 것과 동일하다. A를 표집하는 방법은 비붕괴깁스표집 에서와 같다. 3. 막대자르기 알고리듬 인도부페 프로세스를 () 같은 유한특성모형에서 K 으로 확장한 무한특성모형으로 생각할 수 있다는 것은 이미 밝혔다. 하지만 특성의 갯수 K가 무한으로 확장되는 상황에서 µk 를 사후분포로부터 표집하는 것이 사실상 불가능하기 때문에, Teh 등(007)은 이러한 문제를 해결하며 무한특성모형의 µk 들을 표현하기 위하여 다음의 사실을 이용하였다 : iid µ,..., µk Beta(α/K, )이라고 할 때, 이들의 순서통계량인 µ() >... > µ(k) 의 분포는 iid νk Beta(α, )(k =,..., K) µ(k) = νk µ(k ) = k Y (8) νl l= 와 같다. 이 사실을 이용하면, (8)의 표현을 사용하여 베타분포를 따르는 확률변수들인 νk 를 특성의 갯수만큼 표집하고 이를 바탕으로 각 특성의 출현 확률인 µk 의 순서통계량을 구할 수 있게 된다. 이것을 인도부페 프로세스의 막대자르기 표현이라고 한다. 막대자르기 표현에서도 사후분포 추론을 위해서는 특성의 갯수를 유한개로 제한해야 하는데, 이것을 임의로 절단하는 것은 오차를 포함하는 근사를 사용하게 된다는 의미가 된다. 또한 절단의 정도가 자연스럽게 결정되는 것이 아니라 사용자가 선택을 해야하기 때문에, 모형선택의 문제가 발생하게 된다. 이는 보조변수 s를 도입하는 슬라이스 샘플러 (slice sampler)를 사용함으로써 해결된다(Teh 등, 007). 보조변수를 생각할 때, 어떻게 절단 정도가 결정이 되는지를 살펴보자. 먼저 보조변수 s 를 아래와 같이 두고 s Z, µ(: ) U nif orm[0, µ ], µ := min{, min µ(k) }, k: i,zik = 0 (9)

11 이를 이용하면 행렬 Z의 조건부분포를 p(z, s, µ(: ) ) p(z, µ(: ) ) I(0 s µ ) µ 와 같이 구할 수 있다. 즉, 보조변수 s가 절단기준이 되어 전체 특성 중 s보다 큰 특성들만 남고 나머지 특성에 해당하는 Z의 열은 0이 되어 고려대상에서 제외되게 된다. s < µ(k) 를 만족하는 가장 큰 인덱스를 K+ 라 하고, 그 인덱스보다 작은 특성들을 활성화 된 특성들이 라고 부른다. 보조변수 s를 포함하여 추론을 진행하는 다음 일련의 과정을 막대자르기 알고리듬이라 고 부른다. 보조변수 s에 대한 표집은 (9)를 이용하여 균일분포에서 진행한다. 새로운 s를 뽑은 후 k = K+ +, K+ +,...에 대하여 p(µ(k) µ(k ), z :,k = 0) exp α n i= i! ( µ(k) )i n µα (k) ( µ(k) ) I(0 µ(k) µ(k ) )(0) 에서 µ(k) s를 만족할 때 까지 발생시킨 뒤, 이 중 µ(k) > s를 만족하는 특성들을 활성 화 된 특성에 추가하여 K+ 를 갱신한다. 이 때, 새롭게 활성화 된 특성들에 대한 z :,k = (zk,..., znk )T 는 0으로, ak = (ak,..., akd )T 는 사전분포에서 뽑아놓는다. (0)의 분포가 log µ(k) 에 대하여 로그 오목(log concave) 성질을 가지므로, 적응기각표집(adaptive rejection sampling, ARS)을 사용한다. 이진행렬 Z에 대한 추론을 할 때에는 다음의 사후분포 µ(k) p(zik = z ik, A, ) p(xi z i, k, zik =, A) µ µ(k) p(zik = 0 z ik, A, ) p(xi z i, k, zik = 0, A) µ 에서 k K+ 인 특성들을 갱신한다. 위 식에서 z i, k 는 이진행렬의 i번째 열에서 k번째 원소를 제외한 것을 뜻한다. 순서를 매긴 특성의 출현 확률인 µ(k), k =,..., K + 의 사후분포는 k p(µ(k) µ(k ), µ(k+), Z) µm ( µ(k) )n mk I(µ(k+) µ(k) µ(k ) ) (k) 과 같이 주어지고, µ(k+ ) 의 사후분포는 (0)가 된다. 여기서 mk = Pn i= zik 이다. () (0)와 ()은 각각 log µ(k) 와 µ(k) 에 대하여 로그 오목 성질을 만족하므로 적응기각표집 방법을 이용해서 표집한다. 특성행렬 A는 깁스표집 알고리듬과 동일한 다변량 정규분포로부터 표집한다.

12 3.3 변분 방법 사후분포를 직접 계산하기 어려운 경우, 다루기 쉬운 분포들의 집합인 Q를 생각하고, 그 중에서 목표로 하는 사후분포와 쿨백-라이블러 발산(Kullback-Leibler divergence)이 가장 작은 분포를 찾음으로써 사후분포에 대해 추론한다. 만일 Q가 모든 분포의 집합이 된다면, 사후분포 그 자체가 자신과의 쿨백-라이블러 발산이 0으로 가장 작기 때문에 정확한 사후 분포를 구할 수 있으나 실제로 이를 구하는 것은 불가능 하기 때문에 최대한 유사한 분포 찾아 근사적으로 추론하는 것을 목표로 한다. 인도부페 프로세스를 이진행렬의 사전분포로 이용한 가우시안 선형모형에서 추정해야하 는 모수는 µ(: ), Z, A이다. 고정된 값을 가지는 초모수(hyperparameter)를 θ = (σ, σa, α) 라고 나타내고 추정해야 할 모수를 W = (µ(: ), Z, A)로 나타낼 때, 사후분포의 로그가 능도함수를 정리하면 다음과 같다. log p(w, θ) = log p(w, θ) log p( θ). () 이 때, 일반적으로 p( θ)의 형태를 알기 어렵기 때문에, 변분 방법을 통해 p(w, θ)를 근사적으로 추론하게 된다. 즉, 쉽게 다룰수 있는 분포의 집합에서 쿨백-라이블러 발산인, D(q(W ) p(w, θ))를 최소로 하는 q Q를 찾아 이를 사후분포에 대한 근사로 사용한 다. 그러나 쿨백-라이블러 발산을 직접 최소화하는 것이 어렵기 때문에, p( θ)의 하한을 q 를 통해 표현하고 그것을 최대화하는 방법으로 쿨백-라이블러 발산을 최소화 하는 q를 찾게 된다. 이것은 아래 식에 의해 정당화 된다. p( θ) = Eq [log(p(, W θ)] + H(q) + D(q p) Eq [log(p(, W θ)] + H(q) (3) 변분 방법을 이용한 추론 알고리듬은 인도부페 프로세스를 유한특성모형으로 근사한 후 이와 쿨백-라이블러 발산이 최소인 q를 찾는 방법과, 인도부페 프로세스를 막대자르기 표현으로 생각하고 이와 쿨백-라이블러 발산이 최소가 되게하는 q를 찾는 방법이 있다. 이를 각각 유한변분방법(finite variational mehtod)와 무한변분방법(inifinite variational method)이라고 부른다.

13 3.3. 유한변분방법 인도부페 프로세스를 유한특성모형으로 나타낸 것은 ()와 같다. 가우시안 선형모형에서 고 려하는 분포의 집합 Q는 아래와 같이 τ, φ, Φ, ν에 의해 각 모수에 대해 독립적으로 정의할 수 있다. qτk (µk ) = Beta(τk, τk ) qφk (ak ) = D (φk, Φk ) qνnk (znk ) = Bernoulli(νnk ) 따라서 q(w ) = qτ (µ)qφ (A)qν (Z)로 쓸 수 있다. pk 를 인도부페 프로세스를 유한특성모 형으로 나타낸 가우시안 선형모형이라고 하면, 위와 같은 분포 가정 하에서 D(q pk )를 최소로 하는 τ, φ, Φ, ν를 찾는 것이 추론의 목적이 된다. 이를 위해서는 log pk ( θ)의 하한을 최대화하는 값들을 찾아야 한다. 하한을 최대로 하는 값들은 수치적 최적화방법 을 통해 τ, φ, Φ, ν를 갱신하는 방법으로 구한다. 갱신을 위한 식은 아래와 같다(Doshi 등, 008). + σa Φk = " φk = P n= νnk σ! I # νnk ( n ( νnl φl )) σ n= l:l6=k + σa P n= νnk σ! + e α νnk = K n= νnk = τk τk = + νnk n= 위 식에서 은 ψ(τk ) ψ(τk ) (tr(φk ) σ 나타낸다. 3 + φk φtk ) + T φk ( n σ ( P l:l6=k νnl φtl ))를

14 3.3. 무한변분방법 무한변분방법에서는 인도부페 프로세스의 막대자르기 표현을 이용한 모형인 (8)을 사용한 다. 무한변분방법이라는 이름을 붙이기는 하였지만, 사실상 이 방법에서는 무한개의 막대를 생각하지 않고 유한개의 K까지 절단한 막대를 이용하여 근사한 모형을 이용하게 된다. 분포의 집합인 Q는 유한변분모형에서와 동일하게 정의하고 pk 를 인도부페 프로세스를 절단된 막대자르기 표현으로 나타낸 가우시안 선형모형이라고 하면, 추론의 목적은 이러한 가정하에서 쿨백-라이블러 발산인 D(q pk ) 을 최소로 하는 τ, φ, Φ, ν를 찾는 것이 된다. 이를 위해서는 유한변분모형에서와 같이 log pk ( θ)의 하한을 최소로 하는 τ, φ, Φ, ν를 찾아야 하며, 역시 최적화 방법을 통해 반복적으로 갱신 하는 방법을 이용한다. 갱신을 위한 식은 아래와 같다. + σa Φk = " φk = P n= νnk σ! I # νnk ( n ( νnl φl )) σ n= l:l6=k + e K K = α+ νnm + + σa P n= νnk σ! νnk = τk m=k n= τk = + K! m νnm n= m=k+! qmi i=k+! νnm qmk n= m=k h i Q 위 식에서 = i= (ψ(τi ) ψ(τi +τi )) Ev log( km= vm ) σ (tr(φk )+φk φtk )+ P Qk T T φk ( n ( l:l6=k νnl φl ))이다. 위 갱신식을 위해서는 Ev [log( m= vm )]를 계산해야 σ Pk 하는데, 이 계산 역시 하한으로 근사하여 계산한다. 즉, " #!! k k k k Y Ev log( vm ) qkm ψ(τm ) + ( qkn )ψ(τm ) m= m= k m= n=m+ ( k! qkn )ψ(τm + τm ) m= n=m 이며, 여기서 qki exp(ψ(τi ) + Pi m= ψ(τm ) 4 k qkm log qkm m= Pi m= ψ(τm + τm ))이다.

15 분석 4 4. 시뮬레이션 분석 무한개의 잠재특성에 관한 모형은 많은 분야에서 적용가능하다. 특히 이미지 자료를 표현 하는 특성, 예를 들면 각 이미지에 포함되어 있는 물체를 찾는 문제 등에 유용하게 적용될 수 있다. 간단한 그림찾기 문제에서 인도부페 프로세스 모형을 이용한 분석을 생각해 보자. Figure 의 왼쪽 첫 번째 행에 표현된 4개의 서로 다른 종류의 그림들이 선형결합되고, 노이즈가 추가되어 얻어진 자료가 주어졌다고 하자. 이 때, 실제 인도부페 프로세스를 이용한 모형 이 이 4종류의 특성을 얼마나 잘 찾아내며 이 특성들의 조합으로 실제 자료가 얼마나 잘 복원되는가를 확인하려고 한다. 시뮬레이션을 통해 4개의 이미지특성의 선형결합으로 이 루어진 00개의 6 6픽셀 그림을 얻었다. 주어진 자료는 00 36의 행렬 형태로 나타낼 수 있다. 이러한 문제에 대한 추론에 적합한 모형은 가우시안 선형모형이며 이진행렬에 대한 모형으로 인도부페 프로세스를 이용하였다. 이 예제를 앞서 소개된 3가지 방법의 알고리 듬(알고리듬: 비붕괴깁스표집, 알고리듬: 막대자르기 알고리듬, 알고리듬3: 변분방법)을 이용하여 추론을 시행했을 때의 결과는 Figure 에서 확인할 수 있다. 이 중 비붕괴깁스표집을 이용했을 때, 반복에 따라 변화하는 이미지 특성의 정보를 특정 반복수 에서의 시계열 그림의 형태로 나타낸 결과는 Figure 3와 같다. 시계열 그림을 통해, 표집이 반복되면서 실제 이미지 자료를 생성한 이미지 특성을 찾아가는 것을 확인할 수 있다. 이를 좀 더 실제적인 고차원 자료에 적용하여 보자. 다양한 표정을 가진 서로 다른 4 명의 실제 얼굴을 바탕으로 하여 노이즈가 추가된 00개의 자료를 생성하였다. 얼굴이미지 는 8 8픽셀로 이루어져있으며 따라서 각각의 관측치는 6384차원의 자료로 생각할 수 있다. 전체 자료는 의 행렬 형태로 나타낼 수 있으며, 이는 자료의 차원이 관측치의 갯수보다 큰 고차원 자료이다. 고차원자료에서의 인도부페 프로세스의 적용은 표집시간이 오래걸린다는 문제가 있다. 이러한 문제를 해결하기 위해서 고차원의 자료를 주성분분석(Principal Components Analysis, PCA)을 이용하여 0개의 차원을 가진 자료로 축소하였고 축소된 자료에 시뮬레이션 자료와 동일한 가우시안 선형모형을 적용하였다. 3 가지 알고리듬을 이용한 추론 결과는 Figure 4에서 확인할 수 있다. 5

16 Figure : 왼쪽 열은 순서대로, 실제 4개의 이미지특성(왼쪽 첫 번째 행), 알고리듬-3을 이용해서 찾은 4개의 이미지특성(왼쪽 두 번째부터 네 번째 행), 오른쪽 열은 순서대로, 4 개의 관측치와 실제 자료를 생성할 때 이용한 이진벡터(오른쪽 첫 번째 행), 알고리듬-3을 이용해서 찾은 이미지특성을 통해 복원한 4개의 자료(오른쪽 두 번째부터 네 번째 행). 첫 번째 알고리듬을 이용해서 찾은 특성은 5개로 나타났지만, 그 중 하나의 특성의 경우 그 특성을 포함하고 있는 관측치의 갯수가 5퍼센트 이하였기 때문에 제외하였다. 두 번째 알고리듬을 이용한 결과는 정확히 4개의 얼굴을 이미지특성으로 찾아냈다. 인도부페 프로 세스를 이용해서 찾은 이미지 특성을 조합하여 복원한 4개의 자료는 노이즈가 있는 원래의 자료에 비해 훨씬 깨끗하고 정확한 이미지를 보여준다. 주성분분석을 이용해 찾은 요인을 이용하여 복원한 자료도 인도부페 프로세스를 이용 한 결과와 거의 비슷한 결과를 준다는 것을 확인할 수 있다. 그러나 주성분분석을 통해 찾은 요인들은 개별적인 얼굴을 이미지 특성으로 정확하게 판별하지 못하는 양상을 보인 다. 이 결과는, 만약 어떠한 자료로부터 자료를 구성하는 특성을 판별하고자하는 목적을 가지고 있는 경우에는 인도부페 프로세스를 이용한 추론이 좀 더 직관적일 수 있다는 것을 보여준다. 두 가지 예제의 결과는 인도부페 프로세스를 이용한 모형이 자료에 내재된 이미지특성을 거의 완벽하게 찾아내고 있음을 확인시켜준다. 또한 찾아낸 이미지특성을 통해 노이즈가 섞인 이미지로부터 선명한 이미지를 복원할 수 있음을 보여준다. 따라서 인도부페 프로세 6

17 Figure 3: 비붕괴깁스표집의 특정 반복수( 0, 0, 00, 000)에 따른 이미지 특성을 나타 낸 시계열 그림 스를 이용한 모형은 여러 개의 이미지 자료로부터 자동차, 사람 등의 특정한 이미지 형태를 구분해 내거나, 노이즈가 있는 이미지로부터 선명한 이미지를 복원하는 문제등에 유용하게 적용될 수 있다는 것을 알 수 있다. 5 응용 이미지 분석 외에도 인도부페 프로세스를 적용할 수 있는 분야는 매우 다양한다. 생물학, 의학 등의 다양한 분야에서 관측할 수 있는 쌍(dyadic) 자료분석, 소셜네트워크서비스와 7

18 Figure 4: 왼쪽 열은 순서대로, 생성한 자료의 실제 4개의 이미지특성(왼쪽 첫 번째 행), 알고리듬-3을 이용해서 찾은 4개의 이미지특성(왼쪽 두 번째부터 네 번째 행), 주성분분 석을 이용해서 찾은 요인(왼쪽 다섯 번째 행), 오른쪽 열은 순서대로, 4개의 관측치와 실제 자료를 생성할 때 이용한 이진벡터(오른쪽 첫 번째 행), 알고리듬-3을 이용해서 찾은 이미 지특성을 통해 복원한 4개의 자료(오른쪽 두 번째부터 네 번째 행), 주성분분석을 이용해서 찾은 요인을 통해 복원한 4개의 자료(오른쪽 다섯 번째 행). 사회학 등에서 이용되는 네트워크 자료분석, 그리고 시그널자료에 대해 적용할 수 있는 독립성분분석 등이 대표적인 예이다. 5. 쌍자료분석 쌍자료는 행렬로 표현할 수 있으며, 쌍자료에 대한 대부분의 모형화는 행렬의 분해를 통 해 이루어진다. 이러한 자료는 영화-관객 평점 자료, 마이크로어레이(microarry array)자료 등이 대표적이다. 마이크로어레이자료 중 유전자발현자료(gene expression data)는 유전자 (gene)과 샘플(sample)이라는 두 개의 영역에서 유전자발현레벨(gene expression level)을 관측한 것을 뜻한다. 8

19 이러한 자료에 대한 분석으로 주로 이용되는 방법은 이중클러스터링(bi-clustring)이다. 이는 행과 열을 그룹화하는 방법으로 혼합모형의 일종이다. 이 모형에서는 행에서의 하나의 특성, 그리고 열에서의 하나의 특성에만 관측치가 속할 수 있다고 가정한다. 즉, 관측치가 하나 이상의 그룹에 포함될 수 없다는 가정이 필요하다. 그러나 관측치가 하나의 그룹에만 포함될 수 있다는 가정은 너무 제한적이다. 예를 들 어 유전자 발현레벨은, 유전자 영역에서 알지 못하는 특성에 의해 영항을 받을 수 있는데 특정 유전자에 영향을 미치는 특성으로써 여러 개의 패스웨이(pathway)등 고려할 수 있기 때문이다. 샘플 영역 또한 알지 못하는 여러 특성에 의해 영향을 받을 수 있다. 만약 샘플을 특정부위에서의 조직이라고 할 때, 각 부위는 여러가지 요인들에 의해서 서로 관련성이 발생할 수 있기 때문이다. Meeds 등(006)에서는 쌍자료들이, 각 행이나 열은 한 개 이상의 숨겨진 특성들과의 관계로 표현이 된다고 생각하고 따라서 자료인 는 U W V T 로 분해될 수 있다고 가정 한다. 여기서 U, V 는 이진행렬이고 W 는 가중치행렬이다. 자료를 이렇게 분해하는 것을 이진행렬분해(binary matrix factorization)이라고 부른다. 이들은 분해된 두 이진행렬인 U, V 에 인도부페 프로세스 모형을 가정한 비모수 모형을 제안했고, 디지트(digit)자료와 유전자발현자료 등의 예제들을 통해서 이러한 모형을 이용한 쌍자료의 추론이 효과적임을 보였다. 5. 네트워크 자료분석 네트워크 자료란, 각 네트워크에 참여한 참여자들과 그들간에 연결고리가 있는지 여부가 주어져 있는 자료이다. 소셜네트워크 자료를 예를 들어보면, 네트워크 참여자는 소셜 네크 워크 서비스 가입자들이고 그들간의 연결고리는 사용자 간에 친구관계에 대한 것이라 볼 수 있다. 총 참여자가 명이라 한다면 네트워크 자료는 행렬에 i번째 참여자와 j번째 참여 자간에 연결 여부에 따라 행렬의 (i, j)원소의 값이 또는 0이 되는 자료형태이다.네트워크 자료의 생성 바탕에는 각 연결고리가 연결될지에 대한 확률 값이 내재되며 그 확률에 따라 네트워크 자료가 발현되었다고 볼 수 있다. 각 연결고리에 대한 확률은 참여자의 속성이 서 로 잘 맞는지에 따라 다른 값을 가지게 될 것이라 가정한다. 예를 들어 참여자은 축구취미 9

20 속성을 가지고 있고, 참여자는 농구취미 속성을 가지고 있고, 참여자3은 서예취미 속성을 가지고 있을때, 참여자과 참여자 간에 친구관계가 될 확률은 높을 것이지만, 참여자과 참여자3 간에 친구관계에 대한 확률은 낮을 것이다. 연결고리에 대한 확률을 위해서는 각 참여자들의 특성여부를 나타내는 이진행렬이 필 요하고, 각 특성간에 확률에 어떤 영향을 줄지에 대한 계수행렬도 필요하다. µ는 행렬로서 각 연결고리에 대한 확률이고, Z는 K행렬로서 모든 참여자의 특성여부를 나타내는 이진행렬이며, W 는 K K행렬로서 각 특성 간에 연결에 영향을 끼치는 계수에 대한 행렬이다. 이를 일반화 선형모형으로 나타내기 위한 연결함수는 다음과 같다(Foulds, 04). µ = g (η), η = ZW Z T 위 모형에서 Z의 분포에 인도부페 프로세스를 가정할 수 있다. 이러한 모형은, 소셜네트 워크서비스에서 친구 추천의 프로세스에 적용할 수 있다. 즉, 두 참여자 간에 연결되려는 속성이 강하지만 연결되어 있지 않은 경우에 해당 참여자를 친구 추천 목록 띄우는 방식으로 이용할 수 있다. 5.3 독립성분분석 독립성분분석(Independent component analysis, ICA)은 관측된 자료가 서로 독립인 은닉 요인(hidden source)들의 선형결합으로 표현되었다고 가정하는 모형이다. 각각의 관측치가 D차원이라고 할 때, n개의 관측치 Y = (y,..., y n )T 를 다음과 같은 형태로 표현할 수 있 다: Y = G +. (4) 여기서 = (x,..., xn )T, xi RK 는 서로 독립인 은닉요인들이고, G = (g,..., g k )T 는 은닉요인들의 선형결합으로 자료를 표현하기 위한 계수 행렬이다. 일반적으로 = iid (,..., n )T, i (0, σ I D )를 가정하며, 은닉요인 xi 에는 다양한 분포를 가정할 수 있다. 위와 같은 독립성분모형에서 은닉요인들의 차원 K의 선택에 유연함을 주면서 베이지 안 방식의 분석을 진행하기 위해 인도부페 프로세스를 적용할 수 있다. = Z V 으로 0

21 표현하면, Z가 인도부페 프로세스를 따르고 V = (v,..., v n )T 는 임의의 분포를 따른다고 생각할 수 있다. 이 때, 인도부페 프로세스의 특징으로 인해 은닉요인의 갯수 K는 제한되 지 않고 자료의 설명에 실제로 사용되는 활성화 된 요인들의 갯수는 확률적으로 유한하게 정해지게 된다. 이진행렬 Z의 성분 zik 는 i번째 관측치의 설명에 k번째 은닉요인이 사용되 는지의 여부를 말해주고, 행렬 V 의 성분 vik 는 그 때 k번째 은닉요인에 곱해지는 계수로 해석된다. Knowles와 Ghahramani (007)는 이러한 모형을 유전자발현 자료를 분석하는데 적용 하였다. 그들은 7개의 유전자(n = 7)와 7개의 조직(D = 7)에 대하여 유전자발현수 준을 나타낸 자료를 이용하였다. 인도부페 프로세스로 이루어진 이진행렬 Z는 표현되지 않는 유전자를 선택하는 역할, 행렬 V 는 활성화 된 유전자의 발현 정도를 나타내는 역할로 해석될 수 있다. 이 외에도 인도부페 프로세스로 이루어진 독립성분분석은 제한되지 않은 요인들의 결합형태로 표현된 자료를 분석하는 분야에 다양하게 응용될 수 있다. 6 결론 본 논문에서는 인도부페 프로세스의 이론과 그 응용에 대해서 소개하였다. 인도부페 프로 세스는 복잡한 자료 구조를 모형화 할 수 있다는 점에서 많은 분야에서 관심을 가지고 있는 비모수 베이지안 모형이다. 또한 인도부페 프로세스는 디리크레 프로세스와 마찬가지로 특성의 갯수가 추론을 통해 자연스럽게 추정되므로, 모형선택의 문제를 해결하며 따라서 모형에 유연성을 부여할 수 있다는 장점을 가진다. 논문에서 소개한 가우시안 선형모형과 그 알고리듬은 인도부페 프로세스 적용할 수 있는 모형의 일부분일 뿐이며, 다양한 문제 상황에 따라 인도부페 프로세스를 이용한 모형을 고려하고 그에 적합한 알고리듬을 개발할 수 있다. 따라서 인도부페 프로세스를 이용한 모형은 많은 가능성을 가지고 있으며 그 연구 범위 또한 무궁무진하다고 본다. 본 논문이 인도부페 프로세스를 처음 접하는 국내 연구 자에게 작은 도움이 되길 바라며, 이러한 기회를 통해 앞으로 인도부페 프로세스에 대한 연구가 국내 연구자들에 의해 지속되기를 바란다.

22 References [] Doshi-Velez, F., Miller, K. T., Gael, J. V. and Teh, Y. W. (008). Variational inference for the Indian buffet process. [] Doshi-Velez, F., Knowles, D., Mohamed, S. and Ghahramamni, Z. (009). Large Scale onparametric Bayesian inference: Data Parallelisation in the Indian Buffet Process, Advances in eural Information Processing Systems. [3] Doshi-Velez, F. and Ghahramani, Z. (009). Accelerated sampling for the Indian buffet process, Proceedings of the 6th Annual International Conference on Machine Learning. ACM. [4] Ferguson, T. S. (973). A Bayesian analysis of some nonparametric problems, The Annals of statistics, [5] Foulds, J. R. (04). Latent Variable Modeling for etworks and Text: Algorithms, Models and Evaluation Techniques Ph.D. thesis, Department of Computer Science, University of California, Irvine. [6] Ghahramani, Z., Griffiths, T. L. and Sollich, P. (007). Bayesian nonparametric latent feature models, Bayesian Statistics, textbf8. [7] Griffiths, T. and Ghahramani, Z. (006). Infinite latent feature models and the Indian buffet process, In Advances in eural Information Processing Systems, 8, [8] Griffiths, T. and Ghahramani, Z. (0). The indian buffet process: An introduction and review, The Journal of Machine Learning Research, [9] Knowles, D. and Ghahramani, Z. (007). Infinite sparse factor analysis and infinite independent components analysis, Independent Component Analysis and Signal Separation,

23 [0] Meeds, E., Ghahramani, Z., eal, R. and Roweis, S. (006). Modeling dyadic data with binary latent factors, Advances in neural information processing systems, [] Paisley, J. W., Blei, D. M., and Jordan, M. I. (0). Stick-breaking beta processes and the Poisson process, International Conference on Artificial Intelligence and Statistics. [] Pitman, J. (996). Random discrete distributions invariant under size-biased permutation, Advances in Applied Probability, [3] Pitman, J. and Yor, M. (997). The two-parameter Poisson-Dirichlet distribution derived from a stable subordinator, The Annals of Probability, [4] Teh, Y. W., Gorur, D. and Ghahramani, Z. (007). Stick-breaking construction for the Indian buffet process, International Conference on Artificial Intelligence and Statistics. [5] Teh, Y. W., and Gorur, D. (009). Indian buffet processes with power-law behavior, In Advances in neural information processing systems, [6] Ten, L., Wang, Y., Dunson, D. and Carin, L.(0). The kernel beta process, Advances in eural Information Processing Systems, [7] Thibaux, R. and Jordan, M. I. (007). Hierarchical beta processes and the Indian buffet process, International conference on artificial intelligence and statistics. [8] Williamson, S., Orbanz, P., and Ghahramani, Z. (00). Dependent Indian buffet processes, International conference on artificial intelligence and statistics, [9] Zhou, M., Yang, H., Sapiro, G., Dunson, D. and Carin, L. (0). Dependent hierarchical beta process for image interpolation and denoising, International conference on artificial intelligence and statistics,

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ): Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, 207 Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ): binomial distribution은 성공확률이 θ인 시도에서, n번 시행 중 k번 성공할 확률

More information

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut

1 경영학을 위한 수학 Final Exam 2015/12/12(토) 13:00-15:00 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오. 1. (각 6점) 다음 적분을 구하시오 Z 1 4 Z 1 (x + 1) dx (a) 1 (x 1)4 dx 1 Solut 경영학을 위한 수학 Fial Eam 5//(토) :-5: 풀이과정을 모두 명시하시오. 정리를 사용할 경우 명시하시오.. (각 6점) 다음 적분을 구하시오 4 ( ) (a) ( )4 8 8 (b) d이 성립한다. d C C log log (c) 이다. 양변에 적분을 취하면 log C (d) 라 하자. 그러면 d 4이다. 9 9 4 / si (e) cos si

More information

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표 Vector Differential: 벡터 미분 Yonhee Lee October 7, 08 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표기법을 정의하는 방법이다 보통 스칼라(scalar)에 대한 미분은 일분수 함수 f : < < 또는 다변수 함수(function

More information

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포 생존분석의 추정과 비교 : 보충자료 이용희 December, 8 Cotets 생존함수와 위험함수. 생존함수와 위험함수....................................... 예제: 지수분포.......................................... 예제: 와이블분포.........................................

More information

(Hyunoo Shim) 1 / 24 (Discrete-time Markov Chain) * 그림 이산시간이다연쇄 (chain) 이다왜 Markov? (See below) ➀ 이산시간연쇄 (Discrete-time chain): : Y Y 의상태공간 = {0, 1, 2,..., n} Y n Y 의 n 시점상태 {Y n = j} Y 가 n 시점에상태 j 에있는사건

More information

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할 저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할수없습니다. 변경금지. 귀하는이저작물을개작, 변형또는가공할수없습니다. 귀하는, 이저작물의재이용이나배포의경우,

More information

04 Çмú_±â¼ú±â»ç

04 Çмú_±â¼ú±â»ç 42 s p x f p (x) f (x) VOL. 46 NO. 12 2013. 12 43 p j (x) r j n c f max f min v max, j j c j (x) j f (x) v j (x) f (x) v(x) f d (x) f (x) f (x) v(x) v(x) r f 44 r f X(x) Y (x) (x, y) (x, y) f (x, y) VOL.

More information

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a 조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a) b) 조사연구 주제어 패널조사 횡단면가중치 종단면가중치 선형혼합모형 일반화선형혼 합모형

More information

1 1 Department of Statistics University of Seoul August 28, 2017 확률분포 누적분포함수 확률공간이정의되었다고가정하자. 즉, 어떤사건 A 에대해서 P(A) 를항상생각할수있다고가정하자. 어떤확률변수 X 주어졌을때 Pr(X x) = P(X (, x]) 로정의하면 Pr(X x) 의값을모든 x 에대해생각할수있다. F

More information

statistics

statistics 수치를이용한자료요약 statistics hmkang@hallym.ac.kr 한림대학교 통계학 강희모 ( 한림대학교 ) 수치를이용한자료요약 1 / 26 수치를 통한 자료의 요약 요약 방대한 자료를 몇 개의 의미있는 수치로 요약 자료의 분포상태를 알 수 있는 통계기법 사용 중심위치의 측도(measure of center) : 어떤 값을 중심으로 분포되어 있는지

More information

메타분석: 통계적 방법의 기초

메타분석: 통계적 방법의 기초 메타분석: 통계적 방법의 기초 서울시립대학교 통계학과 이용희 209년 4월 23일 Contents 하나의 실험과 효과의 크기 관심있는 모수: 효과의 크기 2 모수의 추정량 3 추정량에 대한 믿음 4 추정량의 분산과 표준오차 5 추정량의 분산과 모집단의 분산 6 통계적 효과의 크기 7 신뢰구간 8 일반적인 관심 모수 2 2 2 3 개의 실험의 비교 실험들의 이질성

More information

<5BB0EDB3ADB5B55D32303131B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E28322920BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D3031292D3135B9AEC7D72E687770>

<5BB0EDB3ADB5B55D32303131B3E2B4EBBAF12DB0ED312D312DC1DFB0A32DC0B6C7D5B0FAC7D02D28312E28322920BAF2B9F0B0FA20BFF8C0DAC0C720C7FCBCBA2D3031292D3135B9AEC7D72E687770> 고1 융합 과학 2011년도 1학기 중간고사 대비 다음 글을 읽고 물음에 답하시오. 1 빅뱅 우주론에서 수소와 헬륨 의 형성에 대한 설명으로 옳은 것을 보기에서 모두 고른 것은? 4 서술형 다음 그림은 수소와 헬륨의 동위 원 소의 을 모형으로 나타낸 것이. 우주에서 생성된 수소와 헬륨 의 질량비 는 약 3:1 이. (+)전하를 띠는 양성자와 전기적 중성인 중성자

More information

Microsoft Word - SAS_Data Manipulate.docx

Microsoft Word - SAS_Data Manipulate.docx 수학계산관련 함수 함수 형태 내용 SIN(argument) TAN(argument) EXP( 변수명 ) SIN 값을계산 -1 argument 1 TAN 값을계산, -1 argument 1 지수함수로지수값을계산한다 SQRT( 변수명 ) 제곱근값을계산한다 제곱은 x**(1/3) = 3 x x 1/ 3 x**2, 세제곱근 LOG( 변수명 ) LOGN( 변수명 )

More information

= ``...(2011), , (.)''

= ``...(2011), , (.)'' Finance Lecture Note Series 사회과학과 수학 제2강. 미분 조 승 모2 영남대학교 경제금융학부 학습목표. 미분의 개념: 미분과 도함수의 개념에 대해 알아본다. : 실제로 미분을 어떻게 하는지 알아본다. : 극값의 개념을 알아보고 미분을 통해 어떻게 구하는지 알아본다. 4. 미분과 극한: 미분을 이용하여 극한값을 구하는 방법에 대해 알아본다.

More information

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월 지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., 2004 5 2009 12 KOSPI200.,. * 2009. 지능정보연구제 16 권제 1 호 2010 년 3 월 김선웅 안현철 社 1), 28 1, 2009, 4. 1. 지능정보연구제 16 권제 1 호 2010 년 3 월 Support

More information

R을 이용한 텍스트 감정분석

R을 이용한 텍스트 감정분석 R Data Analyst / ( ) / kim@mindscale.kr (kim@mindscale.kr) / ( ) ( ) Analytic Director R ( ) / / 3/45 4/45 R? 1. : / 2. : ggplot2 / Web 3. : slidify 4. : 5. Matlab / Python -> R Interactive Plots. 5/45

More information

2013unihangulchar {45380} 2unihangulchar {54617}unihangulchar {44592} unihangulchar {49328}unihangulchar {50629}unihangulchar {51312}unihangulchar {51

2013unihangulchar {45380} 2unihangulchar {54617}unihangulchar {44592} unihangulchar {49328}unihangulchar {50629}unihangulchar {51312}unihangulchar {51 Proem Se 4 산업조직론 (ECM004N) Fall 03. 독점기업이 다음과 같은 수요함수를 각각 가지고 있는 두 개의 소비자 그룹에게 제품을 공급한다고 하자. 한 단위 제품을 생산하는 데 드는 비용은 상수 이다. 다음 질문에 답하시오. P = A B Q P = A B Q () 두 그룹에 대하여 가격차별을 하고자 할 때 각 그룹의 균형생산량(Q, Q )과

More information

164

164 에너지경제연구제 16 권제 1 호 Korean Energy Economic Review Volume 16, Number 1, March 2017 : pp. 163~190 학술 시변파라미터일반화해밀턴 -plucking 모형을이용한전력소비의선제적경기국면판단활용연구 * 163 164 165 166 ~ 167 ln 168 [ 그림 1] 제조업전력판매량 (a) 로그변환

More information

마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다.

마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임.   가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다. 마지막 변경일 2018년 5월 7일 ** 이항분포와 정규분포의 관계 ** Geogebra와 수학의 시각화 책의 3.2소절 내용임. http://min7014.iptime.org/math/2017063002.htm 가장 최근 파일은 링크를 누르면 받아 보실 수 있습니다. https://goo.gl/edxsm7 http://min7014.iptime.org/math/2018010602.pdf

More information

Microsoft PowerPoint - SBE univariate5.pptx

Microsoft PowerPoint - SBE univariate5.pptx 이상치 (outlier) 진단및해결 Homework 데이터 ( Option.XLS) 결과해석 치우침? 평균이중앙값에비해다소크다. 그러나이상치때문이지치우친것같지않음. Toys us 스톡옵션비율이이상치 해결방법 : Log 변환? 아니다치우쳐있지않기때문에제거 제거후 : 평균 :.74, 중위수 :.7 31 치우침과이상치 데이터 : 노트북평가점수 우로치우침과이상치가존재

More information

<C7A5C1F620BEE7BDC4>

<C7A5C1F620BEE7BDC4> 연세대학교 상경대학 경제연구소 Economic Research Institute Yonsei Universit 서울시 서대문구 연세로 50 50 Yonsei-ro, Seodaemun-gS gu, Seoul, Korea TEL: (+82-2) 2123-4065 FAX: (+82- -2) 364-9149 E-mail: yeri4065@yonsei.ac. kr http://yeri.yonsei.ac.kr/new

More information

고차원에서의 유의성 검정

고차원에서의 유의성 검정 고차원에서의유의성검정 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 고차원에서의유의성검정 1 / 15 학습내용 FDR(false discovery rate) SAM(significance analysis of microarray) FDR 에대한베이지안해석 박창이 ( 서울시립대학교통계학과 ) 고차원에서의유의성검정 2 / 15 서론 I 고차원데이터에서변수들에대한유의성검정

More information

연구보고서 2009-05 일반화선형모형 (GLM) 을이용한 자동차보험요율상대도산출방법연구 Ⅰ. 요율상대도산출시일반화선형모형활용방법 1. 일반화선형모형 2 연구보고서 2009-05 2. 일반화선형모형의자동차보험요율산출에적용방법 요약 3 4 연구보고서 2009-05 Ⅱ. 일반화선형모형을이용한실증분석 1. 모형적용기준 < > = 요약 5 2. 통계자료및통계모형

More information

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ

모수 θ의 추정량은 추출한 개의 표본값을 어떤 규칙에 의해 처리를 해서 모수의 값을 추정하는 방법입니다. 추정량에서 사용되는 규칙은 어떤 표본을 추출했냐에 따라 변하는 것이 아닌 고정된 규칙입니다. 예를 들어 우리의 관심 모수가 모집단의 평균이라고 하겠습니다. 즉 θ 수리통계학(Mathematical Statistics)의 기초 I. 들어가며 지금부터 계량경제학이나 실험 및 준실험 연구설계 기법을 공부할 때 도움이 되는 수리통계 학의 기초에 대해 다룰 것입니다. 이 노트에서 다루게 될 내용은 어떤 추정량(estimator)이 지니고 있는 성질입니다. 한 가지 말씀 드릴 것은 이 노트에 나오는 대부분의 성질들은 지금까 지

More information

베이지안통계분석 전종준 1 1 University of Seoul, Korea Spring 2017 1/49 Outline 들어가며베이지안추론베이지안분석모형 Monte-Carlo Markov Chain (MCMC) 2/49 들어가며 확률변수 동전던지기실험 실험결과는앞면또는뒷면확률변수 X 는앞면일때 1, 뒷면일때 0 의값을갖는다. 주가의로그수익률실험 ( 관찰

More information

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63> 제 3 강계량경제학 Review Par I. 단순회귀모형 I. 계량경제학 A. 계량경제학 (Economerics 이란? i. 경제적이론이설명하는경제변수들간의관계를경제자료를바탕으로통 계적으로추정 (esimaion 고검정 (es 하는학문 거시소비함수 (Keynse. C=f(Y, 0

More information

Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft s Bing Search Engine Thore Graepel et al., ICML, 2010 P

Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft s Bing Search Engine Thore Graepel et al., ICML, 2010 P Web-Scale Bayesian Click-Through Rate Prediction for Sponsored Search Advertising in Microsoft s Bing Search Engine Thore Graepel et al., ICML, 2010 Presented by Boyoung Kim April 25, 2018 Boyoung Kim

More information

제1장 군 제1절 소개와 예 제2절 이항연산 2.1 보기. 다음은 정수방정식 a + x = b를 푸는 과정이다. (1) 준식에 a를 더하여 ( a) + (a + x) = ( a) + b. (2) 결합법칙을 사용하면 (( a) + a) + x = ( a) + b. (3)

제1장 군 제1절 소개와 예 제2절 이항연산 2.1 보기. 다음은 정수방정식 a + x = b를 푸는 과정이다. (1) 준식에 a를 더하여 ( a) + (a + x) = ( a) + b. (2) 결합법칙을 사용하면 (( a) + a) + x = ( a) + b. (3) 제장 군 제절 소개와 예 제절 이항연산. 보기. 다음은 정수방정식 + x = b를 푸는 과정이다. () 준식에 를 더하여 ( ) + ( + x) = ( ) + b. () 결합법칙을 사용하면 (( ) + ) + x = ( ) + b. () ( ) + = 임을 이용하면 + x = ( ) + b. (4) + x = x 이므로 x = ( ) + b. 이를 유리수방정식

More information

exp

exp exp exp exp exp exp exp exp exp exp exp exp log 第 卷 第 號 39 4 2011 4 투영법을 이용한 터빈 블레이드의 크리프 특성 분석 329 성을 평가하였다 이를 위해 결정계수값인 값 을 비교하였으며 크리프 시험 결과를 곡선 접합 한 결과와 비선형 최소자승법으로 예측한 결과 사 이 결정계수간 정도의 오차가 발생하였고

More information

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은

공공기관임금프리미엄추계 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영 ( 한국직업능력개발원연구위원 ) 연구보조원강승복 ( 한국노동연구원책임연구원 ) 이연구는국회예산정책처의정책연구용역사업으로 수행된것으로서, 본연구에서제시된의견이나대안등은 2013 년도연구용역보고서 공공기관임금프리미엄추계 - 2013. 12.- 이연구는국회예산정책처의연구용역사업으로수행된것으로서, 보고서의내용은연구용역사업을수행한연구자의개인의견이며, 국회예산정책처의공식견해가아님을알려드립니다. 연구책임자 한국노동연구원선임연구위원정진호 공공기관임금프리미엄추계 2013. 12. 연구책임자정진호 ( 한국노동연구원선임연구위원 ) 연구원오호영

More information

Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오.

Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오. Artificial Intelligence: Assignment 5 Seung-Hoon Na December 15, 2018 1 Numpy: Tutorial 다음 자료를 참조하여 numpy기본을 공부하시오. https://docs.scipy.org/doc/numpy-1.15.0/user/quickstart.html https://www.machinelearningplus.com/python/

More information

김기남_ATDC2016_160620_[키노트].key

김기남_ATDC2016_160620_[키노트].key metatron Enterprise Big Data SKT Metatron/Big Data Big Data Big Data... metatron Ready to Enterprise Big Data Big Data Big Data Big Data?? Data Raw. CRM SCM MES TCO Data & Store & Processing Computational

More information

Run 봄 연습 Mar 18 Mar 24, 2018, Week 3 문제 1. 초코바 입력 파일: 출력 파일: 시간 제한: 메모리 제한: standard input standard output 1 seconds 128 megabytes H W 격자 모양의 초콜릿이 있다.

Run 봄 연습 Mar 18 Mar 24, 2018, Week 3 문제 1. 초코바 입력 파일: 출력 파일: 시간 제한: 메모리 제한: standard input standard output 1 seconds 128 megabytes H W 격자 모양의 초콜릿이 있다. 문제. 초코바 H W 격자 모양의 초콜릿이 있다. 이 초콜릿을 개의 직사각형으로 격자를 따라서 잘라서, 최대 넓이의 초콜릿과 최소 넓이의 초콜릿의 넓이 차이를 최소화 하고 싶다. 이 차이의 최솟값을 구하여라. 첫째 줄에 H와 W 가 공백으로 구분되어 주어진다. 초콜릿을 개의 직사각형으로 자를 때, 최대 넓이의 초콜릿과 최소 넓이의 초콜릿의 넓이 차이의 최솟값을

More information

Communications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는

Communications of the Korean Statistical Society Vol. 15, No. 4, 2008, pp 국소적 강력 단위근 검정 최보승1), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는 Communications of the Korean Statistical Society Vol 5, No 4, 2008, pp 53 542 국소적 강력 단위근 검정 최보승), 우진욱2), 박유성3) 요약 시계열 자료를 분석할 때, 시계열 자료가 가지고 있는 추세를 제거하기 위하여 결 정적 추세인 경우 회귀모형을 이용하고, 확률적 추세인 경우 차분하는 방법을

More information

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에

완벽한개념정립 _ 행렬의참, 거짓 수학전문가 NAMU 선생 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에 1. 행렬의참, 거짓개념정리 1. 교환법칙과관련한내용, 는항상성립하지만 는항상성립하지는않는다. < 참인명제 > (1),, (2) ( ) 인경우에는 가성립한다.,,, (3) 다음과같은관계식을만족하는두행렬 A,B에대하여 AB=BA 1 가성립한다 2 3 (4) 이면 1 곱셈공식및변형공식성립 ± ± ( 복호동순 ), 2 지수법칙성립 (은자연수 ) < 거짓인명제 >

More information

작용소의 행렬표현과 그 응용

작용소의 행렬표현과 그 응용 작용소의행렬표현과그응용 이영주 무등수학강연회 2012 년 4 월 27 일 차례 차례 용어 ( 행렬, 행렬식 ) 의유래 선형작용소에대한행렬표현 곱작용소소개 응용 : 제로곱문제와교환문제 행렬 (Matrix)? 행렬의개념은 The Nine Chapters on the Mathematical Art (BC 300-AD 200) 에서처음이용 ( 처음것의하나, 둘째것의

More information

시스템경영과 구조방정식모형분석

시스템경영과 구조방정식모형분석 2 st SPSS OPEN HOUSE, 2009 년 6 월 24 일 AMOS 를이용한잠재성장모형 (Latent Growth Model ) 세명대학교경영학과김계수교수 (043) 649-242 gskim@semyung.ac.kr 목차. LGM개념소개 2. LGM모형종류 3. LGM 예제 4. 결과치비교 5. 정리및요약 2 적합모형의판단방법 Tips SEM 결과해석방법

More information

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt

Microsoft PowerPoint - ºÐÆ÷ÃßÁ¤(ÀüÄ¡Çõ).ppt 수명분포및신뢰도의 통계적추정 포항공과대학교산업공학과전치혁.. 수명및수명분포 수명 - 고장 까지의시간 - 확률변수로간주 - 통상잘알려진분포를따른다고가정 수명분포 - 확률밀도함수또는 누적 분포함수로표현 - 신뢰도, 고장률, MTTF 등신뢰성지표는수명분포로부터도출 - 수명분포추정은분포함수관련모수의추정 누적분포함수및확률밀도함수 누적분포함수 cumulav dsbuo

More information

G Power

G Power G Power 부산대학교통계학과조영석 1. G Power 란? 2. G Power 설치및실행 2.1 G Power 설치 2.2 G Power 실행 3. 검정 (Test) 3.1 가설검정 (Test of hypothesis) 3.2 검정력 (Power) 3.3 효과크기 (Effect size) 3.4 표본수산정 4. 분석 4.1 t- 검정 (t-test) 4.2

More information

untitled

untitled Math. Statistics: Statistics? 1 What is Statistics? 1. (collection), (summarization), (analyzing), (presentation) (information) (statistics).., Survey, :, : : QC, 6-sigma, Data Mining(CRM) (Econometrics)

More information

Microsoft Word - EDA_Univariate.docx

Microsoft Word - EDA_Univariate.docx 일변량분석개념 일변량분석은개체의특성을 측정한변수가하나인 통계분석 방법 변수의 종류 ( 수리 통계 ) 이산형 (discrete): 측정결과를셀수있는경우이다. 성별, 직업, 교통량, 나이등이여기해당된다. 연속형 (continuous): 측정결과가무한이 (infinite) 많은변수를연속형형변수라한다. 즉변수의범위 (range) 중어떤구간을설정하더라도측정치가발생할할수있는경우로키,

More information

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상

아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상 Android 용 Brother Image Viewer 설명서 버전 0 KOR 아이콘의 정의 본 사용자 설명서에서는 다음 아이콘을 사용합니다. 참고 참고는 발생할 수 있는 상황에 대처하는 방법을 알려 주거나 다른 기능과 함께 작동하는 방법에 대한 요령을 제공합니다. 상표 Brother 로고는 Brother Industries, Ltd.의 등록 상표입니다. Android는

More information

???? 1

???? 1 The Korean Journal of Applied Statistics (2013) 26(1), 201 208 DOI: http://dx.doi.org/10.5351/kjas.2013.26.1.201 A Note on Model Selection in Mixture Experiments with Process Variables Jung Il Kim a,1

More information

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx

Microsoft PowerPoint - MDA 2008Fall Ch2 Matrix.pptx Mti Matrix 정의 A collection of numbers arranged into a fixed number of rows and columns 측정변수 (p) 개체 x x... x 차수 (nxp) 인행렬matrix (n) p 원소 {x ij } x x... x p X = 열벡터column vector 행벡터row vector xn xn... xnp

More information

Microsoft Word - SPSS_MDA_Ch6.doc

Microsoft Word - SPSS_MDA_Ch6.doc Chapter 6. 정준상관분석 6.1 정준상관분석 정준상관분석 (Canonical Correlation Analysis) 은변수들의군집간선형상관관계를파악하는분석방법이다. 예를들어신체적조건 ( 키, 몸무게, 가슴둘레 ) 과운동력 ( 달리기, 윗몸일으키기, 턱걸이 ) 사이의선형상관관계가있는지알아보고, 관계가있다면어떤관계가있는지분석하는것이다. 정준상관분석은 (

More information

<B3EDB4DC28B1E8BCAEC7F6292E687770>

<B3EDB4DC28B1E8BCAEC7F6292E687770> 1) 초고를읽고소중한조언을주신여러분들게감사드린다. 소중한조언들에도불구하고이글이포함하는오류는전적으로저자개인의것임을밝혀둔다. 2) 대표적인학자가 Asia's Next Giant: South Korea and Late Industrialization, 1990 을저술한 MIT 의 A. Amsden 교수이다. - 1 - - 2 - 3) 계량방법론은회귀분석 (regression)

More information

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선

Gray level 변환 및 Arithmetic 연산을 사용한 영상 개선 Point Operation Histogram Modification 김성영교수 금오공과대학교 컴퓨터공학과 학습내용 HISTOGRAM HISTOGRAM MODIFICATION DETERMINING THRESHOLD IN THRESHOLDING 2 HISTOGRAM A simple datum that gives the number of pixels that a

More information

Microsoft PowerPoint - chap04-연산자.pptx

Microsoft PowerPoint - chap04-연산자.pptx int num; printf( Please enter an integer: "); scanf("%d", &num); if ( num < 0 ) printf("is negative.\n"); printf("num = %d\n", num); } 1 학습목표 수식의 개념과 연산자, 피연산자에 대해서 알아본다. C의 를 알아본다. 연산자의 우선 순위와 결합 방향에

More information

와플-4년-2호-본문-15.ps

와플-4년-2호-본문-15.ps 1 2 1+2 + = = 1 1 1 +2 =(1+2)+& + *=+ = + 8 2 + = = =1 6 6 6 6 6 2 2 1 1 1 + =(1+)+& + *=+ =+1 = 2 6 1 21 1 + = + = = 1 1 1 + 1-1 1 1 + 6 6 0 1 + 1 + = = + 7 7 2 1 2 1 + =(+ )+& + *= + = 2-1 2 +2 9 9 2

More information

PowerPoint Presentation

PowerPoint Presentation Package Class 3 Heeseung Jo 목차 section 1 패키지개요와패키지의사용 section 2 java.lang 패키지의개요 section 3 Object 클래스 section 4 포장 (Wrapper) 클래스 section 5 문자열의개요 section 6 String 클래스 section 7 StringBuffer 클래스 section

More information

부문별 에너지원 수요의 변동특성 및 공통변동에 미치는 거시적 요인들의 영향력 분석

부문별 에너지원 수요의 변동특성 및 공통변동에 미치는 거시적 요인들의 영향력 분석 에너지경제연구 Korean Energy Economic Review Volume 15, Number 1, March 2016 : pp. 33 ~ 67 부문별에너지원수요의변동특성및공통변동에 미치는거시적요인들의영향력분석 33 ~ < 표 1> 에너지소비량과주요변수들의연평균증가율 ~ ~ ~ ~ ~ 34 35 36 37 38 ~ 39 [ 그림 1] 부문별에너지원소비량의증가율

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA e- 비즈니스연구 (The e-business Studies) Volume 17, Number 3, June, 30, 2016:pp. 93~116 ISSN 1229-9936 (Print), ISSN 2466-1716 (Online) 원고접수일심사 ( 수정 ) 게재확정일 2016. 06. 12 2016. 06. 20 2016. 06. 26 ABSTRACT e-

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 실습 1 배효철 th1g@nate.com 1 목차 조건문 반복문 System.out 구구단 모양만들기 Up & Down 2 조건문 조건문의종류 If, switch If 문 조건식결과따라중괄호 { 블록을실행할지여부결정할때사용 조건식 true 또는 false값을산출할수있는연산식 boolean 변수 조건식이 true이면블록실행하고 false 이면블록실행하지않음 3

More information

소성해석

소성해석 3 강유한요소법 3 강목차 3. 미분방정식의근사해법-Ritz법 3. 미분방정식의근사해법 가중오차법 3.3 유한요소법개념 3.4 편미분방정식의유한요소법 . CAD 전처리프로그램 (Preprocessor) DXF, STL 파일 입력데이타 유한요소솔버 (Finite Element Solver) 자연법칙지배방정식유한요소방정식파생변수의계산 질량보존법칙 연속방정식 뉴톤의운동법칙평형방정식대수방정식

More information

확률 및 분포

확률 및 분포 확률및분포 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 확률및분포 1 / 15 학습내용 조건부확률막대그래프히스토그램선그래프산점도참고 박창이 ( 서울시립대학교통계학과 ) 확률및분포 2 / 15 조건부확률 I 첫째가딸일때두아이모두딸일확률 (1/2) 과둘중의하나가딸일때둘다딸일확률 (1/3) 에대한모의실험 >>> from collections import

More information

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형

2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형 M-Plus 의활용 - 기본모형과예제명령어 - 성신여자대학교 심리학과 조영일, Ph.D. 2 / 27 목차 1. M-plus 소개 2. 중다회귀 3. 경로모형 4. 확인적요인분석 5. 구조방정식모형 6. 잠재성장모형 7. 교차지연자기회귀모형 3 / 27 1. M-plus 란? 기본정보 M-plus 는구조방정식모형과종단자료분석 ( 잠재성장모형 ) 의분석에사용되기위해서고안된프로그램임.

More information

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion

KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion KCC2011 우수발표논문 휴먼오피니언자동분류시스템구현을위한비결정오피니언형용사구문에대한연구 1) Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion 요약 본연구에서는, 웹문서로부터특정상품에대한의견문장을분석하는오피니언마이닝 (Opinion

More information

Software Requirrment Analysis를 위한 정보 검색 기술의 응용

Software Requirrment Analysis를 위한 정보 검색 기술의 응용 EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템 김석환 * 이청재 정상근 이근배 포항공과대학교 컴퓨터공학과 지능소프트웨어연구실 {megaup, lcj80, hugman, gblee}@postech.ac.kr An Example-Based Natural Language System for EPG Information Access Seokhwan Kim

More information

Microsoft PowerPoint - ch07 - 포인터 pm0415

Microsoft PowerPoint - ch07 - 포인터 pm0415 2015-1 프로그래밍언어 7. 포인터 (Pointer), 동적메모리할당 2015 년 4 월 4 일 교수김영탁 영남대학교공과대학정보통신공학과 (Tel : +82-53-810-2497; Fax : +82-53-810-4742 http://antl.yu.ac.kr/; E-mail : ytkim@yu.ac.kr) Outline 포인터 (pointer) 란? 간접참조연산자

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 System Software Experiment 1 Lecture 5 - Array Spring 2019 Hwansoo Han (hhan@skku.edu) Advanced Research on Compilers and Systems, ARCS LAB Sungkyunkwan University http://arcs.skku.edu/ 1 배열 (Array) 동일한타입의데이터가여러개저장되어있는저장장소

More information

확률과통계6

확률과통계6 확률과통계 6. 이산형확률분포 건국대학교스마트 ICT 융합공학과윤경로 (yoonk@konkuk.ac.kr) 6. 이산형확률분포 6.1 이산균일분포 6.2 이항분포 6.3 초기하분포 6.4 포아송분포 6.5 기하분포 6.6 음이항분포 * ( 제외 ) 6.7 다항분포 * ( 제외 ) 6.1 이산균일분포 [ 정의 6-1] 이산균일분포 (discrete uniform

More information

B-05 Hierarchical Bayesian Model을 이용한 GCMs 의 최적 Multi-Model Ensemble 모형 구축

B-05 Hierarchical Bayesian Model을 이용한 GCMs 의 최적 Multi-Model Ensemble 모형 구축 Hierarchical Bayesian Model 을 이용한 GCMs 의 최적 Multi-Model Ensemble 모형 구축 Optimal Multi-Model Ensemble Model Development Using Hierarchical Bayesian Model Based 권 현 한 * 민 영 미 **Saji N. Hameed *** Hyun-Han

More information

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA The e-business Studies Volume 17, Number 6, December, 30, 2016:3~20 Received: 2016/12/04, Accepted: 2016/12/27 Revised: 2016/12/27, Published: 2016/12/30 [ABSTRACT] This study aims to comprehensively analyze

More information

한국통계학회논문집 2009, 16권, 4호, 영상에서 윈도우 배치에 따른 통계적 에지검출 비교 임동훈 1,a a 경상대학교 정보통계학과 요약 본 논문에서는 영상의 에지검출을 하는데 사용되는 여러 가지 윈도우 배치(window configurations)하

한국통계학회논문집 2009, 16권, 4호, 영상에서 윈도우 배치에 따른 통계적 에지검출 비교 임동훈 1,a a 경상대학교 정보통계학과 요약 본 논문에서는 영상의 에지검출을 하는데 사용되는 여러 가지 윈도우 배치(window configurations)하 한국통계학회논문집 2009, 16권, 4호, 615 625 영상에서 윈도우 배치에 따른 통계적 에지검출 비교 임동훈 1,a a 경상대학교 정보통계학과 요약 본 논문에서는 영상의 에지검출을 하는데 사용되는 여러 가지 윈도우 배치(window configurations)하에 서 통계학의 이표본 위치문제(two-sample location problem)에서 대표적인

More information

2. 4. 1. 업무에 활용 가능한 플러그인 QGIS의 큰 들을 찾 아서 특징 설치 마 폰 은 스 트 그 8 하 이 업무에 필요한 기능 메뉴 TM f K 플러그인 호출 와 TM f K < 림 > TM f K 종항 그 중에서 그 설치 듯 할 수 있는 플러그인이 많이 제공된다는 것이다. < 림 > 다. 에서 어플을 다운받아 S or 8, 9 의 S or OREA

More information

Microsoft PowerPoint - 26.pptx

Microsoft PowerPoint - 26.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2011년봄학기 강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770>

<3235B0AD20BCF6BFADC0C720B1D8C7D120C2FC20B0C5C1FE20322E687770> 25 강. 수열의극한참거짓 2 두수열 { }, {b n } 의극한에대한 < 보기 > 의설명중옳은것을모두고르면? Ⅰ. < b n 이고 lim = 이면 lim b n =이다. Ⅱ. 두수열 { }, {b n } 이수렴할때 < b n 이면 lim < lim b n 이다. Ⅲ. lim b n =0이면 lim =0또는 lim b n =0이다. Ⅰ 2Ⅱ 3Ⅲ 4Ⅰ,Ⅱ 5Ⅰ,Ⅲ

More information

Microsoft PowerPoint - LN05 [호환 모드]

Microsoft PowerPoint - LN05 [호환 모드] 계량재무분석 I Chapter 6 & 7 Probability Distribution II 경영대학재무금융학과 윤선중 0 Objectives 확률변수 이산확률분포 (Discrete Random Variables): 셀수있는확률변수 연속확률분포 (Continuous Random Variables): 셀수없는경우의수 이산확률변수 분포의대표값 기대치 (Expected

More information

= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan ,

= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan , Finance Lecture Note Series 금융시장과 투자분석 연구 제4강. 소유와 경영의 분리1 조 승 모2 영남대학교 대학원 경제학과 2015학년도 2학기 Copyright 2015 Cho, Seung Mo 1 기본적으로 Fisher, I. (1930), The Theory of Interest, Macmillan의 내용을 바탕으로 작성되었으며,

More information

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS

제장 2 비모수 검정(NONPARAMETRIC ANALYSIS) ③ 연구자는 SPSS 출력결과에서 유의확률을 확인하여 귀무가설(H0 )의 기각, 채택 여부를 결정한다. 예를 들어 연구자가 연구자료의 정규성을 검정하기 위하여 유 의수준을 α = 0.05로 설정하고 SPS 제장 비모수 검정(nonparametric analysis) 모집단의 분포를 알 수 없거나 모집단이 정규분포를 따른다고 가정할 수 없는 경우에는 모수적 검정을 사용할 수 없다. 이 경우에 자료의 부호나 순위로 가설 검정을 실시하며 이러한 검정 방법을 비모수 검정이라고 한다. 제절 적합도 검정(goodness of fit test) 주어진 자료가 어떠한 통계적

More information

...... ....2-1

...... ....2-1 ,,,, (), pp. ~., TV (PPL) -,,, (), pp. ~., TV PPL, :.,, (), pp. ~., PPL,,, (), pp. ~., ( - ) PPL,,, (), pp. ~., (PPL) : PPL,,, (), pp. ~.,..., TV PPL,,, (), pp. ~.,,,,,, (), pp. ~.,,,.,... LG,... Babin,

More information

Microsoft PowerPoint - PDF3 SBE 20080417.pptx

Microsoft PowerPoint - PDF3 SBE 20080417.pptx 연속형 확률밀도함수 연속형 확률분포함수? 데이터 히스토그램의 정상을 연결하면 확률분포함수가 된다. 이를 이용하여 데이터(표본)의 분포(이는 모집단의 분포와 동일)를 구 하게 된다. 그러나 함수를 구하는 것은 불가능해 보인다. 그래서 현실에서는 확률분포를 가정하게 된다. (예)기다리는 시간: 지수분포, 측정 오 차: 정규분포 Gauss(천문학자): 행성들간 거리

More information

공휴일 전력 수요에 관한 산업별 분석

공휴일 전력 수요에 관한 산업별 분석 에너지경제연구 Korean Energy Economic Review Volume 15, Number 1, March 2016 : pp. 99 ~ 137 공휴일전력수요에관한산업별분석 1) 99 100 ~ 101 102 103 max m ax 104 [ 그림 1] 제조업및서비스업대표업종전력사용량추이 105 106 [ 그림 2] 2014 년일별전자및전자기기업종 AMR

More information

= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan ,

= Fisher, I. (1930), ``The Theory of Interest,'' Macmillan , Finance Lecture Note Series 학습목표 제4강 소유와 경영의 분리 효용함수(utility function): 효용함수, 한계효용(marginal utility), 한계대체율(marginal rate of substitution) 의 개념에 대해 알아본다 조 승 모2 (production possibility curve): 생산가능곡선과 한계변환율(marginal

More information

Microsoft PowerPoint Relations.pptx

Microsoft PowerPoint Relations.pptx 이산수학 () 관계와그특성 (Relations and Its Properties) 2010년봄학기강원대학교컴퓨터과학전공문양세 Binary Relations ( 이진관계 ) Let A, B be any two sets. A binary relation R from A to B, written R:A B, is a subset of A B. (A 에서 B 로의이진관계

More information

154 Yuha Park Ilsu Choi 학모형으로 single-type 분기과정 (branching process) 을적합하였고, 질병의소멸확률 (extinction probability) 을계산하였다. 또한 Alexander (2010) 는돌연변이가고려된병원균의확

154 Yuha Park Ilsu Choi 학모형으로 single-type 분기과정 (branching process) 을적합하였고, 질병의소멸확률 (extinction probability) 을계산하였다. 또한 Alexander (2010) 는돌연변이가고려된병원균의확 Journal of the Korean Data & Information Science Society 2017, 28(1), 153 161 http://dx.doi.org/10.7465/jkdi.2017.28.1.153 한국데이터정보과학회지 베이지안음이항분기과정을이용한한국메르스발생연구 박유하 1 최일수 2 12 전남대학교통계학과 접수 2016 년 12 월 25

More information

05 ƯÁý

05 ƯÁý Special Issue 04 / 46 VOL. 46 NO. 4 2013. 4 47 Special Issue 04 / 48 VOL. 46 NO. 4 2013. 4 49 S pecial Issue 04 / IHP 7단계 연구사업 구분 1970년대 1980년대 1990년대 2000년대 연최대 강우량 침수면적 인명피해 재산피해 그림 4. 시군구별 연 최대 강우량과

More information

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월 지능정보연구제 17 권제 4 호 2011 년 12 월 (pp.241~254) Support vector machines(svm),, CRM. SVM,,., SVM,,.,,. SVM, SVM. SVM.. * 2009() (NRF-2009-327- B00212). 지능정보연구제 17 권제 4 호 2011 년 12 월 김경재 안현철 지능정보연구제 17 권제 4 호

More information

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu 한 국 통 계 학 회 논 문 집 2012, 19권, 6호, 877 884 DOI: http://dx.doi.org/10.5351/ckss.2012.19.6.877 Maximum Tolerated Dose Estimation Applied Biased Coin Design in a Phase Ⅰ Clinical Trial Yu Kim a, Dongjae Kim

More information

용역보고서

용역보고서 여러고장모드를갖는자료분석방법 2009. 1. ( 주 ) 한국신뢰성기술서비스 목차 여러고장모드를갖는자료분석방법...3 1. 개요...3 2. 분석방법및예제...4 2.1 CFM(Competing Failure Mode) 분석...4 2.2 Mixed Weibull 분석...4 2.3 Mixed Weibull 예제...5 3. 요약정리...9 ii http://www.korts.co.kr

More information

사회통계포럼

사회통계포럼 wcjang@snu.ac.kr Acknowledgements Dr. Roger Peng Coursera course. https://github.com/rdpeng/courses Creative Commons by Attribution /. 10 : SNS (twitter, facebook), (functional data) : (, ),, /Data Science

More information

Lecture12_Bayesian_Decision_Thoery

Lecture12_Bayesian_Decision_Thoery Bayesian Decision Theory Jeonghun Yoon Terms Random variable Bayes rule Classification Decision Theory Bayes classifier Conditional independence Naive Bayes Classifier Laplacian smoothing MLE / Likehood

More information

커널 방법론

커널 방법론 커널방법론 박창이 서울시립대학교통계학과 박창이 ( 서울시립대학교통계학과 ) 커널방법론 1 / 31 학습내용 벌점화방법 재생커널힐버트공간 여러가지커널기계 박창이 ( 서울시립대학교통계학과 ) 커널방법론 2 / 31 커널방법론 회귀함수나베이즈분류함수가선형이라는가정은비현실적임최종모형의해석상의편리성또는과대적합문제를피하기위해선형모형을고려비선형모형의구축시적절한기저함수 (basis

More information

쉽게 배우는 알고리즘 강의노트

쉽게 배우는 알고리즘 강의노트 쉽게배우는알고리즘 장. 정렬 Sorting http://www.hanbit.co.kr 장. 정렬 Sorting 은유, 그것은정신적상호연관성의피륙을짜는방법이다. 은유는살아있다는것의바탕이다. - 그레고리베이트슨 - 2 - 학습목표 기본정렬알고리즘을이해한다. 정렬을귀납적관점에서볼수있도록한다. 1 장과 2 장에서배운기법을사용해각정렬의수행시간을분석할수있도록한다. 비교정렬의한계를이해하고,

More information

<4D6963726F736F667420576F7264202D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

<4D6963726F736F667420576F7264202D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5> 주간기술동향 2016. 5.18. 컴퓨터 비전과 인공지능 장혁 한국전자통신연구원 선임연구원 최근 많은 관심을 받고 있는 인공지능(Artificial Intelligence: AI)의 성과는 뇌의 작동 방식과 유사한 딥 러닝의 등장에 기인한 바가 크다. 이미 미국과 유럽 등 AI 선도국에서는 인공지능 연구에서 인간 뇌 이해의 중요성을 인식하고 관련 대형 프로젝트들을

More information

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016)   ISSN 228 (JBE Vol. 1, No. 1, January 016) (Regular Paper) 1 1, 016 1 (JBE Vol. 1, No. 1, January 016) http://dx.doi.org/10.5909/jbe.016.1.1.60 ISSN 87-9137 (Online) ISSN 16-7953 (Print) a), a) An Efficient Method

More information

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제 Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, 2018 1 1.1 Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제 6.5에서 찾아볼 수 있다. http://incompleteideas.net/book/bookdraft2017nov5.pdf

More information

Ch 1 머신러닝 개요.pptx

Ch 1 머신러닝 개요.pptx Chapter 1. < > :,, 2017. Slides Prepared by,, Biointelligence Laboratory School of Computer Science and Engineering Seoul National University 1.1 3 1.2... 7 1.3 10 1.4 16 1.5 35 2 1 1.1 n,, n n Artificial

More information

Japanese Olympiad in Informatics 05/06 Spring Training Camp/Qualifying Trial Contest Day, March 9 5, 06, Komaba/Yoyogi, Tokyo 단, Answer를 호출 할 때는, 다음의

Japanese Olympiad in Informatics 05/06 Spring Training Camp/Qualifying Trial Contest Day, March 9 5, 06, Komaba/Yoyogi, Tokyo 단, Answer를 호출 할 때는, 다음의 Japanese Olympiad in Informatics 05/06 Spring Training Camp/Qualifying Trial Contest Day, March 9 5, 06, Komaba/Yoyogi, Tokyo Problem A. Dungeon Input file: Output file: Time limit: Memory limit: second

More information

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정

장연립방정식을풀기위한반복법 12.1 선형시스템 : Gauss-Seidel 12.2 비선형시스템 12.1 선형시스템 : Gauss-Seidel (1/10) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정 . 선형시스템 : GussSedel. 비선형시스템. 선형시스템 : GussSedel (/0) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. GS 방법은선형대수방정식을푸는반복법중에서 가장보편적으로사용되는방법이다. 개의방정식에서 인 ( 대각원소들이모두 0 이아닌 ) 경우를다루자. j j b j j b j j 여기서 j b j j j 현재반복단계

More information

2.1.1 Stochastic Processes: Preliminaries and Definitions 2/32

2.1.1 Stochastic Processes: Preliminaries and Definitions 2/32 Mathematical Foundations of Infinite-Dimensional Statistical Models Ch.2 Gaussian Processes 2.1 Definitions, Separability, 0-1 Law, Concentration 이상엽 June 29, 2018 2.1.1 Stochastic Processes: Preliminaries

More information

슬라이드 1

슬라이드 1 장연립방정식을 풀기위한반복법. 선형시스템 : Guss-Sedel. 비선형시스템 . 선형시스템 : Guss-Sedel (/0) 반복법은초기근을가정한후에더좋은근의값을추정하는체계적인절차를이용한다. G-S 방법은선형대수방정식을푸는반복법중에서 가장보편적으로사용되는방법이다. 개의방정식에서 인 ( 대각원소들이모두 0 이아닌 ) 경우를다루자. j j b j b j j j

More information

PowerPoint 프레젠테이션

PowerPoint 프레젠테이션 CRM Data Quality Management 2003 2003. 11. 11 (SK ) hskim226@skcorp.com Why Quality Management? Prologue,,. Water Source Management 2 Low Quality Water 1) : High Quality Water 2) : ( ) Water Quality Management

More information

cat_data3.PDF

cat_data3.PDF ( ) IxJ ( 5 0% ) Pearson Fsher s exact test χ, LR Ch-square( G ) x, Odds Rato θ, Ch-square Ch-square (Goodness of ft) Pearson cross moment ( Mantel-Haenszel ), Ph-coeffcent, Gamma (γ ), Kendall τ (bnary)

More information

Buy one get one with discount promotional strategy

Buy one get one with discount promotional strategy Buy one get one with discount Promotional Strategy Kyong-Kuk Kim, Chi-Ghun Lee and Sunggyun Park ISysE Department, FEG 002079 Contents Introduction Literature Review Model Solution Further research 2 ISysE

More information

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다

이 장에서 사용되는 MATLAB 명령어들은 비교적 복잡하므로 MATLAB 창에서 명령어를 직접 입력하지 않고 확장자가 m 인 text 파일을 작성하여 실행을 한다 이장에서사용되는 MATLAB 명령어들은비교적복잡하므로 MATLAB 창에서명령어를직접입력하지않고확장자가 m 인 text 파일을작성하여실행을한다. 즉, test.m 과같은 text 파일을만들어서 MATLAB 프로그램을작성한후실행을한다. 이와같이하면길고복잡한 MATLAB 프로그램을작성하여실행할수있고, 오류가발생하거나수정이필요한경우손쉽게수정하여실행할수있는장점이있으며,

More information

중소기업경기지수및경영환경지수 개발에관한연구 - 제조업중심으로 - A Study on Development of the Business Indicators in SMEs focused on manufacturing 요약 1) 125 IPISA 124 ISISA 120 120 115 110 105 100 95 116 112 108 104

More information