Robust Segmentation for Sensor Data in Semiconductor Manufacturing 한국 BI 데이터마이닝학회 2012 춘계학술대회 박은정, 박주성, 양지원, 조성준 Seoul National University Industrial Engineering Department
1. Introduction 반도체공정에서는다양한분석및공정상태를모니터링에활용하기위한 sensor data 가수집됨 ± 분석 : FDC 1), 가상계측, 혐의설비 / 파라미터탐색, 수율연계분석등 ± Ex: 데이터 (X) 를수율 (Y) 과연결지어혐의설비탐색 ± 모니터링 : 공정파라미터의장기간 trend 파악 2
1. Introduction 그러나 sensor data 는양이방대하여분석시계산부하가발생 ± 수백개의프로세스에대해매초공정파라미터의값과센서정보가기록됨 ± 하나의프로세스는수초에서수백초에이름 ± Lot 의개수와각 lot 내의 wafer 개수에따라데이터량이증폭됨 y: wafers x: sensors lot1 lot2 lot3 X Y 3
1. Introduction Sensor data 를여러개의 segment 로분할하여요약하면계산부하를줄일수있음 ± 용어정의 Segmentation = 시계열의 trace data 를여러 segment 로나누는행위 Segment = 위의 segmentation 의결과로나오는 data segment ± 각 segment 내에서는 data 가유사한특성을가지도록하는것이핵심 4
1. Introduction 그러나반도체공정에서나타나는다양한형태의데이터에대해 robust 하게 segmentation 하는것은간단하지않음 (a) Discrete-type data (b) Continuous-type data (c) Mixed data (d) Noisy data 5
1. Introduction 데이터를 segmentation 하기위해기존에는 chamber step 정보를사용함 ± 기존방법 : Chamber step-based Segmentation 공정 recipe 에따른 chamber step 정보를이용하여 segment 를나눔 각 chamber step 의시작과끝에서 segmentation Ex: Chamber step {A, B,, G} 를가지는 process A B C D E F G 기존 : Chamber step 기반 framing 6
1. Introduction 그러나 chamber step 은생산정보에의해나누는것이므로, signal 의특징을반영못한다는단점을내재함 ± Chamber step-based segmentation 의 underlying assumptions (a) 가정 1: Chamber step 변경시 data value 가바뀜 (b) 가정 2: 대표값은구간의통계량 min., max., mean, std. - 으로충분함 Ex: Chamber step {A, B,, G} 를가지는 process (a) (b) Min. = -1.7256 Max. = 0.6136 Mean = -0.0074 Std. = 1.0067? 기존 : Chamber step 기반 framing 7
2. Related Work Signal 의특징을잘반영하기위해서 data 를기반으로 segmentation 할수있으며, 이때대표적으로 moving windows 가사용될수있음 ± 개요 1: 전체 wafer들을 average로 aggregation한후, 기존데이터를변화량의절대값으로변환 D mt = mt+ 1 - mt, t = 1, 2,..., n -1 2: For i = 1 to n-w (w: 윈도우크기, k: 허용범위 ) end if D > (W ) + (W ) m i + k mean i, w k std i, w ± Model Parameters k: 작을수록 sensitive 하게변화탐지 w: window 크기. 작을수록최신의데이터만을반영 4 3 2 1 0-1 -2-3 -4-5 -6 0 20 40 60 80 100 120 8
2. Related Work Bayesian change point detection (BCPD) 은 machine learning 분야에서널리사용되는방법론임 ± 개요 1: UPM(underlying predictive model) + hazard function 으로구성 2: UPM 은 CP 마다 parameter 값이바뀌는예측모델 3: Hazard function 은 run length r 에따라 CP 가일어날확률 ± Model Parameters r: Hazard function 의 run length 1 0.5 0-0.5-1 -1.5-2 0 20 40 60 80 100 120 0 D1 Bayesian Changepoint detection 20 40 60 80 100 120 0 20 40 60 80 100 120 9
2. Related Work Kalman filter 도 BCPD 와마찬가지로추정값이현재값과크게다른경우에 segment 를나누는방식으로 segmentation 에사용가능 ± 개요 1: 모든 wafer aggregation 2: 칼만필터 1) 로추정한값이현재의값과크게다르면자료의특성이바뀌었다고볼수있으므로 해당지점에서프레임을나눔 x - x > c Var( x ) Var( x - xˆ ) k ˆ k k k k k k Parameter 의민감도를줄이기위한 term - Effect: parameter c 의범위가 [0, ) 에서 reasonable 한 range 로바뀜 - 현재 dataset 들에대한실험에서는 [0.1,1.1] ± Model Parameters Q k, R k ( 오차의공분산행렬 ) : 변화에대한민감도 c( 오차범위의길이 ) : 오차에대한민감도 y 1.5 1 0.5 0-0.5-1 -1.5-2 -2.5 true observed smoothed 0 20 40 60 80 100 120 140 x 10
2. Related Work Applied mathematics 에서제안된 free knot spline with knot removal 은 continuous function data 에서변화를찾아내는데탁월한성능을발휘함 ± 개요 1: 전체 wafer diversion aggregation 2: Free knot이존재한다는가정하에, 아래의 Schoenberg functional이 minimum이되는 spline을 nonlinear least squares problem의 optimization 문제로접근하여선택함 1) RSS, N i i ò i= 1 2 2 ( f l) = ( y - f ( x )) + l { f ( t) } dt å ± Model Parameters k-1 : spline 의차수 Initial knots 11
2. Related Work 그러나반도체공정에서나타나는다양한형태의데이터에대해 overall 하게좋은성능을가지는알고리즘은알려지지않음 Method Description Train 1 Moving Windows 2 Bayesian Change Point Detection 3 Kalman Filter 4 Free knot spline with knot removal 데이터변화량이최근데이터와많이다를때프레임나눔 UPM의추정값과현재값이크게다르면프레임나눔 KF의추정값과현재값이크게다르면프레임나눔 Interpolation 후최적화를통한 knot 의위치추정 Mean Training Time (sec) Strengths Weaknesses Online 0.003 - 계산이쉽고간단함 - Parameter 를정하기어려움 Online 0.0292 Online 0.11 Batch 1.064 - Outlier 에둔감함 - Parameter 에둔감함 - 상태를잘추적 - 확률을제공 - 프레이밍결과를비교할수있는척도가존재하여자동으로모델파라미터최적화가능 (RMSE) - 예측함수가후행하여실제변화점보다늦게 CP 를선언함 - 다소복잡 - Parameter 를정하기어려움 - 학습시간이 record 의개수에 dependent - Continuous data 의 framing 은잘됨 - Discrete data 의경우성능이떨어짐 12
3. Proposed Framework 다양한형태의 data 에대해 robust 한 segmentation 을제안하기에앞서, 먼저무엇이 좋은 segmentation 인지에대한명확한정의가필요함 ± 좋은 segmentation의조건? 선형성 : 선형구간으로잘게나눔 min( 선형회귀잔차의제곱합 ) 단순성 : 구간의개수가최소가되게나눔 min( 프레임의수 ) 위두조건은 trade-off 관계임 ìï ( MSEm) n arg min Error( m) = arg min í + l m m ïî ( MSTm ) T ( 비 ) 선형성 ( 비 ) 단순성 T 1 where ( MSE ) ( m = å ymt - yt ) T - 2 t= 1 T 1 2 ( MST ) = å( yt - y) T -1 t= 1 y, y = linear regression value, mean mt m üï ý ïþ 2 m Î{implemented models (e.g., 기존, 제안 )} 13
3. Proposed Framework Data 의 continuity 를기준으로모든 data 를 discrete-type data 와 continuous-type data 으로나눔 Continuity indices Continuous range (CR) 데이터의변화량이 nonzero 인 time instance 가연속적으로나타나는구간 Continuous range ratio (c) 데이터에서 CR 이차지하는비율 y CR1 CR2CR3 Ex: T=110, k=3 c =(62+5+3)/130=0.64 t if ( c>continuousthreshold ), discrete-valued data D else, continuous-valued data D 14
3. Proposed Framework Discrete-type data 는 Abnormal Difference, continuous-type data 는 free knot spline with knot removal 으로각각 segmentation 함 ± Discrete-valued data Abnormal difference ± Continuous-valued data Free knot spline with knot removal 15
3. Proposed Framework Abnormal difference 는데이터의변화량이큰지점에서 segmentation 을하는알고리즘임 예시 k AD Parameter k AD : 작을수록 sensitive 하게변화탐지 16
4. Experimental Results 실험에는반도체 8 대공정 1) 을모두포함하는실제 sensor data 이용 ± Data 기간 : 1달분 변수 : 가공시각, Wafer ID, Chamber step, Data value 총 62개데이터셋 17
4. Experimental Results 기존 chamber step-based segmentation 에비해평균 38.54% 의성능향상 ± Evaluation: 성능향상정도 = ( 기존 - 제안 )/ 기존 *100 평균향상 : 38.54% 최대향상 : 84.72% 최소향상 : -4.92% 데이터번호 기존 제안 향상정도 (%) 1) 1 0.31 0.13 59.0 2 0.71 0.48 32.5 3 0.19 0.07 64.5 4 0.68 0.46 32.2 5 0.93 0.35 62.2 6 0.91 0.36 60.0 7 0.07 0.05 33.3 8 0.63 0.40 35.7 9 0.35 0.19 46.8 11 0.78 0.61 21.4 12 0.44 0.29 34.1 14 0.53 0.40 26.1 15 0.27 0.19 28.6 16 0.41 0.28 32.2 17 0.63 0.59 5.7 18 0.47 0.19 60.3 19 0.30 0.30 0.6 20 0.56 0.23 58.8 23 0.66 0.29 55.7 24 0.61 0.27 55.2 25 1.07 0.37 65.6 26 0.25 0.17 33.2 27 0.57 0.16 72.5 28 0.58 0.18 69.4 29 0.40 0.09 78.8 30 0.22 0.13 41.7 31 0.27 0.21 22.3 32 0.42 0.43-2.7 데이터번호 기존 제안 향상정도 (%) 33 0.32 0.19 41.7 34 0.54 0.11 79.8 35 0.61 0.44 27.4 36 0.87 0.46 47.0 37 0.77 0.28 63.8 38 0.42 0.44-4.9 39 0.39 0.39 1.2 40 0.45 0.21 54.0 41 0.28 0.20 28.5 42 0.71 0.26 63.4 43 0.78 0.62 21.1 44 0.32 0.16 51.0 46 0.28 0.24 13.9 47 0.53 0.30 42.3 48 0.53 0.30 42.3 49 0.63 0.37 40.5 50 0.54 0.40 26.9 52 0.78 0.12 84.7 53 0.36 0.23 36.2 54 0.82 0.21 74.1 55 0.27 0.20 28.6 56 0.64 0.38 40.8 57 0.54 0.43 20.7 58 0.62 0.62 0.1 59 0.66 0.55 16.3 60 0.64 0.59 7.3 61 0.29 0.25 14.6 62 0.33 0.30 9.5 18
4. Experimental Results 제안된방법론을사용하는경우, signal 의특성이변하는시점에서데이터가 segmentation 되었음을확인할수있음 (a) (b) 기존 (e=0.91) 제안 (e=0.36) 기존 (e=0.57) 제안 (e=0.16) 60.0% 성능향상 72.5% 성능향상 (c) (d) 기존 (e=0.54) 제안 (e=0.11) 기존 (e=0.78) 제안 (e=0.12) 79.8% 성능향상 84.7% 성능향상 19
5. Conclusion 요약 ± 본논문에서는 linearity와 parsimony를기준으로하는 data-based segmentation framework를제안함 ± 이 framework는데이터가어떠한 arbitrary한모양을가지더라도 robust한성능을보임 ± 제안한방법의유효성을검증하기위해객관적인 evaluation metric을제안 ± 위 metric을기준으로제안한방법이 chamber step-based segmentation보다성능이 38.54% 좋아졌음을검증함 20
Contact Information Any Questions? E-mail: ejpark04@snu.ac.kr Homepage: http://dmlab.snu.ac.kr ejpark04@snu.ac.kr 21