Robust Segmentation for Sensor Data in Semiconductor Manufacturing 한국 BI 데이터마이닝학회 2012 춘계학술대회 박은정, 박주성, 양지원, 조성준 Seoul National University Industrial

Similar documents
김기남_ATDC2016_160620_[키노트].key

An Effective Sentence-Extraction Technique Using Contextual Information and Statistical Approaches for Text Summarization

4 CD Construct Special Model VI 2 nd Order Model VI 2 Note: Hands-on 1, 2 RC 1 RLC mass-spring-damper 2 2 ζ ω n (rad/sec) 2 ( ζ < 1), 1 (ζ = 1), ( ) 1

Buy one get one with discount promotional strategy

Journal of Educational Innovation Research 2017, Vol. 27, No. 3, pp DOI: (NCS) Method of Con

09권오설_ok.hwp

, ( ) 1) *.. I. (batch). (production planning). (downstream stage) (stockout).... (endangered). (utilization). *

3 Gas Champion : MBB : IBM BCS PO : 2 BBc : : /45

<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

歯안주엽홍서연원고.PDF

BSC Discussion 1

조사연구 권 호 연구논문 한국노동패널조사자료의분석을위한패널가중치산출및사용방안사례연구 A Case Study on Construction and Use of Longitudinal Weights for Korea Labor Income Panel Survey 2)3) a

methods.hwp

融合先验信息到三维重建 组会报 告[2]

Chapter4.hwp

( )실험계획법-머리말 ok

비선형으로의 확장

내용 q Introduction q Binary passand modulation Ÿ ASK (Amplitude Shift Keying) Ÿ FSK (Frequency Shift Keying) Ÿ PSK (Phase Shift Keying) q Comparison of

- 1 -

untitled

14.531~539(08-037).fm

지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

Multi-pass Sieve를 이용한 한국어 상호참조해결 반-자동 태깅 도구

<4D F736F F D20BDC3B0E8BFADBAD0BCAE20C1A B0AD5FBCF6C1A45FB0E8B7AEB0E6C1A6C7D E646F63>

09구자용(489~500)

statistics

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 25(12),

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

KDI정책포럼제221호 ( ) ( ) 내용문의 : 이재준 ( ) 구독문의 : 발간자료담당자 ( ) 본정책포럼의내용은 KDI 홈페이지를 통해서도보실수있습니다. 우리나라경

<4D F736F F F696E74202D20454D49A3AF454D43BAEDB7CEBCC52EBBEABEF7BFEBC6F7C7D428BBEFC8ADC0FCC0DA >

歯4차학술대회원고(장지연).PDF

chap 5: Trees

슬라이드 1

G Power

90°íÀº¿µ(½ÉÆ÷)

hwp

±è¼ºÃ¶ Ãâ·Â-1

KAERITR hwp

Microsoft Word - KSR2012A038.doc

시스템경영과 구조방정식모형분석

about_by5

유한차분법을 이용한 다중 기초자산 주가연계증권 가격결정

제 3 장평활법 지수평활법 (exponential smoothing) 최근자료에더큰가중값, 과거로갈수록가중값을지수적으로줄여나가는방법 시스템에변화가있을경우변화에쉽게대처가능 계산이쉽고많은자료의저장이필요없다 예측이주목적단순지수평활법, 이중지수평활법, 삼중지수평활법, Wint

Manufacturing6

DBPIA-NURIMEDIA

Microsoft Word - LectureNote.doc

Microsoft PowerPoint - IPYYUIHNPGFU

슬라이드 1

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE. vol. 29, no. 6, Jun Rate). STAP(Space-Time Adaptive Processing)., -

Æ÷Àå½Ã¼³94š

(JBE Vol. 21, No. 1, January 2016) (Regular Paper) 21 1, (JBE Vol. 21, No. 1, January 2016) ISSN 228

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Mar.; 28(3),

1 Nov-03 CST MICROWAVE STUDIO Microstrip Parameter sweeping Tutorial Computer Simulation Technology

Sequences with Low Correlation

08.hwp


서강대학교 기초과학연구소대학중점연구소 심포지엄기초과학연구소

- 2 -

<313920C0CCB1E2BFF82E687770>

슬라이드 1

Getting Started

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

<352E20BAAFBCF6BCB1C5C320B1E2B9FDC0BB20C0CCBFEBC7D120C7D1B1B920C7C1B7CEBEDFB1B8C0C720B5E6C1A1B0FA20BDC7C1A120BCB3B8ED D2DB1E8C7F5C1D62E687770>

1. 3DTV Fig. 1. Tentative terrestrial 3DTV broadcasting system. 3D 3DTV. 3DTV ATSC (Advanced Television Sys- tems Committee), 18Mbps [1]. 2D TV (High

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

Microsoft PowerPoint - m05_Equation1(Print) [호환 모드]

A Hierarchical Approach to Interactive Motion Editing for Human-like Figures

82-01.fm

Coriolis.hwp

로거 자료실

(001~006)개념RPM3-2(부속)


Vector Differential: 벡터 미분 Yonghee Lee October 17, 벡터미분의 표기 스칼라미분 벡터미분(Vector diffrential) 또는 행렬미분(Matrix differential)은 벡터와 행렬의 미분식에 대 한 표

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Dec.; 26(12),

Microsoft Word - KSR2012A021.doc

PDF

10(3)-10.fm

(2) : :, α. α (3)., (3). α α (4) (4). (3). (1) (2) Antoine. (5) (6) 80, α =181.08kPa, =47.38kPa.. Figure 1.

19(1) 02.fm

제 출 문 한국산업안전공단 이사장 귀하 본 보고서를 2002 년도 공단 연구사업계획에 따라 수행한 산 업안전보건연구수요조사- 산업안전보건연구의 우선순위설정 과제의 최종보고서로 제출합니다. 2003년 5월 연구기관 : 산업안전보건연구원 안전경영정책연구실 정책조사연구팀 연

<31372DB9DABAB4C8A32E687770>

에너지경제연구 Korean Energy Economic Review Volume 11, Number 2, September 2012 : pp. 1~26 실물옵션을이용한해상풍력실증단지 사업의경제성평가 1

PowerPoint 프레젠테이션

<B0A3C3DFB0E828C0DBBEF7292E687770>

DBPIA-NURIMEDIA

2017 년 6 월한국소프트웨어감정평가학회논문지제 13 권제 1 호 Abstract

04 Çмú_±â¼ú±â»ç

슬라이드 1

À̵¿·Îº¿ÀÇ ÀÎÅͳݱâ¹Ý ¿ø°ÝÁ¦¾î½Ã ½Ã°£Áö¿¬¿¡_.hwp

abstract.dvi

DBPIA-NURIMEDIA

동아시아국가들의실질환율, 순수출및 경제성장간의상호관계비교연구 : 시계열및패널자료인과관계분석

목차 포인터의개요 배열과포인터 포인터의구조 실무응용예제 C 2

금오공대 컴퓨터공학전공 강의자료

(specifications) 3 ~ 10 (introduction) 11 (storage bin) 11 (legs) 11 (important operating requirements) 11 (location selection) 12 (storage bin) 12 (i

Microsoft Word - KSR2012A103.doc

SRC PLUS 제어기 MANUAL

1_수시-최종-면지화보 복사.ps, page Normalize

., (, 2000;, 1993;,,, 1994), () 65, 4 51, (,, ). 33, 4 30, 23 3 (, ) () () 25, (),,,, (,,, 2015b). 1 5,

Transcription:

Robust Segmentation for Sensor Data in Semiconductor Manufacturing 한국 BI 데이터마이닝학회 2012 춘계학술대회 박은정, 박주성, 양지원, 조성준 Seoul National University Industrial Engineering Department

1. Introduction 반도체공정에서는다양한분석및공정상태를모니터링에활용하기위한 sensor data 가수집됨 ± 분석 : FDC 1), 가상계측, 혐의설비 / 파라미터탐색, 수율연계분석등 ± Ex: 데이터 (X) 를수율 (Y) 과연결지어혐의설비탐색 ± 모니터링 : 공정파라미터의장기간 trend 파악 2

1. Introduction 그러나 sensor data 는양이방대하여분석시계산부하가발생 ± 수백개의프로세스에대해매초공정파라미터의값과센서정보가기록됨 ± 하나의프로세스는수초에서수백초에이름 ± Lot 의개수와각 lot 내의 wafer 개수에따라데이터량이증폭됨 y: wafers x: sensors lot1 lot2 lot3 X Y 3

1. Introduction Sensor data 를여러개의 segment 로분할하여요약하면계산부하를줄일수있음 ± 용어정의 Segmentation = 시계열의 trace data 를여러 segment 로나누는행위 Segment = 위의 segmentation 의결과로나오는 data segment ± 각 segment 내에서는 data 가유사한특성을가지도록하는것이핵심 4

1. Introduction 그러나반도체공정에서나타나는다양한형태의데이터에대해 robust 하게 segmentation 하는것은간단하지않음 (a) Discrete-type data (b) Continuous-type data (c) Mixed data (d) Noisy data 5

1. Introduction 데이터를 segmentation 하기위해기존에는 chamber step 정보를사용함 ± 기존방법 : Chamber step-based Segmentation 공정 recipe 에따른 chamber step 정보를이용하여 segment 를나눔 각 chamber step 의시작과끝에서 segmentation Ex: Chamber step {A, B,, G} 를가지는 process A B C D E F G 기존 : Chamber step 기반 framing 6

1. Introduction 그러나 chamber step 은생산정보에의해나누는것이므로, signal 의특징을반영못한다는단점을내재함 ± Chamber step-based segmentation 의 underlying assumptions (a) 가정 1: Chamber step 변경시 data value 가바뀜 (b) 가정 2: 대표값은구간의통계량 min., max., mean, std. - 으로충분함 Ex: Chamber step {A, B,, G} 를가지는 process (a) (b) Min. = -1.7256 Max. = 0.6136 Mean = -0.0074 Std. = 1.0067? 기존 : Chamber step 기반 framing 7

2. Related Work Signal 의특징을잘반영하기위해서 data 를기반으로 segmentation 할수있으며, 이때대표적으로 moving windows 가사용될수있음 ± 개요 1: 전체 wafer들을 average로 aggregation한후, 기존데이터를변화량의절대값으로변환 D mt = mt+ 1 - mt, t = 1, 2,..., n -1 2: For i = 1 to n-w (w: 윈도우크기, k: 허용범위 ) end if D > (W ) + (W ) m i + k mean i, w k std i, w ± Model Parameters k: 작을수록 sensitive 하게변화탐지 w: window 크기. 작을수록최신의데이터만을반영 4 3 2 1 0-1 -2-3 -4-5 -6 0 20 40 60 80 100 120 8

2. Related Work Bayesian change point detection (BCPD) 은 machine learning 분야에서널리사용되는방법론임 ± 개요 1: UPM(underlying predictive model) + hazard function 으로구성 2: UPM 은 CP 마다 parameter 값이바뀌는예측모델 3: Hazard function 은 run length r 에따라 CP 가일어날확률 ± Model Parameters r: Hazard function 의 run length 1 0.5 0-0.5-1 -1.5-2 0 20 40 60 80 100 120 0 D1 Bayesian Changepoint detection 20 40 60 80 100 120 0 20 40 60 80 100 120 9

2. Related Work Kalman filter 도 BCPD 와마찬가지로추정값이현재값과크게다른경우에 segment 를나누는방식으로 segmentation 에사용가능 ± 개요 1: 모든 wafer aggregation 2: 칼만필터 1) 로추정한값이현재의값과크게다르면자료의특성이바뀌었다고볼수있으므로 해당지점에서프레임을나눔 x - x > c Var( x ) Var( x - xˆ ) k ˆ k k k k k k Parameter 의민감도를줄이기위한 term - Effect: parameter c 의범위가 [0, ) 에서 reasonable 한 range 로바뀜 - 현재 dataset 들에대한실험에서는 [0.1,1.1] ± Model Parameters Q k, R k ( 오차의공분산행렬 ) : 변화에대한민감도 c( 오차범위의길이 ) : 오차에대한민감도 y 1.5 1 0.5 0-0.5-1 -1.5-2 -2.5 true observed smoothed 0 20 40 60 80 100 120 140 x 10

2. Related Work Applied mathematics 에서제안된 free knot spline with knot removal 은 continuous function data 에서변화를찾아내는데탁월한성능을발휘함 ± 개요 1: 전체 wafer diversion aggregation 2: Free knot이존재한다는가정하에, 아래의 Schoenberg functional이 minimum이되는 spline을 nonlinear least squares problem의 optimization 문제로접근하여선택함 1) RSS, N i i ò i= 1 2 2 ( f l) = ( y - f ( x )) + l { f ( t) } dt å ± Model Parameters k-1 : spline 의차수 Initial knots 11

2. Related Work 그러나반도체공정에서나타나는다양한형태의데이터에대해 overall 하게좋은성능을가지는알고리즘은알려지지않음 Method Description Train 1 Moving Windows 2 Bayesian Change Point Detection 3 Kalman Filter 4 Free knot spline with knot removal 데이터변화량이최근데이터와많이다를때프레임나눔 UPM의추정값과현재값이크게다르면프레임나눔 KF의추정값과현재값이크게다르면프레임나눔 Interpolation 후최적화를통한 knot 의위치추정 Mean Training Time (sec) Strengths Weaknesses Online 0.003 - 계산이쉽고간단함 - Parameter 를정하기어려움 Online 0.0292 Online 0.11 Batch 1.064 - Outlier 에둔감함 - Parameter 에둔감함 - 상태를잘추적 - 확률을제공 - 프레이밍결과를비교할수있는척도가존재하여자동으로모델파라미터최적화가능 (RMSE) - 예측함수가후행하여실제변화점보다늦게 CP 를선언함 - 다소복잡 - Parameter 를정하기어려움 - 학습시간이 record 의개수에 dependent - Continuous data 의 framing 은잘됨 - Discrete data 의경우성능이떨어짐 12

3. Proposed Framework 다양한형태의 data 에대해 robust 한 segmentation 을제안하기에앞서, 먼저무엇이 좋은 segmentation 인지에대한명확한정의가필요함 ± 좋은 segmentation의조건? 선형성 : 선형구간으로잘게나눔 min( 선형회귀잔차의제곱합 ) 단순성 : 구간의개수가최소가되게나눔 min( 프레임의수 ) 위두조건은 trade-off 관계임 ìï ( MSEm) n arg min Error( m) = arg min í + l m m ïî ( MSTm ) T ( 비 ) 선형성 ( 비 ) 단순성 T 1 where ( MSE ) ( m = å ymt - yt ) T - 2 t= 1 T 1 2 ( MST ) = å( yt - y) T -1 t= 1 y, y = linear regression value, mean mt m üï ý ïþ 2 m Î{implemented models (e.g., 기존, 제안 )} 13

3. Proposed Framework Data 의 continuity 를기준으로모든 data 를 discrete-type data 와 continuous-type data 으로나눔 Continuity indices Continuous range (CR) 데이터의변화량이 nonzero 인 time instance 가연속적으로나타나는구간 Continuous range ratio (c) 데이터에서 CR 이차지하는비율 y CR1 CR2CR3 Ex: T=110, k=3 c =(62+5+3)/130=0.64 t if ( c>continuousthreshold ), discrete-valued data D else, continuous-valued data D 14

3. Proposed Framework Discrete-type data 는 Abnormal Difference, continuous-type data 는 free knot spline with knot removal 으로각각 segmentation 함 ± Discrete-valued data Abnormal difference ± Continuous-valued data Free knot spline with knot removal 15

3. Proposed Framework Abnormal difference 는데이터의변화량이큰지점에서 segmentation 을하는알고리즘임 예시 k AD Parameter k AD : 작을수록 sensitive 하게변화탐지 16

4. Experimental Results 실험에는반도체 8 대공정 1) 을모두포함하는실제 sensor data 이용 ± Data 기간 : 1달분 변수 : 가공시각, Wafer ID, Chamber step, Data value 총 62개데이터셋 17

4. Experimental Results 기존 chamber step-based segmentation 에비해평균 38.54% 의성능향상 ± Evaluation: 성능향상정도 = ( 기존 - 제안 )/ 기존 *100 평균향상 : 38.54% 최대향상 : 84.72% 최소향상 : -4.92% 데이터번호 기존 제안 향상정도 (%) 1) 1 0.31 0.13 59.0 2 0.71 0.48 32.5 3 0.19 0.07 64.5 4 0.68 0.46 32.2 5 0.93 0.35 62.2 6 0.91 0.36 60.0 7 0.07 0.05 33.3 8 0.63 0.40 35.7 9 0.35 0.19 46.8 11 0.78 0.61 21.4 12 0.44 0.29 34.1 14 0.53 0.40 26.1 15 0.27 0.19 28.6 16 0.41 0.28 32.2 17 0.63 0.59 5.7 18 0.47 0.19 60.3 19 0.30 0.30 0.6 20 0.56 0.23 58.8 23 0.66 0.29 55.7 24 0.61 0.27 55.2 25 1.07 0.37 65.6 26 0.25 0.17 33.2 27 0.57 0.16 72.5 28 0.58 0.18 69.4 29 0.40 0.09 78.8 30 0.22 0.13 41.7 31 0.27 0.21 22.3 32 0.42 0.43-2.7 데이터번호 기존 제안 향상정도 (%) 33 0.32 0.19 41.7 34 0.54 0.11 79.8 35 0.61 0.44 27.4 36 0.87 0.46 47.0 37 0.77 0.28 63.8 38 0.42 0.44-4.9 39 0.39 0.39 1.2 40 0.45 0.21 54.0 41 0.28 0.20 28.5 42 0.71 0.26 63.4 43 0.78 0.62 21.1 44 0.32 0.16 51.0 46 0.28 0.24 13.9 47 0.53 0.30 42.3 48 0.53 0.30 42.3 49 0.63 0.37 40.5 50 0.54 0.40 26.9 52 0.78 0.12 84.7 53 0.36 0.23 36.2 54 0.82 0.21 74.1 55 0.27 0.20 28.6 56 0.64 0.38 40.8 57 0.54 0.43 20.7 58 0.62 0.62 0.1 59 0.66 0.55 16.3 60 0.64 0.59 7.3 61 0.29 0.25 14.6 62 0.33 0.30 9.5 18

4. Experimental Results 제안된방법론을사용하는경우, signal 의특성이변하는시점에서데이터가 segmentation 되었음을확인할수있음 (a) (b) 기존 (e=0.91) 제안 (e=0.36) 기존 (e=0.57) 제안 (e=0.16) 60.0% 성능향상 72.5% 성능향상 (c) (d) 기존 (e=0.54) 제안 (e=0.11) 기존 (e=0.78) 제안 (e=0.12) 79.8% 성능향상 84.7% 성능향상 19

5. Conclusion 요약 ± 본논문에서는 linearity와 parsimony를기준으로하는 data-based segmentation framework를제안함 ± 이 framework는데이터가어떠한 arbitrary한모양을가지더라도 robust한성능을보임 ± 제안한방법의유효성을검증하기위해객관적인 evaluation metric을제안 ± 위 metric을기준으로제안한방법이 chamber step-based segmentation보다성능이 38.54% 좋아졌음을검증함 20

Contact Information Any Questions? E-mail: ejpark04@snu.ac.kr Homepage: http://dmlab.snu.ac.kr ejpark04@snu.ac.kr 21