The study on survivability of Korean-American Lung cancer patients in SEER data with Kaplan Meier Method Daegon Cha Department of Industrial Engineeri

Similar documents
Jkbcs016(92-97).hwp


( )Jkstro011.hwp



012임수진

한국성인에서초기황반변성질환과 연관된위험요인연구

김범수

연구분야 ( 코드 ) 과제번호 과제성격 ( 기초, 응용, 개발 ) 응용실용화대상여부비실용화 연구과제명 과제책임자 세부과제 지원목적과제프로그램공개가능여부공개 ( 공개, 비공개 ) ( 국문 ) 전장유전체유전자다형데이터를이용한표적유전자의발굴 ( 영문 ) Ide

Lumbar spine

1..


서론

서론 34 2

DBPIA-NURIMEDIA

기관고유연구사업결과보고

DBPIA-NURIMEDIA

Jkbcs032.hwp

전립선암발생률추정과관련요인분석 : The Korean Cancer Prevention Study-II (KCPS-II)

년암발생자수는 년대비 명이증가하여 년의 년 대비암발생자수증가 명증가 와비교하여둔화되었다 모든암연도별연령표준화발생률추이 모든암의조발생률은 년 만명당 명으로 년 만 명당 명과비교하여 명증가하였다 남자의조발생률은 년과비교하여 만명당 명증가하였 으며 여자의조발생률은 년과비교하

YI Ggodme : The Lives and Diseases of Females during the Latter Half of the Joseon Dynasty as Reconstructed with Cases in Yeoksi Manpil (Stray Notes w

Kaes017.hwp

Can032.hwp

DBPIA-NURIMEDIA

부속

내시경 conference

°Ç°�°úÁúº´6-2È£

최악의암사망률, 폐암 : 발암의원인그리고예방과치료 서론암은현대인의건강한삶을위협하는질환이다. 암은인구 10만명당 153명으로국내에서독보적인사망원인 1위질환으로알려져있다. 이중폐암으로인한사망자는인구 10만명당 35.1명으로성별을불문하고암으로인한사망자중가장큰비중을차지하며,

Journal of Educational Innovation Research 2016, Vol. 26, No. 3, pp DOI: * Meta Analysis : T

Journal of Educational Innovation Research 2018, Vol. 28, No. 4, pp DOI: * A Research Trend


975_983 특집-한규철, 정원호


ÀÌÁÖÈñ.hwp

Kaes025.hwp

歯1.PDF

06_À̼º»ó_0929

연하곤란

생존분석의 추정과 비교 : 보충자료 이용희 December 12, 2018 Contents 1 생존함수와 위험함수 생존함수와 위험함수 예제: 지수분포

12이문규

<31372DB9CCB7A1C1F6C7E22E687770>

07_Àü¼ºÅÂ_0922

A 617

Analyses the Contents of Points per a Game and the Difference among Weight Categories after the Revision of Greco-Roman Style Wrestling Rules Han-bong

서울도시연구_13권4호.hwp


DBPIA-NURIMEDIA

°Ç°�°úÁúº´5-44È£ÃÖÁ¾

00약제부봄호c03逞풚

04_이근원_21~27.hwp

DBPIA-NURIMEDIA

산업입지내지6차


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


#Ȳ¿ë¼®

Àå¾Ö¿Í°í¿ë ³»Áö

황지웅

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

<31342D3034C0E5C7FDBFB52E687770>

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

유선종 문희명 정희남 - 베이비붐세대 소유 부동산의 강제매각 결정요인 분석.hwp

보건사회연구-25일수정

11¹Ú´ö±Ô

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Study on the Pe

( )Kju269.hwp

230 한국교육학연구 제20권 제3호 I. 서 론 청소년의 언어가 거칠어지고 있다. 개ㅅㄲ, ㅆㅂ놈(년), 미친ㅆㄲ, 닥쳐, 엠창, 뒤져 등과 같은 말은 주위에서 쉽게 들을 수 있다. 말과 글이 점차 된소리나 거센소리로 바뀌고, 외 국어 남용과 사이버 문화의 익명성 등

노영남

untitled

Vol.257 C O N T E N T S M O N T H L Y P U B L I C F I N A N C E F O R U M

歯14.양돈규.hwp

Abstract Background : Most hospitalized children will experience physical pain as well as psychological distress. Painful procedure can increase anxie

Microsoft PowerPoint - 김미영

Kor. J. Aesthet. Cosmetol., 및 자아존중감과 스트레스와도 밀접한 관계가 있고, 만족 정도 에 따라 전반적인 생활에도 영향을 미치므로 신체는 갈수록 개 인적, 사회적 차원에서 중요해지고 있다(안희진, 2010). 따라서 외모만족도는 개인의 신체는 타

Investment Proposal

untitled

DBPIA-NURIMEDIA

2014_ pdf

Æ÷Àå½Ã¼³94š

Journal of Educational Innovation Research 2017, Vol. 27, No. 4, pp DOI: * A Study on Teache

DBPIA-NURIMEDIA

<31335FB1C7B0E6C7CABFDC2E687770>

Microsoft Word - P02.doc

120304강신용

IKC43_06.hwp

(5차 편집).hwp

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

歯MW-1000AP_Manual_Kor_HJS.PDF

,,,.,,,, (, 2013).,.,, (,, 2011). (, 2007;, 2008), (, 2005;,, 2007).,, (,, 2010;, 2010), (2012),,,.. (, 2011:,, 2012). (2007) 26%., (,,, 2011;, 2006;

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: : * Research Subject


878 Yu Kim, Dongjae Kim 지막 용량수준까지도 멈춤 규칙이 만족되지 않아 시행이 종료되지 않는 경우에는 MTD의 추정이 불가 능하다는 단점이 있다. 최근 이 SM방법의 단점을 보완하기 위해 O Quigley 등 (1990)이 제안한 CRM(Continu

03-ÀÌÁ¦Çö

Journal of Educational Innovation Research 2019, Vol. 29, No. 2, pp DOI: 3 * Effects of 9th


05 ƯÁý

련이있으며, 암이진행될수록그리고예후가좋지않을수록양성률및측정값이증가하며, 비소세포성폐암의항암치료에대한반응을예측하는인자로도이용될수있다고보고되었다 [4, 6-9]. 따라서본연구에서는폐암의높은발병률및치사율에따른중요성을감안하여 Cyfra 21-1의진단적유용성을확인하고자폐암환자,

( )Jksc057.hwp


< FB4EBB1B8BDC320BAB8B0C7BAB9C1F6C5EBB0E8BFACBAB820B9DFB0A320BFACB1B85FBEF6B1E2BAB92E687770>

Transcription:

The study on survivability of Korean-American Lung cancer patients in SEER data with Kaplan Meier Method Daegon Cha Department of Industrial Engineering, the University of Ajou, Suwon Abstract According to 2012 WHO (World Health Organization) Health Data, not only lung cancer ranks at the most common cancer in the world, but the cancer also is the deadliest one among all type of cancer in the world. Therefore, it is imperative to analyze causing factors of lung cancer and study the best medical treatment against threat of lung cancer. In order to provide fundamental research for lung cancer, I focus on survivability of Korean-American by utilizing SEER (Surveillance Epidemiology End Result program) data. Also, results of this study will be expanded to further researches about defining differences of attributes impacting on survivability between KA(Korean-American) lung cancer patients and those of Korean. In this research, I studied survivability of KA with lung cancer in United States and then figuring out how three factors such as age, grade and types of lung cancer affect survivability of lung cancer patient. I selected 601 cases of KA with lung cancer from over 4.7 million datasets in SEER data and used Kaplan Meier method to examine 601 patient s survivability. Keywords: Kaplan Meier, Lung cancer, SEER 1. Introduction 폐암은전세계적으로가장흔하게나타나는암질환중의하나로, 남자와여자모두에게서암으로인한사망의제 1 원인으로알려져있다. [1] 폐암의가장큰원인은흡연이며, 폐암위험은흡연량과흡연기간에따라달라진다. 그외에는간접흡연, 직업성이나환경적으로라돈, 석면, 크롬, 비소, 카드뮴에대한노출과더불어방사선, 대기오염또는실내에서발생하는연기가원인이될수있다. [2] WHO 의조사에따르면, 미국에서폐암의 5 년생존율은 16% 이고, 전이가일어나지않은채진단된원발성폐암의생존율은 53% 이다 [3]. 또한, 우리나라의경우 2013 년통계청이발표한사망원인통계에따르면, 인구 10 만명당암에의한사망률은 149 명으로그중, 폐암 (34 명 ), 간암 (22.6 명 ), 위암 (18.2) 명이였으며, 폐암사망률은 2012 년대비전년대비 2.7% 증가하였다. [4] 폐암은조기진단이어렵고, 종양이발견된다고해도이미많이 진행되어있는경우가많기때문에, 주요선진국에서도생존율이높지않는편이다. 국내폐암생존율에대한연구로써, 각의료기간에보관되어있는폐암환자데이터를기반한폐절제수술후의환자들의생존율분석과병기에따른생존율분석에국한되어있는경우가많았다. 이러한연구방식의한계점을극복하고자본연구의목적은여러의료기관에서수집한포괄적인한국인폐암환자의데이터를기반으로생존기간을분석하는데에있다. 하지만국내의의료정보보호법과공공의료데이터획득이용이하지않는환경을감안하여, 미국국립암센터 (National Cancer Institute) 에서공개적으로제공하는 SEER(Surveillance Epidemiology and End Results) 데이터를활용하여연구를진행한다. 본연구에서는 1971 년부터현재까지축적된약 470 만건의 SEER 데이터중에서, 암의병기 (Stage) 가명확히확인된한국인교포폐암환자 601 명의데이터를추출하고, 각요인에맞는데이터전처리작업과생존기간분석기법인 Kaplan Meier method 를통해나이, 병기 (Stage) 그리고

폐암의종류가환자의생존기간에얼마나요인을미치는지연구하고자한다. 2. Methods 2.1 데이터선정및요인선정. 본연구는약 470 만건의 SEER 암환자데이터중에서 Stage1 에서 Stage4 까지의병기가명확히확인된한국인폐암환자 601 명을대상으로진행하였다. 요인으로폐암환자의나이, 병기 (Stage), 폐암의세부종류들로총 3 가지요인을바탕으로생존율을분석하였다. 특히, 폐암의세부종류의분류는전세계폐암발생중 80%~85% 를차지하고있다고보고되는비소세포성폐암의 3 가지종류즉, 선암, 편평세포암, 대세포암으로폐암을세분화하여각종류에대해생존율을분석하였다. 2.1.1 선정된샘플의특성분석 Table 1. Characteristics of 601 Cases Sex Percentage Male 311 51.7% Female 290 48.3% Total 601 Grade Stage1 50 8.3% Stage2 164 27.3% Stage3 309 51.4% Stage4 78 13.0% Total 601 Age Group 20~39 7 1.2% 40~59 150 25.0% 60~79 366 60.9% 80~99 78 13.0% Total 601 Cell Type of Lung Cancer (*ICD #) ** 8140 207 52.9% *** 8070 158 40.4% **** 8012 26 6.6% Total 390 * 국제질병분류코드 (International Classification of Disease) ** 선암 (Adenocarcinoma) *** 편평세포암 (Squamous Cell Carcinoma of Lung) **** 대세포암 (Large-Cell Carcinoma of Lung) 2.2 데이터분석기법 본연구에서사용하는 Kaplan Meier 란, 생존기간을분석하여생존곡선을추정하는통계기법으로치료방법, 예후인자등이생존에미치는효과를추정하는데사용된다. Kaplan Meier 는생존여부와생존기간, 그리고생존율에영향을끼칠것이라고생각되는요인하나즉, 3 가지의데이터를기반으로생존율을나타낸다. SEER 데이터에서나타난생존여부는환자의암이환자의죽음에직접적인영향을끼친경우에만 사망 (Death) 로기록하였다. 또한생존기간은 0 부터 9998 개월까지의생존한 Month 를기록을하며, 환자의생존기간을알수없는경우에는 9999 로기록되어있다. 따라서본연구에는 9999 로기록된케이스를제외한나머지케이스로환자의생존기간을나타내었다. 또한본연구에서는 P value < 0.05 일때통계학적으로유의하다고판단하였다. 2.3 각요인별생존율결과화면구성 요인별생존율도출화면은총 3 가지로구성되어있다. 첫번째는각요인의총케이스수및사망 (Event) 가발생수를정리한케이스요약이다. 두번째는생존시간에대한평균및중위수를나타내는표이며, 마지막으로 Kaplan Meier 기법으로나타난결과가계단식생존함수로나타난다. Results 부분에서각요인별결과값을나타낼예정이다. 3. Results 3.1 나이그룹별 (Age Group) 생존율분석및결과. SEER 데이터에서기본적으로제공하는나이분류는총 18 가지로분류되어있다. 이는 0 세부터 84 까지 5 살단위로끊어총 17 가지의그룹으로묶여있고, 마지막 18 번째그룹은 85 세이상으로되어있다. 하지만본연구의대상이되는 601 명의한국교포의폐암환자특성을고려하였을때, 기존 SEER 에서제공하는나이그룹은과도하게많기때문에, 생존함수도표의가독성향상을위해 20 살단위로축소하여총 4 개의그룹으로재코딩하였다. 밑의 Table 2 안의왼쪽표는기존 SEER

데이터에서기초나이별구분이고, 오른쪽표는 20 살단위로다시분류한나이별그룹이다. 내용은아래의 Table 4 의나이그룹별평균생존시간및중위수 (Median) 에서확인할수있다. Table 2. Code Description for Age group *SEER 나이구분 Table 4. Average Survivability for Age group 코드 구분 00 Age 00 01 Age 01-04 02 Age 05-09 03 Age 10-14 04 Age 15-19 05 Age 20-24 06 Age 25-29 07 Age 30-34 08 Age 35-39 09 Age 40-44 10 Age 45-49 11 Age 50-54 12 Age 55-59 13 Age 60-64 14 Age 65-69 15 Age 70-74 16 Age 75-79 17 Age 80-84 18 Age 85+ 99 Unknown ** 변경후나이구분 코드 구분 01 Age 20-39 02 Age 40-59 03 Age 60-79 04 Age 80-99 Age group 평균생존값 중위수 1 (20-39) 96 96 2 (40-59) 353.083 351 3 (60-79) 171.383 167 4 (80-99) 82.350 83 전체 232.646 278.419 위의표를보면, 20 에서 39 사이의나이그룹은평균생존값이상대적으로높아보이진않지만, 적은표본수 (7 명 ) 와사망자 (1 명 ), 90% 에가까운중도절단 ( 추적불가 ) 을고려해봤을때, 이평균생존값이해당연령대의평균생존값을대표한다고보긴힘들다. 그룹 1 을제외한나머지나이그룹별평균생존값은나이별그룹이높아짐에따라전그룹대비약 50% 씩생존값이감소하는경향을볼수있었다. 환자의나이그룹분류작업을완료한후 SPSS 의 Kaplan Meier 생존율분석을실시하였다. 2 개의결측값을제외한나머지 599 건이활용되었다. Table 3. Case Description for Age group Age group # of Case 사건 (Death) 퍼센트 1 (20-39) 7 1 85.7% 2 (40-59) 150 9 94.0% 3 (60-79) 365 37 89.9% 4 (80-99) 77 9 88.3% 전체 599 56 90.7% 60 세부터 79 세까지의환자가 365 명으로가장많았으며, 전체적으로나이에상관없는높은생존율을보여주었다. 하지만 Table4 에나타난것같이평균생존값은나이와비례해낮아지는것을볼수있다. 이에관련해나이그룹별생존율에대한자세한 Figure 1. Survivability Function for Age Group 생존함수에나타난 X 축은생존기간이며, Y 축은생존기간에따른누적생존율을나타낸다. 나이별그룹 1 (20 세 ~39 세 ) 은 100 개월이넘어가면서급격한절단면이나타나해당나이별그룹샘플 7 명중 1 명의사망자를제외한 6 명에대한추적이끝난것으로추측해볼수있다. 나이별그룹 2(40 세 ~59 세 ) 는그룹 1 을제외한나머지그룹중중위수 29 년에가까운월등한생존율을보여주었으며, 그룹 3 과 4 는각각

대략 13 년과 7 년으로급격히낮아지는것을볼수있었다. 3.2 폐암 Grade 별생존율분석및결과. SEER 데이터에서초기암병기분류는총 9 가지로나뉘어져있다. 1 번부터 4 번까지암의진행상태인 1 기에서 4 기를나타내며, 5 번부터 8 번까지는특수한형태를가진암을분류해놓은코드이다. 마지막으로 9 번은진행상태를정확히식별하기가불분명한암을분류해놓은코드이다. 서론에서논의했듯이, 본연구는암의진행상태가확실히구별이되는 1 기에서 4 기에해당하는한국인폐암환자 601 명을대상으로진행하였다. Table 5. SEER Code Description for Grade Code Description 1 Grade 1;well differentiated 사망하였다. 폐암기별평균생존시간및중위수는 Table 7 에서확인할수있다 Table 7. Average Survivability for Grade Grade 평균생존값중위수 Stage 1 256.96 169 Stage 2 251.05 216 Stage 3 181.185 167 Stage 4 134.28 126 전체 232.64 169 위의표를참조해보면, Stage 가진행될수록평균생존값이낮아지는것을확인할수가있다. 특히 Stage1 과 2 사이에는큰생존값의차이를보이진않지만, Stage2 와 3, Stage 3 과 4 사이의평균생존값의차가현격히커지는것을알수있었다. 2 Grade 2; moderately differentiated 3 Grade 3; poorly differentiated 4 Grade 4; undifferentiated 5 T-Cell 6 B-Cell 7 Null cell 8 N K cell 9 Stage between Grade 2 and 3 SEER 데이터중전체한국인암환자 10647 명중에서폐암의진행상태가명확한환자 601 명을선정하여 Kaplan Meier 분석을진행하였다. Table 6. Case Description for Grade Grade # of Case 사건 (Death) 퍼센트 Stage 1 50 7 86.0% Stage 2 164 16 90.2% Stage 3 307 23 92.5% Stage 4 78 10 87.2% 전체 599 56 90.7% 3 기의폐암이 307 건으로 1 기에서 4 기로판명된한국인폐암환자중가장많은케이스로나타났고, 전체 599 명중 56 명이 Figure 2. Survivability Function for Grade 생존함수를보면알수있듯이, 병기의진행이낮을수록높은생존값을보였다. Stage1 의평균생존값과 Stage4 의평균생존값을비교해보면대략누적생존확률이 40% 이상차이나는것을알수있다. 따라서 Stage 의진행여부가폐암환자의생존율에유의미한영향을끼친다고볼수있다. 3.3 폐암의세부종류별생존율분석및결과 서론에서논의했던것처럼전세계폐암발생중 80%~85% 를차지하고있다고보고되는비소세포성폐암의 3 가지종류즉, 선암, 편평세포암, 대세포암으로세분화하여각종류에대해생존율을분석하고자한다. 이를위해, 전체 SEER 데이터에서한국인 (Race code: 8) 이면서폐암환자 (Cancer Code:

C340~C349) 인 601 명을다시비소세포성폐암의하위그룹인선암 (ICD#:8140), 편평세포암 (ICD#:8070), 대세포암 (ICD#:8012) 으로재분류하여각각고유코드를부여하였다. Table 8. Case Description for subtypes of nonsmall cell lung cancer Figure 3 에서알수있듯이제 1 타입인선암의경우평균생존값이다른종류의비소세포성폐암보다월등히긴것으로나타났다. 따라서, 전체폐암환자중 80% 에서 85% 를차지하는비소세포성폐암중선암일경우환자의높은생존값에지대한영향을미칠것으로파악되었다 Code and # of Case 사건 (Death) 퍼센트 Type 1 ( 선암 ) 207 17 91.8% 2 ( 편평세포암 ) 157 15 90.4% 3 ( 대세포암 ) 26 4 84.6% 전체 390 36 90.8% 전체한국인폐암환자 601 명중세부비소세포성폐암을가진환자로분류한결과, 이분류에해당되는환자는 390 명으로, 가장많이보고된암은선암 (207 명 ) 이였다. Table 9. Average Survivability for subtype of non-small cell lung cancer Code 평균생존값중위수 1 type 287.5 284 2 type 180.46 167 3 type 129.88 126 전체 249.98 192 Table 7 을보면알수있듯이, 제 1 타입으로코딩한선암 (Adenocarcinoma) 환자는평균생존값이 287.5 개월로하위세개의비소세포성폐암중타암에비해월등히높은생존값을가지고있었다. 그뒤로제 2 타입인편평세포암 (Squamous Cell Carcinoma) 와제 3 타입인대세포암 (Large Cell Carcinoma) 은각각 180 개월, 129 개월의생존값을보여주었다. Figure 3. Survivability Function for subtypes of non-small cell lung cancer 4. Discussion 본연구에선 SEER 데이터내한국인폐암환자의생존기간에영향을미치는요인으로 Age, Grade 그리고비소세포성암의종류인선암, 편평세포암그리고대세포암을요인으로지정하여 Kaplan Meier Method 로생존분석을진행하였다. Age 에따른생존기간은나이별그룹이올라가수록전그룹대비 50% 정도의생존기간이하락하는양상을보였고이는 Age 가폐암환자의생존기간에유의한영향을미친다고볼수있다. Grade 요인에서는 Stage1 과 Stage2 의폐암환자간생존기간차이는 5 개월차이로유의한변화가없다가, Stage2 에서 Stage3 으로넘어가는단계에서 70 개월차이를보이는급격한생존기간의하락이눈에띄었다. 이는생존기간을높이기위해선폐암의심각한진행을발견하기위한조기검진이필요하다는것을시사해준다. 마지막으로, 비소세포성폐암세부종류별생존기간분석결과, 선암 (Adenocarcinoma) 의경우평균생존기간이 287.5 개월로다른종류의비소세포성폐암보다대략 150 개월이더긴것을알수있었다. 이번연구로본연구에서선택한 3 개의변수 (Age, Grade and subtype of non -small cell lung cancer) 모두가 SEER 데이터내한국인폐암환자의생존기간에영향을미치는것으로결론내었다. 또한예상과는달리 SEER 데이터내의한국교포폐암환자의생존기간이예상했던것보다높았던것이인상적이였다. 향후, 이연구를바탕으로국립암센터의폐암환자 Cohort DB 에서추출한결과와의비교연구를진행하여, 한국교포와한국인과의생존기간에미치는요인의차이점을도출하는연구를진행할예정이다. 5. References

[1] International Agency for Research on Cancer. GLOBOCAN 2012: Estimated cancer incidence, mortality and prevalence worldwide in 2012. (Retrieved from: http://globocan.iarc.fr 9-12-2015 ) [2] Global Cancer Facts & Figure 2nd Edition 15 page [3] Global Cancer Facts & Figure 2nd Edition 18 page [4] 2013 년사망원인통계 ( 통계청 2013) 10 page.