Original ORIGINAL Article ARTICLE Korean Circulation J 2005;35:759-765 ISSN 1738-5520 c 2005, The Korean Society of Circulation 단계적회귀분석을이용한혈중지질농도에서유전자의상대적효과분석 연세대학교의과대학의학통계학과, 1 연세대학교심혈관계질환유전체연구센터 2 송기준 1 고민진 1 박찬미 1 임길섭 1 장양수 2 김동기 1 Analysis of the Relative Effects of SNPs within a Gene to Serum Lipid Profiles Using Stepwise Linear Regression Kijun Song, PhD 1, Min Jin Go, BS 1, Chan Mi Park, MS 1, Kil Seob Lim, PhD 1, Yang Soo Jang, MD, PhD 2 and Dong Kee Kim, PhD 1 1 Department of Biostatistics and 2 Cardiovascular Genome Center, Yonsei University College of Medicine, Seoul, Korea ABSTRACT Background and Objectives:It is very important to distinguish between the primary and secondary genetic effects at different sites within a small genetic region. Therefore, we evaluated the relative effects of single nucleotide polymorphisms (SNPs) within a gene on the serum lipid profiles by using individual data. Subjects and Methods:To evaluate the contributions of SNPs in a region to the serum lipid profiles (total cholesterol, triglyceride, low density lipoprotein, high density lipoprotein), we used data that consisted of 808 individuals (327 males and 481 females) who did not have cardiovascular disease. In this study, we used a stepwise regression procedure to analyze the relative effects of four single nucleotide polymorphisms (ACE6, ACE7, ACE8, ACE10) in a gene region on the development of the serum lipid profiles in each gender group. Results:In the males, there were epistatic interaction effects between two loci (ACE6 ACE7, ACE6 ACE8, ACE6 ACE10, ACE8 ACE10 and ACE7 ACE8) and among three loci (ACE6 ACE7 ACE8, ACE6 ACE7 ACE10 and ACE6 ACE8 ACE10). Also, there are interaction effects between two loci (ACE6 ACE7, ACE6 ACE8, ACE6 ACE10, ACE7 ACE10 and ACE8 ACE10) and among three loci (ACE6 ACE7 ACE8, ACE6 ACE7 ACE10, ACE6 ACE8 ACE10 and ACE7 ACE8 ACE10) in the females. Conclusion:The results suggested that each of these loci is important in causing a relative change of the serum lipid profiles, even with simultaneously accounting for the effects at the other loci. In the results of the analysis, there existed the effects of individual loci and significant interaction between the loci on the serum lipid profiles in each gender group. It was confirmed that this stepwise regression method can be suitable for evaluating the relative effects of SNPs and it is easily performed. (Korean Circulation J 2005;35:759-765) KEY WORDS:angiotensin converting enzyme;lipids;regression;polymorphism genetic. 서론 질병과관련있는유전자를발견하는데있어서중요한방법론적논점의하나는질병발생과직접적으로관련된대립 유전자 (alleles) 와질병에직접적으로관여하지는않으나연관불균형 (linkage disequilibrium) 상태로그유전자의근처에위치하고있는유전자를구별해내는일이다. 이러한작업은유전자간의연관불균형의강도나단일유전자내에서 논문접수일 :2005 년 6 월 20 일수정논문접수일 :2005 년 8 월 5 일심사완료일 :2005 년 9 월 20 일교신저자 : 김동기, 120-752 서울서대문구신촌동 134 연세대학교의과대학의학통계학과전화 :(02) 2228-2491 전송 :(02) 364-8037 E-mail:dkkimbios@yumc.yonsei.ac.kr 759
760 Korean Circulation J 2005;35:759-765 질병에관여하는단일염기다형성 (single nucleotide polymorphism; SNP) 이하나이상존재할수있다는점때문에매우복잡한일이될수있다. 만약, 염색체상에서특정한질병의발생에관여하는국부 (region) 의위치가알려질경우, 그국부에는수많은단일염기다형성이존재할수있는데, 이때어떤단일염기다형성이혹은어떤조합 (combination) 이질병발생에중요한역할을하는지규명하는것은매우의미있는일이다. 또한, 질병발생과의관련성 (association) 이단순히연관불균형상태에있기때문에간접적으로나타나는것인지아니면직접적으로질병을야기하는효과때문인지규명하는것역시중요한일이라고할수있다. 이를검증하기위해흔히접근되는분석방법은반수체 (haplotype) 단위를이용하는것인데, 이는환자군과정상군에서관심있는유전소 (locus) 에있는대립유전자들의상대빈도 (relative frequency) 가그주변의유전소에있는대립유전자들의상대빈도와같은지를비교하는것이다. 1-4) 이러한방법은관심있는유전소에는동일한대립유전자들을갖고있고그렇지않은유전소에는다른대립유전자들을갖고있는반수체들에대하여환자군과정상군에서의비차비 (odds ratio) 를계산하여그효과를평가하는방법으로변형되기도하였다. 5-7) 그런데, 이러한반수체를이용한분석방법은몇가지의단점을내포하고있는데, 첫째유전소에있는복수의대립유전자들을동시에비교하기때문에어느대립유전자가질병발생에직접적으로관련이있는지밝혀내는것이명확하지않을수있고, 둘째반수체를구성하고있는유전소의수가다소많은경우에는통계학적비교를반복적으로수행해야하므로다중검정 (multiple testing) 에따른유의수준 (significance level) 의문제가대두될수있다. 또한, 반수체를구성하고있는유전소의순서등에의한조합 (combination) 에의해독특하게나타날수있는추가적인정보들을무시할가능성이존재하고있다. 8)9) 이러한기존의방법에대한한계를효율적으로극복하기위해회귀모형 (regression model) 에기초한방법이제시되었는데, 질병의유무 ( 예를들어, 환자군, 정상군으로구분된경우 ) 처럼두개의범주로구분되어있는질적형질 (qualitative trait) 인경우, 반수체를구성하고있는단일염기다형성들의상대적인효과를평가하기위해단계적로지스틱회귀분석 (stepwise logistic regression analysis) 방법이적용되었다. 10-13) 이에본연구에서는양적형질 (quantitative trait) 에대하여반수체를구성하고있는개별단일염기다형성및그조합들의상대적효과를평가하기위한방법으로단계적선형회귀분석 (stepwise linear regression analysis) 을제안하고자한다. 또한이를이용하여양적형질로서심혈관계질환 (cardiovascular disease) 발생과밀접하게관련이있다고알려진혈중지질농도 (serum lipid profile) 에대한특정한다형성들의상대적효과를실제로평가하고자한다. 대상및방법 본연구에서는연세대학교심혈관계질환유전체연구센터에서실시하는건강검진에참여한일반인들중에서, 질병이환에따른영향을배제하기위해심혈관계질환이없는남자 327(40.5%) 명, 여자 481(59.5%) 명, 총 808 명을그대상으로하였다. 연구대상들은심혈관계질환에대한위험인자가없고당뇨, 고혈압, 뇌혈관질환, 말초혈관질환등이없으며또한지질강하제나호르몬제제등을복용하지않는정상성인들로구성되어있다. 단일염기다형성으로서 ACE(Angiotensin Converting Enzyme) 에서 4개의유전소즉, -6(Alu I/D), -7(G14480C), -8(A14519G), -10(A22982G) 들의집합 (collection) 을이용했는데, 이들에관한유전형을분석하는절차는다음과같다. 먼저, DNA 는 PUREGENE DNA Purification kit(gen- TRA, Minneapolis, MA) 를이용하여 5 ml 혈액내의백혈구세포로부터추출하였다. DNA 추출후, ACE Alu I/D 의다형성분석은 ACE 유전자인트론 16번에 primer 를이용한중합효소연쇄반응 (PCR) 을수행하였는데, 이때 PCR thermal cycler(ptc-200, MJ Research, Waltham, MA) 를이용하여실시하였다. G14480C, A14519G 및 A22982G 의다형성분석은 SNP stream 25K system(orchid Biosciences, Prinston, NJ) 을이용하여 SNP-IT(SNP-Identification Technology) assay 방법으로단일염기확장반응을수행하였고, primer 와각각의 PCR 생성물을재생시킨후 biotin 또는 fluorescein isothiocyanate(fitc) 으로표지된각각의 dideoxynucleotide 와반응시켜단일염기를확장하였다. 반응이끝난후결과분석은 ELISA 판독기를이용하여분석하였으며최종유전자형은 QC ReviewTM program 을이용하여확인하였다. 양적형질은심혈관계질환과관련있다고알려진혈중지질농도들로서총콜레스테롤, 중성지방, LDL- 콜레스테롤, HDL- 콜레스테롤의수치를이용하였다. 본연구에서는개별적인단일염기다형성및그것들로구성된조합 (combination) 의상대적효과를평가하기위해단계적회귀분석방법을적용하는데먼저, 유전소의집합에서각각의유전형 (genotype) 에따라가변수 (dummy variable) 를정의하고다음과같이선형회귀모형 (linear regression model) 을설정한다. 즉, 2개의대립유전자로구성된첫번째유전소에있는단일염기다형성의유전형을 AA, Aa, aa로표현하기로한다면, 그것이혈중지질농도에유의한영향을주는지분석하기위해다음의모형 (1) 과같은회귀식 (regression equation) 을설정한다. 혈중지질농도 = β 0+β 1I AA +β 2I Aa (1) 여기에서, I AA 는유전형이 AA 이면 1, 아니면 0의값을갖는
Kijun Song, et al:relative Effects of SNPs to Serum Lipid Profiles 761 가변수이고 β 1 은그에따른회귀계수 (regression coefficient) 이다. 마찬가지로 I Aa 는유전형이 Aa이면 1, 아니면 0이되는가변수이고 β 2 는그에따른회귀계수이다. 위의회귀모형 (1) 에서회귀계수의추정치 (estimates) 가통계학적으로유의하다면유전적영향이존재한다고평가한다. 만약, 두번째의유전소에있는단일염기다형성또한혈중지질농도에영향을미치는지분석하고자한다면두번째유전소에있는유전형을포함시킨다음과같은모형 (2) 를설정할수있다. 혈중지질농도 = β 0+β 1I AA +β 2I Aa +β 3I BB +β 4I Bb (2) 여기에서, I BB 와 I Bb 는모형 (1) 에서정의한것과같은방식으로설정된가변수들이고, β 3 과 β 4 는각각그에따른회귀계수이다. 두번째유전소에서도혈중지질농도에유의한효과가존재하는지는모형 (1) 과모형 (2) 의비교를통하여분석하는데, 이는모형 (2) 가혈중지질농도를설명하는데모형 (1) 보다더적절하다면두번째단일염기다형성의효과또한유의하다고판단하는것이다. 비슷한경우로두단일염기다형성간에유전적교호작용 (epistatic interaction) 의효과가존재하는지분석할경우에는다음의모형 (3) 과위의모형 (2) 를비교하여분석한다. 혈중지질농도 = β 0+β 1I AA +β 2I Aa +β 3I BB +β 4I Bb β 5I AABB +β 6I AaBB +β 7I AABb +β 8I AaBb (3) 위의모형 (3) 에서, I AABB, I AaBB, I AaBb 는두개의유전소에서유전적교호작용을나타내는가변수들인데, 예를들어, I AABB 의경우두개의단일염기다형성의유전형이 AA와 BB이면 1, 그외에는모두 0의값을갖는가변수를말한다. 또한 β 0 β 8 은각가변수에해당되는회귀계수들이다. 지금까지설명한방법을이용하여관심있는유전소의개수만큼각단일염기다형성의개별적인주효과 (main effect) 와그것들의교호작용의효과에대한유의성을평가할수있다. 그런데, 이러한과정에서집합을구성하고있는단일염기다형성의개수가많아지게되면그주효과와교호작용에대한조합의수역시많아지게된다. 아울러그에따른모형의비교또한다양한각경우에대하여복잡하게이루어져야하므로, 유의성평가를효율적으로수행할필요성이대두된다. 이러한효율적인분석을수행하기위해, 본연구에서는적절한회귀모형의구축을위해일반적으로사용되는단계적변수선택 (stepwise variable selection) 방법을적용하였는데그절차는다음과같다. 14-17) 먼저, 종속변수에영향력이큰독립변수를하나씩선형회귀모형에추가해가는데, 이렇게독립변수들이추가된선형모형에서특정한독립변수가종속변수에유의한영향을미치지못하면이독립변수를선형회귀모형에서제외시킨다. 이러한방법을최적 의모형을구성할때까지계속반복하는것이다. SAS ver. 8.1(SAS Institute, Cary, NC) 을이용하여지금까지기술한단계적회귀분석방법을실제자료에적용하여분석하였다. 결 연구대상은분석하고자하는단일염기다형성들의정보를모두알고있는개인들로서, 평균연령은 48.6±10.4 세이고남자의경우평균연령은 48.4±10.7 세, 여자의평균연령은 48.8±10.1 세로분포하고있었다. 분석하고자하는혈중지질농도에서남자의경우, 평균 ± 표준편차는총콜레스테롤에서 206.37±39.82, 중성지방은 168.17±132.53, LDL- 콜레스테롤은 129.18±35.10, HDL- 콜레스테롤은 45.82± 10.22 의분포를보여주고있었다. 여자에서는총콜레스테롤의경우 209.30±38.08, 중성지방은 127.84±100.05, LDL- 콜레스테롤은 131.95±32.74, HDL- 콜레스테롤은 51.51± 11.98 의분포를보여주고있었다 (Table 1). ACE 단일염기다형성에서유전형의빈도는다음과같다 (Table 2). 또한, 유전형에따라구성가능한효과를나타내는가변수를생성했는데, 그개수는개별적인주효과에서 8개, 두개의다형성들간의교호작용에서 24개, 세개의다형성들간의교호작용에서 32개, 네개의경우에서 16개로총 80개의가변수를만들어분석에이용했다. 성별에따른유전적인영향을구분하여파악하기위해남 과 Table 1. Distribution of serum lipid profiles Trait Male (n=327) Female (n=481) Total cholesterol 206.94±40.340 208.03±37.850 Triglyceride 168.97±135.46 126.28±102.18 LDL-C 129.89±35.880 131.06±33.021 HDL-C 45.95±10.72..51.57±12.29 Values are Mean±SD. LDL-C: low density lipoprotein-cholesterol, HDL-C: high density lipoprotein-cholesterol Table 2. Frequency of ACE-SNP genotypes SNP Genotype Frequency (%) in male Frequency (%) in female ACE6 DD 157 (17.43) 064 (13.31) ID 159 (48.62) 243 (50.52) II 111 (33.94) 174 (36.17) ACE7 CC 111 (33.94) 173 (35.97) CG 160 (48.93) 241 (50.10) GG 156 (17.13) 067 (13.93) ACE8 AA 109 (33.33) 176 (36.59) AG 163 (49.85) 241 (50.10) GG 155 (16.82) 064 (13.31) ACE10 AA 100 (30.58) 162 (33.68) AG 166 (50.76) 235 (48.86) GG 161 (18.65) 084 (17.46) SNP: single nucleotide polymorphism, ACE: angiotensin converting enzyme, 6: Alu I/D, 7: G14480C, 8: A14519G, 10: A22982G
762 Korean Circulation J 2005;35:759-765 자와여자집단을각각나누어서혈중지질농도에대한 ACE 단일염기다형성들의상대적효과를평가하였는데, 남자의경우에서그결과는다음과같다 (Table 3). 먼저, 총콜레스테롤의경우 ACE6, ACE7, ACE8 의주효과에대한 R 2 의합은 4.5% 이었고, 두개의유전자간의교호작용, 즉 ACE6 과 ACE7 의교호작용 (ACE6 ACE7), ACE6 과 ACE8(ACE6 ACE8) 및 ACE6 과 ACE10 의교호작용 (ACE6 ACE10) 들에대한효과가상대적으로존재하고있었는데, 그때 R 2 의합은 2.7% 이었다. 또한세개의유전자, ACE6, ACE7 및 ACE8 간의교호작용 (ACE6 ACE7 ACE8) 에대한 R 2 은 0.2% 이었다. 모형에포함된효과들에대한총 R 2 의합은 7.4% 이었는데, 이때교호작용들에대한 R 2 의합은 2.9% 로서전체에서 39.2% 의상대적인효과를설명하고있는것으로나타났다. 중성지방의경우에는주효과는존재하지않았고교호작용의효과만존재하고있었는데, ACE6 과 ACE10(ACE6 ACE10), ACE8 과 ACE10(ACE8 ACE10) 의교호작용에대한 R 2 의합은 2.3% 이었고, ACE6, ACE8 및 ACE10 간의교호작용 (ACE6 ACE8 ACE10) 에대한 R 2 은 1.1% 로나타났다. LDL- 콜레스테롤에서는 ACE8 에서주효과에대한 R 2 이 0.9% 이었고, ACE6 과 ACE8 들과, ACE7 과 ACE8 들간의교호 작용 (ACE7 ACE8) 에대한 R 2 의합이 4.7% 이었으며, ACE6, ACE7 및 ACE8 간의교호작용과 ACE6, ACE8 및 ACE10 간의교호작용의효과에대한 R 2 의합은 1.2% 이었다. 이때총 R 2 의합이 6.8% 이었는데, 교호작용들에대한 R 2 의합은 5.9% 로서전체 R 2 의 86.8% 를차지하고있었고, 이것은주효과에비해 6.6 배나높은수치이다. 즉, 다형성들의조합에의한상대적인효과가크게존재하고있다는사실을암시하는것이라고볼수있다. HDL- 콜레스테롤의경우에는 ACE6, ACE8, ACE10 에서주효과에대한 R 2 의합은 9.9% 이고, ACE6 과 ACE7 의교호작용과 ACE6 과 ACE10 의교호작용에대한 R 2 의합은 2.0%, ACE6, ACE7 및 ACE10 간의교호작용 (ACE6 ACE7 ACE10) 의 R 2 은 1.2% 로나타났다. 여자에서혈중지질농도에대한 ACE 단일염기다형성들의상대적효과를분석한결과는다음과같다 (Table 4). 총콜레스테롤에서는 ACE6 과 ACE10 에서주효과에대한 R 2 의합이 0.7% 로나타났고, 두개의단일염기다형성간의교호작용에서 ACE6 과 ACE7, ACE6 과 ACE8 의교호작용에대한 R 2 의합은 0.3% 이었다. 또한 ACE6, ACE7 및 ACE10 간의교호작용에대한 R 2 은 0.8% 로서전체 R 2 에서교호작용들로설명되는 R 2 은 61.1% 를차지하고있었다. 중성지방의경우에 Table 3. Relative effects of ACE-SNPs to serum lipid profiles using stepwise regression analysis in male SNP Effect (genotype) Total cholesterol Triglyceride LDL-C HDL-C βˆ (SE) R 2 * βˆ (SE) R 2 βˆ (SE) R 2 βˆ (SE) R 2 ACE6 (ID) -138.0 (39.5) 1.4 18.3 (10.2) 16.9 ACE6 (II) -139.2 (39.7) 1.7 ACE7 (GG) -139.5 (48.3) 1.1 ACE8 (AG) 116.2 (35.2) 0.9 ACE8 (GG) -7.5 (28.4) 0.3-3.8 (15.4) 10.2 ACE10 (AG) 15.3 (10.2) 10.8 ACE10 (GG) -1.2 (15.3) 12.0 Sum of R 2 4.5 0.9 19.9 ACE6 (ID) ACE7 (CG) -19.0 (48.3) 0.3-24.9 (12.0) 11.0 ACE6 (ID) ACE8 (AG) 67.0 (55.8) 0.3-61.0 (49.6) 0.5 ACE6 (ID) ACE10 (AG) -75.2 (167.6) 0.4 16.7 (17.6) 10.3 ACE6 (ID) ACE10 (GG) 36.1 (19.9) 0.9 ACE6 (II) ACE8 (AG) -107.0 (42.9) 2.9 ACE6 (II) ACE8 (GG) -66.3 (48.8) 1.0-52.9 (35.2) 0.7 ACE6 (II) ACE10 (AG) -9.0 (11.7) 0.2-19.9 (10.6) 10.7 ACE7 (GG) ACE8 (AG) -87.0 (49.6) 0.6 ACE8 (AG) ACE10 (AG) 95.5 (167.6) 0.7 ACE8 (AG) ACE10 (GG) 126.4 (160.9) 1.2 Sum of R 2 2.7 2.3 4.7 12.0 ACE6 (ID) ACE7 (CG) ACE8 (AG) -53.3 (62.5) 0.2-60.1 (35.2) 0.7 ACE6 (ID) ACE7 (CG) ACE10 (AG) -27.4 (15.8) 11.2 ACE6 (II) ACE8 (AG) ACE10 (AG) 88.6 (116.7) 1.1-40.0 (35.1) 0.5 Sum of R 2 0.2 1.1 1.2 11.2 Total R 2 7.4 3.4 6.8 13.1 ACE: angiotensin converting enzyme, SNP: single nucleotide polymorphism, LDL-C: low density lipoprotein-cholesterol, HDL-C: high density lipoprotein-cholesterol, βˆ: estimate of regression coefficient, SE : standard error, 6: Alu I/D, 7: G14480C, 8: A14519G, 10: A22982G. *: R2 s are percent
Kijun Song, et al:relative Effects of SNPs to Serum Lipid Profiles 763 Table 4. Relative effects of ACE-SNPs to serum lipid profiles using stepwise regression analysis in female SNP Effect (genotype) ACE6 (ID) -5.8 (16.7) 0.2 는 ACE6, ACE8 의주효과가존재하고있었는데, 그때 R 2 의합은 0.7% 이었고 ACE6 과 ACE10 의교호작용및 ACE7 과 ACE10 의교호작용 (ACE7 ACE10) 의효과에대한 R 2 은 0.6% 이었다. 세개의다형성에서 ACE6, ACE7 및 ACE8 간의교호작용과 ACE7, ACE8 및 ACE10 간의교호작용 (ACE7 ACE8 ACE10) 에대한효과가나타났는데, 그때 R 2 의합은 0.9% 이었다. 전체 R 2 의합 2.2% 에대하여교호작용들의 R 2 은 1.5% 로서약 68.2% 를차지하고있었다. LDL- 콜레스테롤에서는 ACE7 과 ACE8 의주효과에서 R 2 이 0.3% 이었고 ACE6 과 ACE7, ACE6 과 ACE10, ACE8 과 ACE10 의두개의다형성들간의교호작용에대한 R 2 은 0.6%, 아울러세개의경우에서 ACE6, ACE7 및 ACE8 간, ACE6, ACE7 및 ACE10 간, ACE7, ACE8 및 ACE10 간, 그리고 ACE7, ACE8 및 ACE10 간의교호작용에대한 R 2 은 1.6% 이었다. 이때교호작용들에의한 R 2 은전체 R 2 의 88% 를차지하는것으로나타났다. HDL- 콜레스테롤의경우, ACE6, ACE8 및 ACE10 의개별적인주효과에서 R 2 이 1.5% 이었고, 두개의다형성들에서 ACE6 과 ACE7, ACE8 과 ACE10 간의교호작용에대한 R 2 은 0.9% 이었으며, 또한세개의다형성들에서 ACE6, ACE7 및 ACE10 간, ACE6, ACE7 및 ACE8 간, ACE6, ACE8 및 ACE10 간의교호작용에대한 R 2 은 3.2% 이었다. 여기에서도교호작용에의한상대적인효과가전체 R 2 =5.6% 에대 Total cholesterol Triglyceride LDL-C HDL-C βˆ (SE) R 2 * βˆ (SE) R 2 βˆ (SE) R 2 βˆ (SE) R 2 ACE6 (II) 23.3 (114.8) 0.5-1.6 (11.8) 0.2 ACE7 (CG) -18.7 (19.1) 0.2 ACE8 (AG) -41.3 (151.8) 0.2 20.9 (19.1) 0.1 12.8 (18.5) 0.5 ACE10 (AG) 10.0 (16.7) 0.5 6.1 (13.5) 0.8 Sum of R 2 0.7 0.7 0.3 1.5 ACE6 (ID) ACE8 (GG) 28.0 (37.8) 0.1 ACE6 (ID) ACE10 (AG) -40.7 (160.1) 0.1 ACE6 (II) ACE7 (CG) 46.4 (38.1) 0.2-10.9 (12.1) 0.2 ACE6 (II) ACE7 (GG) 37.2 (37.8) 0.2 18.0 (12.2) 0.5 ACE6 (II) ACE10 (AG) 8.6 (19.8) 0.2 ACE7 (GG) ACE10 (AG) 243.3 (128.4) 0.5 ACE8 (AG) ACE10 (GG) 6.3 (19.1) 0.2-16.6 (19.1) 0.2 Sum of R 2 0.3 0.6 0.6 0.9 ACE6 (ID) ACE7 (CG) ACE10 (AG) 73.0 (37.8) 0.8 17.7 (17.4) 1.5 ACE6 (ID) ACE7 (GG) ACE8 (AG) 98.1 (156.3) 0.6-56.0 (46.6) 0.3 24.3 (12.4) 0.8 ACE6 (II) ACE7 (GG) ACE10 (GG) 23.7 (33.1) 0.2 ACE6 (ID) ACE8 (AG) ACE10 (AG) 99.8 (60.3) 0.9-35.7 (11.1) 0.9 ACE7 (CG) ACE8 (AG) ACE10 (AG) 93.6 (178.6) 0.3 ACE7 (GG) ACE8 (AG) ACE10 (GG) 6.6 (39.2) 0.2 Sum of R 2 0.8 0.9 1.6 3.2 Total R 2 1.8 2.2 2.5 5.6 ACE: angiotensin converting enzyme, SNP: single nucleotide polymorphism, LDL-C: low density lipoprotein-cholesterol, HDL-C: high density lipoprotein-cholesterol, βˆ: estimate of regression coefficient, SE: standard error, 6: Alu I/D, 7: G14480C, 8: A14519G, 10: A22982G. *: R2 s are percent 하여 73.2% 를점유하고있었다. 고 단일염기다형성과같이고밀도 (high density) 의유전지도 (genetic map) 에대한접근이가능해짐으로인하여, 이것들을개별적으로혹은반수체와같이몇개의집합단위로이용하여질병과유전자간의관련성 (association) 을분석하는일은복잡한질병에대한유전적영향을연구하는데있어서중요한위치를점하고있다. 18-20) 본연구에서는염색체상의아주작은범위의특정한국부에서강한연관불균형상태로존재하는단일염기다형성들의양적형질에대한상대적인기여도 (contribution) 를평가하기위해단계적회귀분석의절차를적용하였다. 특히, 양적형질로서심혈관계질환과관련있다고알려진혈중지질농도들에대하여 4개의유전소로구성된 ACE 단일염기다형성들의상대적인효과를실제로평가하였다. ACE 다형성들을분석에이용한이유는각개별다형성들이각종심혈관계질환즉, 본태성고혈압, 관상동맥질환, 허혈성심질환, 심근경색, 비후성심근병증, 급성심장사등의발생과관련있다고국내 외의연구들을통해보고되고있고집중적으로연구되고있는것들로서그임상적중요성을지니고있기때 찰
764 Korean Circulation J 2005;35:759-765 문이다. 21-30) 구체적으로기존의한국인을대상으로한심혈관계질환과 ACE 단일염기다형성들과의관련성에관한연구에서특히, 김등 21) 의연구에의하면남자의경우총콜레스테롤수치와 ACE6(Alu I/D), ACE7(G14480C), ACE10 (A22982G) 간의개별적관련성이존재하는것으로보고되었다. 또한이등 23) 의연구에서는 ACE6(Alu I/D) 과총콜레스테롤수치및허혈성심질환과의관련성이존재하는것으로보고되었으며, 박등 24) 의연구에서도허혈성심질환등과의관련성이보고되었다. 국외의경우, Ribichini 등 29) 의연구에서는 ACE6(Alu I/D) 이관동맥재협착발생의위험인자로분석되었으며 Nakai 등 30) 의연구에서는관상동맥질환발생의위험인자로보고되었다. 그러나기존의보고된결과들은개별적인다형성들각각과질병과의관련성을분석한것이며그것들의조합에의한교호작용의영향등유전자의상대적인효과에관한고려가이루어지지않은결과들이다. 즉, 하나의다형성에서동일한유전형을갖고있지만이웃하는몇개의다형성들의유전형이어떻게구성되어지는가에따라질병발생의양상은개인별로다르게나올수있다는가능성을간과한것이라고할수있다. 이러한사실은본연구의결과를통해서도확인할수있었는데, 예를들어남자의경우에서중성지방이나 LDL- 콜레스테롤에서는오히려개별적인다형성들의효과보다는교호작용에의한상대적인효과가더크게나타났다는것이다. 또한여자의경우에서도모든혈중지질농도들에서교호작용의효과가더크게존재하고있었다는점은유전자의구성에따른상대적인효과의중요성을간과할수없다는것을나타내고있는것이다. 본연구의결과를통해볼때, 혈중지질농도에서 ACE 다형성들에의해설명되는전체의합에서그조합에의한효과의비율 (proportion) 은개별다형성의효과에비해상대적으로크다는것을알수있는데, 이것은인구집단에서각개인들이특정한하나의다형성에서는동일한유전형을갖고있음에도불구하고이웃하는몇개의다형성들의유전형이어떻게구성되어지는가에따라혈중지질농도의변화에미치는영향이상대적으로다를수있으므로질병발생의양상은그에따라개인별로다르게나올수있다는점을의미하는것이다. 본연구에서적용된분석방법은새롭게개발된통계학적분석방법이아님에도불구하고다중의유전소로구성된반수체나복수의유전자들과질병간의관련성을분석하는데거의적용되지않은것이사실이다. 본연구의방법은기존의회귀분석방법의틀내에서상용화된통계분석프로그램들을이용하여손쉽게적용할수있고, 환경적인영향등에따른공변량 (covariates) 들을고려하여분석할수도있다는장점을가지고있다. 본연구에서적용한방법은각각의유전소에위치한단일염기다형성들과양적형질간의관련성을차례대로분석할수있는데, 그때마다다른유전소에존재하 는유전형의구성에따라조건부적으로각단일염기다형성의효과를평가할수있다는장점을가지고있다. 또한, 각단일염기다형성의주효과와교호작용의효과를포함하는여러가지회귀모형을설정함에의해다양한상대적인유전적효과들에대한분석을탄력적으로수행할수있다. 그런데, 특정한국부에존재하는단일염기다형성의수가과도하게많아지면그에따른각효과들을평가하기위해추정해야할회귀계수의수가또한많아지게되므로, 표본크기가충분히크지않다면분석을수행하는데어려움이발생할수있다. 따라서분석에이용할유전소의집합을구성하는단일염기다형성의수를어느정도로결정할것인가에관한문제가생길수있다. 본연구의분석방법은독립적인개인으로구성된자료에적용하는것이적절한데, 만약가족으로구성된자료 (family data) 인경우에는가족구성원들간의상관성 (correlation) 을고려하여분석할수있는방법으로의확장이필요할것으로여겨진다. 요약 배경및목적 : 염색체상에서특정한질병의발생에관여하는유전자들의국부의위치가알려질경우, 그국부에는수많은단일염기다형성이존재할수있는데, 이때어떤단일염기다형성이혹은어떤조합이질병발생에직접적인영향을주는지규명하는것은매우의미있는일이다. 또한, 질병발생과의관련성이단순히연관불균형상태에있기때문에간접적으로나타나는것인지아니면직접적으로질병을야기하는효과때문인지규명하는것역시중요한일이라고할수있다. 이를위해본연구에서는양적형질로서심혈관계질환과관련있다고알려진혈중지질농도에대한유전자들의상대적영향을평가하기위해단계적회귀분석방법을적용하여분석하였다. 방법 : 본연구에서는각단일염기다형성들의집합에서각각의유전형에대한가변수를정의한후, 그가변수들이포함된회귀모형의유의성에대한검정을통해유전자의상대적인영향을평가하기위하여단계적회귀분석방법을적용하였다. 단일염기다형성으로서는 ACE6, ACE7, ACE8, ACE10 들로이루어진집합을이용했다. 양적형질은혈중지질농도들로서총콜레스테롤, 중성지방, LDL- 콜레스테롤, HDL- 콜레스테롤의수치를이용하였고, 단일염기다형성의정보를모두알고있으며심혈관계질환을가지고있지않은남자 327(40.5%) 명, 여자 481(59.5%) 명, 총 808 명을대상으로분석하였다. 결과 : 남자의경우혈중지질농도들별로 ACE6, ACE7, ACE8, ACE10 에서주효과가각각서로다른양상으로존재하고있
Kijun Song, et al:relative Effects of SNPs to Serum Lipid Profiles 765 었고, 두개의다형성들간의교호작용과세개의다형성들간의교호작용이존재하고있었다. 중성지방과 HDL- 콜레스테롤에서는개별적인주효과에비해교호작용의효과가더크게나타났다. 여자에서도주효과와두개및세개의다형성들간의교호작용에의한효과가존재하고있었는데, 모든혈중지질농도들에서교호작용에의한상대적인효과가개별적인주효과보다더크게나타났다. 결론 : 본연구에서는손쉽게적용할수있는단계적회귀분석방법을이용하여혈중지질농도에대한단일염기다형성들의개별적인효과와그것들로구성된조합의상대적인효과를평가하였는데, 각성별에따라개별적인다형성의효과뿐만아니라두개혹은세개의다형성들간의교호작용에대한효과또한존재한다는사실을알수있었다. 중심단어 : 혈중지질농도 ; 단계적회귀분석. 본논문은보건복지부보건의료바이오기술개발사업중특정센터연구지원사업 (00-PJ3-PG6-GN01-0001) 의연구비지원을받아이루어졌음. REFERENCES 1) Thomson G, Robinson WP, Kuhner MK, et al. Genetic heterogeneity, modes of inheritance, and risk estimates for a joint study of Caucasians with insulin-dependent diabetes mellitus. Am J Hum Genet 1988;43:799-816. 2) Valdes AM, Thomson G. Detecting disease-predisposing variants: the haplotype method. Am J Hum Genet 1997;60:703-16. 3) Li H. A permutation procedure for the haplotype method for identification of disease-predisposing variants. Ann Hum Genet 2001;65:189-96. 4) Falk CT, Rubenstein P. Haplotype relative risks: an easy reliable way to construct a proper control sample for risk calculations. Ann Hum Genet 1987;51:227-33. 5) Dudbridge F, Koeleman BP, Todd JA, Clayton DG. Unbiased application of the transmission/disequilibrium test to multilocus haplotypes. Am J Hum Genet 2000;66:2009-12. 6) Clayton D. A generalization of the transmission/disequilibrium test for uncertain-haplotype transmission. Am J Hum Genet 1999;65:1170-7. 7) Mignot E, Lin L, Rogers W, et al. Complex HLADR and -DQ interactions confer risk of narcolepsy-cataplexy in three ethnic groups. Am J Hum Genet 2001;68:686-99. 8) Cucca F, Dudbridge F, Loddo M, et al. The HLADPB1: associated component of the IDDM1 and its relationship to the major loci HLA-DQB1, -DQA1, and -DRB1. Diabetes 2001;50:1200-5. 9) Cucca F, Lampis R, Congia M, et al. A correlation between the relative predisposition of MHC class II alleles to type 1 diabetes and the structure of their proteins. Hum Mol Genet 2001;10: 2025-37. 10) Cordell HJ, Clayton DG. A unified stepwise regression procedure for evaluating the relative effects of polymorphisms within a gene using case/control or family data: application to HLA in type 1 diabetes. Am J Hum Genet 2002;70:124-41. 11) Kleinbaum DG, Klein M. Logistic Regression: a self-learning text. 2nd ed. New York: Springer; 2002. 12) Hosmer DW, Lemeshow S. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons; 2000. 13) Jaccard J. Interaction Effects in Logistic Regression. Thousand Oaks, Calif.: Sage Publications; 2001. 14) Neter J, Kutener MH, Nachtsheim CJ, Wasserman W. Applied Linear Statistical Models. 4th ed. New York: McGraw-Hill; 1996. 15) Bowerman BL, O Connell RT. Linear Statistical Models: an applied approach. 2nd ed. Boston: PWS-KENT Pub. Co.; 1990. 16) Fahrmeir L, Tutz G. Multivariate Statistical Modelling Based on Generalized Linear Models. 2nd ed. New York: Springer; 2001. 17) Vittinghoff E. Regression Methods in Biostatistics: linear, logistic, survival, and repeated measures models. New York: Springer; 2005. 18) Clark AG. The role of haplotypes in candidate gene studies. Genet Epidemiol 2004;27:321-33. 19) Schaid DJ. Genetic epidemiology and haplotypes. Genet Epidemiol 2004;27:317-20. 20) Schaid DJ. Evaluating associations of haplotypes with traits. Genet Epidemiol 2004;27:348-64. 21) Kim J, Shin DJ, Bae Y, et al. Association between I/D, G14480C, A22982G polymorphisms of angiotesin I-converting enzyme gene and essential hypertension in the Korean population. Korean Circ J 2004;34:1137-47. 22) Kwon SU, Kim DK, Kim JH, et al. Association of angiotensinconverting enzyme gene polymorphism and angiotensin-converting enzyme activity in Korean patients with coronary artery disease. Korean Circ J 2000;30:1350-6. 23) Lee MM, Kim HS, Song JM, et al. Insertion/deletion polymorphism of angiotensin I-converting enzyme gene in Korean patents with ischemic heart disease. Korean Circ J 1996;26:5-13. 24) Park HY, Kwon HM, Kim HS, Song KS, Kim CH. An I/D polymorphism in angiotensin-converting enzyme gene in myocardial infarction. Korean Circ J 1996;26:465-72. 25) Lindpaintner K, Pfeffer MA, Kreutz R, et al. A prospective evaluation of an angiotensin-converting enzyme gene polymorphism and the risk of ischemic heart disease. N Engl J Med 1995;332: 706-11. 26) Winkelmann BR, Nauck M, Klein B, et al. Deletion polymorphism of the angiotensin I-converting enzyme gene is associated with increased plasma angiotensin-converting enzyme activity but not with increased risk for myocardial infarction and coronary artery disease. Ann Intern Med 1996;125:19-25. 27) Agerholm-Larsen B, Nordestgaard BG, Steffensen R, Sorensen TI, Jesen G, Tybjaerg-Hasen A. ACE gene polymorphism-ischemic heart disease and longevity in 10,150 individuals. Circulation 1997;95:2358-67. 28) Marian AJ, Yu QT, Workman R, Greve G, Roberts R. Angiotensinconverting enzyme polymorphism in hypertrophic cardiomyopathy and sudden cardiac death. Lancet 1993;342:1085-6. 29) Ribichini F, Steffenino G, Dellavalle A, et al. Plasma activity and insertion/deletion polymorphism of angiotensin I-converting enzyme: a major risk factor and a marker of risk for coronary stent restenosis. Circulation 1998;97:147-54. 30) Nakai K, Itoh C, Miura Y, et al. Deletion polymorphism of the angiotensin I-converting enzyme gene is associatied with serum ACE concentration and increased risk for CAD in the Japanese. Circulation 1994;90:2199-202.