406 PUBLIC HEALTH WEEKLY REPORT, KCDC 후성유전체변이분석방법의최근동향 Current trends in a method of epigenetic variation analysis 질병관리본부국립보건연구원유전체센터바이오과학정보과반효정 Ⅰ. 들어가는말 후성유전체 (Epigenome) 정보는세포분열동안에다음세대에전달되지만 DNA서열에의존하진않는다. 전체게놈레벨에서후성유전체정보를체계적으로생산하기는어려웠으나, 최근측정기술이발달함에따라다양한현상을이해하려는노력이늘어나고있다. 특히인간의질병에서후성유전체정보의역할에대한관심이증가되고있다. 후성유전체정보에는 DNA메틸화 (DNA methylation), 히스톤변형 (Histone modification), 비암호화 RNA(Noncoding RNA) 를포함하는여러가지형태안에서전달된다 (Figure 1). 이들요소들은염기서열변화없이세포가분열되는동안유전자의발현양상이다음세대에게그대로전달되지만나이나외부환경변화의노출정도에따라변한다고알려져있다 [1-2]. 후성유전체연구에서 가장많이보고된것은 DNA 메틸화이며최근 Nature, Science 등의대표적인논문에서폐암, 대장암, 전립선암등후성유전체변형에대한연구들이잇달아발표되고있다 [3,4]. 메틸화에의한암억제유전자의전사 (Transcription) 가정지되는현상은유전자를불활성화시키는후성유전학의기전가운데매우중요한것으로유전자프로모터 (Promoter) 의 CpG 섬 (CpG island) 에서메틸화됨으로인해세포성장을조절하는유전자들의발현이저해되는현상이나타나게된다. 이러한연구들은임상적으로도중요한영향을미치고있으며예로 DNA 메틸화억제물질인 5-aza-CR(5-azacytidine) 등과히스톤아세틸화의저해제인 SAHA(Suberoylanilide hydroxamic acid) 등이암치료제로활용되기시작했다. 몇몇암과의연관정도는나타나지만다른일반적인복합질환에서는전달메커니즘이불분명할뿐아니라그얽혀있는복잡한연결 Figure 2. Epigenetic modifications [1] Chromosomes are composed of chromatin, consisting of DNA wrapped around eight histone protein units. Each DNA-bound histone is a nucleosome. Histone tails protruding from histone proteins are decorated with modifications, including phosphorylation (Ph), methylation (Me) and acetylation (Ac).
주간건강과질병 PUBLIC HEALTH WEEKLY REPORT, KCDC 407 고리들을풀기가매우어렵다. 복합질병의유전적원인을찾아내기위해많은연구자들이건강검진및코호트설문자료의인구집단기반접근 (Population-based approach) 자료를통해통계적가치를가진질병연관서열변이를찾아내고있다. 이들은대부분서열유전성을기반으로디자인된연구로써후성유전의정보나환경적인요인들을고려하지않고분석을진행하였다. 본글에서는질병연관성분석에있어서유전체연구내에후성유전정보통합분석의중요성과분석디자인을기술하려한다. 좀더효과적으로 Cases 와 Control 의차이해석이가능하다. 그러나이와같은형태의디자인의경우질병연관성유전적차이인지후성유전체변이인지결정하기가어렵다. 두번째로부모로부터자식에게전달되는형질을이용하여분석하는가족기반연구를디자인할수있다. 가족연구의경우통계적으로유의한결과는유전적인연관 (Linkage) 과연계 (Association) 두가지의미를가지고있어높은검정력을가진다. 가족연구는모계유전자, 자녀유전자들의각인 (Imprinting) 효과를분리하여분석이가능하며환경적인노출차이에따라 형질의변화를관찰할수있다. 세번째로유전형은같으나후성유전정보가다른일란성 Ⅱ. 몸말 후성유전체질병연관성분석방법 (EWAS analysis) 후성유전체정보를이용한질병연관성분석방법역시 GWAS(Genome-wide association study) 와유사한방법을적용할수있다. 첫번째로대부분 GWAS 디자인에서사용하는독립적인샘플을이용하여형질간의관계를분석하는방법이있다 ( 예, Cases and Controls). Cases-Controls 분석의경우기존유전형 (Genotype) 이나발현 (Expression) 데이터를가지는데이터와후성유전체데이터를통합하여분석을하게되면 쌍둥이 (Monozygotic twins) 를대상으로한연구가있다. 일란성쌍둥이의경우는생식세포유전적변이 (Germline genetic variation) 의영향을배제하고후성유전체변이정도에차이를이용하여유의한질병연관성을찾아낼수있는효과적인방법이다. 그러나아주드물게쌍둥이임에도불구하고나이가변함에따라체세포변이 (Somatic mutation) 가생기거나환경적인다른요인으로인해생체내후성유전체정보의효과를측정이어려울때가있다. 또한통계적검정력을키우기위해서는큰규모의일란성쌍둥이연구가필요하지만쉽게디자인해서실행하기어렵다는단점이있다. Figure 2. The different types of sample cohorts which could be used in an EWAS [5]
408 PUBLIC HEALTH WEEKLY REPORT, KCDC 네번째로는종단적코호트 (Longitudinal cohort) 연구를 통해하나의샘플을오랜기간추적연구하는방법이있다. 후성유전적변이로인한질병발생가능성은태어나면서부터나이가들어감에따라노출되는여러가지환경요인을조사함으로서확실한근거를마련할수가있다. EPG = Gepg + EPGpar + Epar +age + e + e*age Figure 4. Analysis model 이와같이질병연관성후성유전체변이를찾기위한여러 접근방법들이존재하며최근연구에서는한가지디자인뿐아니라두, 세가지디자인을혼합한단계적분석을통하여여러연구들의장점을이용한심층적분석방법을이용하고있다 (Figure 2). 위의분석모델 (Figure 4) 처럼유전적변이정보와환경적변이정보를모두모델에적용하여선형관계를가지는지계산하게된다. 전체 EPG(Epigenotype, 후성유전자형 ) 는 Gepg(Genotype, 유전형 ), EPGpar(Parental epigenotype, 부모후성유전자형 ), Epar(Parental environment, 부모환경 ), 유전체및후성유전체통합정보를이용한분석방법복합질환은생체내다양한요소의상호작용에의해서발병된다고보고되고있다. 많은연구자들은복합질환의주요유전적요인들을찾아내기위해유전자상호작용이나대사경로분석을통해분석해왔으며최근후성유전적정보생산이용이해지면서유전체및후성유전체통합정보를이용하여분석하는방법들이시도되고있다. 통합분석을위해서가장많이사용하고있는보편적분석방법으로는유전자및환경인자들의상호작용정보를분석모델에적용하는방식이있다. age, e(error) 의각각에변수의복합적인작용으로발생하게된다. 이는기존유전형정보만을넣어서질병에대한관계를심플하게모델을적용하였으나그럴경우혼란변수고려없이계산되어설명력이떨어질수있다. 외부요인들의상호작용을고려하여모델에적용하였을때는질병 -유전자관계성을찾을시후성유전정보를고려한가정을할수있게된다. 질병연관연구안에서유전체및후성유전체의데이터통합분석예로 Figure 3에서모식도를보여주고있다. 이는실험방법의고급화로대규모실험을통해얻어진가족이나개인의후성유전체 Figure 3. Practical epigenotyping. The relationship between epigenetic and genetic variation must be examined through epigenotype-haplotype association in cis and through genome scan, treating epigenotype as an endophenotype for trans-interactions and their potential age-dependence [6]
주간건강과질병 PUBLIC HEALTH WEEKLY REPORT, KCDC 409 Table 1. Autoimmune diesase, showing female; male ratios of patients and concordance rates in monozygotic twins [7]. Disease Target Female:male ratio Concordance in Monozygotic twin Multiple sclerosis Central nervous system myelin 1.9-4,3 14%-33% Type 1 diabetes mellitus Beta-islet cells of the pancreas 0.5-0.8 13%-60% Systemic lupus erythematosus Cell nucleus 8.7-13.1 11%-33% Rheumatoid arthritis Joints 2.7 12%-15% Graves' disease Thyroid 3.5 17%-35% Primary biliary cirrhosis Liver 9 63% Psorisis Skin 0.8-1.1 35%-70% Myasthenia gravis Acetylcholine receptors 2 35% Ankylosing spondylitis Joints 1 40%-80% 데이터를이용해정상인의후성유전형을밝혀내고이를이용하여인간전역에걸쳐질병이나외부로들어나는형질에영향을줄수있는정도를분석한다는커다란모식도이다 [6]. 기존의 eqtl(expression Quantitative Trait Loci), cqtl(clinical Quantitativ Trait Loci) 방식과비슷하게생산된유전형데이터, 메틸화데이터나히스톤변형데이터들의 최근일란성연구에서 Table 1과같이 20%-30% 정도만이동일함을보인다. 이는유전성이동일한쌍둥이임에도불구하고후성적영향에의해면역관련질환의발전으로여길수있다. 그메커니즘은 methylation 패턴변화및히스톤변형으로인한유전자조절에문제가생김에따라질병으로이행될것으로예측하고있다. 측정된연속적인값들을이용하여 QTL(Quantitative trait loci) 분석방식과유사하게유전체및후성유전체를통합하여 분석에적용할수있다. 이처럼후성유전체를이용한질병 연관성분석의다양한접근방식으로인간유전체전체에대한 분석을빠르고효과적으로할수있게되었다. Ⅲ. 맺는말 최근국제인간후성유전체컨소시엄 (International human epigenome consortium, IHEC) 을통해전세계적으로인간후성 면역질환의후성유전학연관성분석면역질환의경우유전적요인과환경적영향이동시요인으로작용하는복합질환으로역학이나병리학적변화가매우다양하게보고되고있다. 비록면역학적기전이비슷하더라도면역질환이다양한유전자변이와연관되어있어서이연구는매우어렵다. 최근류마티스및알러지관련후성유전체영향성에대한연구결과가나오고있지만데이터양이나분석의이해에한계가있다. 보고에따르면류마티스의경우질병세포에서특이적인히스톤변형및 DNA 메틸화양상의특징이있다. 예를들면타입 1 T세포가분화할때인터페론 -감마프로모터에히스톤아세틸화가일어나고이러한변화는히스톤과 DNA 간의친화성을감소시켜전사인자의결합을증가시킨다고알려져있다. 레퍼런스지놈을만들려는노력을하고있다. 세계적으로다양한후성유전체정보들이생산되고데이터베이스화된다면엄청난규모의데이터를이용하여질병의연관성분석이이루어질것이다. 최근 NGS 데이터를이용한기술이발전하면서 Methylation 패턴분석이나히스톤변형정보 (Histone modification) 및오픈크로마틴 (Open chromatin) 부위측정에대한분석이빠르게진행되고있으며분석툴 (Tool) 및분석방법들이활발히개발되고있다. 하지만후성유전체데이터의경우개인별, 조직종류별, 환경에따른영향을많이받기때문에대부분독립적이고개별적인샘플에대한분석이이루어지는실정이며질병연관성분석에대한예는암관련후성유전체변이를찾아내는정도에그치고있다. 복합질환과같은연구를위해샘플수의증가및인간유전체정보들의
410 PUBLIC HEALTH WEEKLY REPORT, KCDC 활용으로통계적가치가증가할시점에이르렀으며, 앞서 GWAS 연구에서얻어낸것과같이후성유전체내에서의분석을통해 질병연관마커를찾아내야할것이다. Ⅳ. 참고문헌 1. Feinberg, A.P. and Tycko, B. 2004. The history of cancer epigenetics. Nat. Rev. Cancer 4, 143 153. 2. Jenuwein, T. and Allis, C.D. 2001. Translating the histone code. Science 293, 1074 1080. 3. Herman, J.G. and Baylin, S.B. 2003. Gene silencing in cancer in association with promoter hypermethylation. New Engl. J. Med. 349, 2042-2054. 4. Feinberg, A.P. et al. 2002. Epigenetic mechanisms in human disease. Cancer Res. 62, 6784 6787. 5. Vardhman K. Rakyan, Thomas A. Down, David J. Balding, and Stephan Beck. 2011. Epigenome-Wide Association Studies for common human disease. Nat Rev Genet. 12(8): 529-541.