BRIC View 2017-T09 BRIC View 동향리포트 인체메타게놈정보생산및분석기술동향 김인겸 경북대학교 E-mail: inkim@knu.ac.kr 요약문 사람의몸세포는약 10조개의세포로구성되어있다. 이에비해장내에는우리몸세포보다 10배많은약100조마리의미생물들 ( 대부분세균들 ) 이공생하고있고, 구강, 피부, 비뇨생식기, 비강, 호흡기에있는미생물을합치면 1000조마리의미생물이공생하고있다고한다. 주요인체메타게놈정보를생산하는방법으로는 microarrays, 16S rrna 유전자병렬식서열분석법, shotgun sequencing이있다. 이중최근에발달한주요차세대염기서열분석방법으로는 Pyrosequencing (GS FLX), 이온반도체서열분석법 (Ion Proton II), 합성에의한서열분석법 (Illumina MiSeq, HiSeq), 올리고핵산염연결에의한서열분석법 (SOLiD), 단일분자실시간서열분석 (Sequel System) 이있다. 인체메타게놈연구기구로는국제인체미생물무리연구협의체, 미국립보건원인체미생물분석사업, 인체장관메타유전체연구단, The Ribosomal Database Project 등이있다. 지금도새로운분석방법이연구되고있어서향후메타유전체염기서열분석기술은더욱발전할것이며, 분석단가는더욱저렴해질것이다. Key Words: 메타게놈, 장내세균무리, 16S rrna, microarray, 병렬식염기서열분석법, shotgun 염기서열분석법 목차 1. 서론 2. 인체메타게놈정보생산기술 2.1 microarrays 2.2 16S rrna 유전자병렬식서열분석법 2.3 Random Shotgun Sequencing 3. 국내외인체메타게놈분석회사 인체메타게놈정보생산및분석기술동향김인겸 Page 1 / 9
3.1 천랩 3.2 마크로젠 3.3 Second Genome Solutions 4. 인체메타게놈연구기구 4.1 International Human Microbiome Consortium 4.2 Human Microbiome Project 4.3 Metagenomics of the Human Intestinal Tract (MetaHIT) 4.4 The Ribosomal Database Project (RDP) 5. 결론 6. 참고문헌 1. 서론 사람의몸세포는약 10조개의세포로구성되어있다. 이에비해장내에는우리몸세포보다 10배많은약100조마리의미생물들 ( 대부분세균들 ) 이공생하고있다. 사람의유전자가 2만여종인데비해, 장내미생물의유전자는이보다 150배많은약 330만여종이나된다. 위장관뿐만아니라구강, 피부, 비뇨생식기, 호흡기등에도많은미생물이공생하고있다. 사람의유전자와우리몸에서공생하는모든미생물전체유전자를 인체메타게놈 이라고한다. 장내세균무리는 7개의문 (phyla) 으로분류되는데, Firmicutes가가장많고, 그다음이 Bacteroidetes이다. 약 90% 의장내세균무리는이두가지에속한다. 나머지 10% 의균들이 Proteobacteria, Fusobacteria, Verrucomicrobia, Cyanobacteria, Actinobacteria 문에속한다. 인체메타게놈정보생산및분석기술동향김인겸 Page 2 / 9
세균들은 70S 리보좀에서단백질을합성한다. 70S 리보좀은 50S 리보좀과 30S 리보좀으로나누어진다. 50S 리보좀에는 23S rrna와 5S rrna가, 30S 리보좀에는 16S rrna가있는데, 이들 rrna 유전자들은진화적으로아주잘보전되어있다. 이중 16S rrna 유전자의염기서열을분석하여미생물의계통을분류한다. 표 1. 인체메타게놈정보생산기술요약표 방법내용장점단점시료 정량적중합효소연쇄반응법 (qpcr) 16S rrna 유전자를증폭후정량 빠르고정량적임. 알려지지않은미생물은검사할수없음. 검체로부터분리한전체 변성 / 온도구배젤전기영동 (DGGE/TGGE) 16S rrna 유전자를증폭후전기영동법으로분리 빠르고반정량적임. 미생물분류불가능. 말단제한절편길이다형태 (T-RFLP) 16S rrna 유전자를증폭후제한효소로절단후전기영동법으로분리 빠르고반정량적임. 저렴함. 미생물분류불가능. 형광제자리부합법 (FISH) 형광표지된탐지자를 16S rrna 유전자와반응시킴. 반정량적임. 알려지지않은미생물은검사할수없음. 채취한시료 Sanger 서열분석법 16S rrna 유전자를클로닝후서열분석 반정량적임. 시간이많이걸리고, 비용이비싸다. 시료핵산에형광을 검체로부터분리한 microarrays 표지한후, 유리판에고정된상보적핵산과 빠르고반정량적임. 교차반응가능. 전체, 또는 반응시킴. 16S rrna 유전자병렬식서열분석법 16S rrna 유전자를증폭후대량으로병렬식서열분석 빠르고정량적임. 알려지지않은미생물도검사 시간이많이걸리고, 비용이비싸다. 가능. shotgun sequencing 메타게놈전체를대량으로병렬식서열분석 빠르고정량적임. 비용이비싸고, 생물정보학적분석작업이필요하다. 검체로부터분리한전체 인체메타게놈정보생산및분석기술동향김인겸 Page 3 / 9
2. 인체메타게놈정보생산기술 세균의유전정보를생산하는방법으로는정량적중합효소연쇄반응법 (qpcr), 변성 / 온도구배젤전기영동 (Denaturing/ temperature gradient gel electrophoresis, DGGE/TGGE), 말단제한절편길이다형태 (terminal restriction fragment length polymorphism, T-RFLP), 형광제자리부합법 (fluorescence in situ hybridization, FISH), Sanger 서열분석법, microarrays, 16S rrna 유전자병렬식염기서열분석법, shotgun sequencing이있다 [1]. 이중마지막세가지방법즉, microarrays, 16S rrna 유전자병렬식서열분석법, shotgun sequencing이인체메타게놈정보를생산하는방법이다. 2.1 microarrays 시료핵산에형광을표지한후, 유리판에고정된상보적핵산과반응시킨다. 레이저스캐너를사용하여형광을정량적으로읽는다. 검체로부터분리한전체, 또는 16S rrna 유전자를포함하는증폭된 를사용하여미생물을분류학적으로빠르게반정량할수있다. 단점은상보성이다소떨어져도위양성반응을보일수있다. 현재상업적으로구입할수있는제품으로는 human intestinal tract chip (HITChip ; Agilent Technologies Inc.), PhyloChip (Affymetrix), human gut chip (HuG Chip ) 등이있다 [3]. HuG Chip 은 66과 (family) 의세균을정량할수있다. 표 2. microarrays 를이용한인체메타게놈분석법. 방법분류수준 probes 분석프로그램 HITChip 1,140 속 (genus) 4,809 R statistical software PhyloChip / Lawrence Berkeley National Lab 1,800 종 (species) 세균 (>8000 strains) 1.2 million SecondGenome PhyloTrac 4,441 HuG Chip 66 과 (family) (2,442 specific and 1,919 explorative PhylArray software probes) Axiom Microbiome Arrays HumiChip 2.0 12,513 종 (species) 미생물 180,000 유전자 (genes)/ 2,063 유전체 (genomes) 135,555 Axiom MiDAS software 180,000 Microarray Data Manager Human Oral Microbe Identification Microarray (HOMIM) 속 (genus) 300 인체메타게놈정보생산및분석기술동향김인겸 Page 4 / 9
2.2 16S rrna 유전자병렬식서열분석법 16S rrna 유전자를증폭후대량으로병렬식으로서열을분석한다. 장점으로는미생물분류가능하고, 빠르고정량적이다. 또한알려지지않은미생물도검사가능하다. 단점은시간이많이걸리고, 비용이비싸다. 현재상업적으로구입할수있는제품으로는 Genome Sequencer FLX (Roche Diagnostics), Illumina MiSeq, Ion PGM/Proton (Thermo Fisher Scientific), SOLiD (Thermo Fisher Scientific) 등이있다. Pyrosequencing은 1회분석시 5억개의염기서열을 99% 정확도로분석한다. 이속도는 Sanger 서열분석법보다 2천배빠른속도이다. 두군을비교할때, 예를들면마른체형과비만체형의메타게놈을분석할때유용하다. 454 Sequencing에기반을둔Genome Sequencer FLX (GS FLX) System은 High-Throughput sequencing 기술중유일하게 Long Read를보유하고있으며높은정확도를지니고있다. 따라서비용절감과완성도측면에서가장뛰어난결과를낼수있는기술이다. 한편이온반도체서열분석법은 중합시발생하는수소이온을정량함으로써서열을분석한다. 일명 Ion Torrent 서열분석법, ph 매개서열분석법, silicon 서열분석법, 반도체서열분석법이라고도불린다. Pyrosequencing과이온반도체서열분석법의공통적인단점은단일염기가 6개이상반복될때오차발생이높아진다는것이다. 합성에의한서열분석법은 Illumina에서 MiniSeq과 NextSeq (75-300 bp), MiSeq (50-600 bp), HiSeq 2500 (50-500 bp), HiSeq 3/4000 (50-300 bp), HiSeq X (300 bp) 등다양한기종을개발하였다. 표 3. 차세대고속염기서열분석법. 서열분석길이방법 (bp) 동시서열분석수분석시간 1 회처리데이터 GS FLX/ Pyrosequencing Ion Proton II/ 이온반도체서열분석법 Illumina MiSeq / 합성에의한서열분석법 SOLiD/ 연결에의한서열분석법 Sequel System/ 단일분자실시간서열분석 200-400 130만 10시간 360-560Mb 100-400 6.6억 2-4시간 330Mb 50-600 1200만 27시간 440Mb-4.6Gb 50-100 5억 3-10일 25-50Gb 10,000-15,000 5만 1-4시간 500-100Mb 인체메타게놈정보생산및분석기술동향김인겸 Page 5 / 9
SOLiD (Sequencing by Oligonucleotide Ligation and Detection) 분석법은글자그대로올리고핵산염을연결시키면서서열을읽는다. 분석시간이많이걸리지만, 분석단가가저렴하다. 차세대시퀀싱기술중가장진보된 3세대기술인단일분자실시간서열분석 (single-molecular realtime sequencing) 방법은고속염기서열분석방법중에서염기절편을가장길게읽을수있다. 최근에서울대서정선교수님팀에서이방법을이용하여한국인표준유전체에대한논문을발표하였다 [2]. 2.3 Random Shotgun Sequencing 메타게놈전체를임의의조각으로자른다음, 대량으로병렬식으로염기서열을분석한다. 염기서열이밝혀진임의의조각들을짜맞춤으로써전체를재구성한다. 장점으로는미생물분류가능하고, 빠르고정량적이다. 세균무리를유전적다양성뿐만아니라기능적으로도분류할수있기때문에, 분석결과를보고건강한지병이있는지도짐작할수있다. 단점은비용이비싸고, 생물정보학적분석작업이필요하다. 따라서통상의실험실에서분석하기는쉽지않다. 미국국립보건원에서지원하는 Human Microbiome Project는이방법으로염기서열을분석했다. 3. 국내외인체메타게놈분석회사 3.1 천랩 CLcommunity TM 은천랩 (http://www.chunlab.com) 에서개발한메타게놈분석프로그램이다. 세균및곰팡이를포함하는미생물군집의특성을이해하기쉽도록연구자들이다양한그래프및그림으로시각화할수있다. CLcommunity TM 를사용하면차세대염기서열분석 (NGS) 플랫폼 (Roche 454 pyrosequencing technology or Illumina polony sequencing technology) 에의해생성된 16S rrna 유전자시퀀스또는, 곰팡이의경우 ITS (Internal transcribed space) 시퀀스를분석할수있다. 유전자증폭 (PCR) 시 universal primer를사용하여광범위한 taxonomic group들을대상으로다양한유형의 amplicon을만들수있다. NGS를이용하여이 amplicon을분석할수있다. 하나의샘플에서생성된대량의 16S rrna 유전자염기서열들은생물정보학분석파이프라인과통계학적인분석을거쳐서, raw sequence data 와함께확장자 clc인 (*.clc) 천랩고유의파일안에저장된다. 사용자는 CLcommunity TM 프로그램을사용하여여러개의 clc (*.clc) 파일을열어다른군집들과비교하거나다양한통계분석을수행할수있다. 기존에보유하고있는 NGS 데이터를 clc (*.clc) 파일로전환하여 CLcommunity TM 프로그램으로분석할수도있다. CLgenomics 은미생물유전체를쉽게분석할수있도록천랩에서개발한응용프로그램이다. 유전자와유전체들의특성을쉽게파악할수있다. 생물정보학에대한전문지식이없는연구자들도사용할수있다. 인체메타게놈정보생산및분석기술동향김인겸 Page 6 / 9
3.2 마크로젠 마크로젠 (http://www.macrogen.co.kr) 은 454 Sequencing에기반을둔 Genome Sequencer FLX 시스템으로 16S rrna 유전자를분석한후, Global alignment, Taxonomic assignment 표준분석을서비스한다. 메타유전체간의비교분석서비스도가능하다. Shotgun sequence을하면 de novo assembly, Blastx 표준분석이가능하며, 유전자예측, OTU counting, 후보유전자의기능예측, 대사경로설정, 두가지이상샘플에대한통계적분석도가능하다. 3.3 Second Genome Solutions Second Genome Solutions (http://www.secondgenome.com) 은인체메타게놈정보생산기술전문서비스회사이다. 즉, microarrays, 16S rrna 유전자병렬식서열분석법, shotgun sequencing을모두서비스한다. 이외에도메타전사체 (Metatranscriptome) 프로파일링서비스도제공한다. microarrays는 Lawrence Berkeley National Lab에서개발한 PhyloChip 을기술이전하여서비스한다. 16S rrna 유전자병렬식서열분석법은 Illumina MiSeq 서열분석법을서비스하고있다. shotgun sequencing 후에는 Taxonomic Annotation (Greengenes database), Functional Annotation, Pathway Annotation (MetaCyc) 를서비스한다. 4. 인체메타게놈연구기구 4.1 International Human Microbiome Consortium International Human Microbiome Consortium( 국제인체미생물무리연구협의체 ) 은 2008년 10월 Heidelberg 국제회의에서공식적으로발기되었다. 인체미생물무리를연구하는대규모사업단이나연구비를지원하는연구재단을협의체회원으로두고있다. 한국연구재단과한국생명공학연구원, 미국국립보건원, 유럽위원회, 캐나다보건연구소, 일본문부과학성등세계유수의연구지원기관과연구소가정식회원이다. 주요연구프로그램으로는프랑스가주축이된 MetaGenoPolis (2012-2019), International Human Microbiome Standards (2011-2015), 서울대학교고광표교수가연구책임자인 Korean Microbiome Diversity Using Korean Twin Cohort Project (2010-2015), 미국국립보건원에서지원하는 Human Microbiome Project (2008-2013), 호주정부에서지원하는 The Australian Jumpstart Human Microbiome Project (2009- ), 캐나다정부가지원하는 Canadian Human Microbiome Initiative (2009- ), 유럽위원회에서지원하는 MetaHIT (Metagenomics of the Human Intestinal Tract, 2008-2011) 등이있다. 제7회 IHMC 국제회의가 2018년아일랜드 Cork 대학주관으로개최될예정이다. 인체메타게놈정보생산및분석기술동향김인겸 Page 7 / 9
4.2 Human Microbiome Project Human Microbiome Project (HMP; 인체미생물분석사업 ) 는건강또는질환과관련된미생물을동정하고특성을연구하기위해, 미국국립보건원 5개년기획사업으로 2008년시작했다. 이사업은신체의주요부위즉, 구강, 피부, 질, 장관, 비강 / 폐등다섯곳에서식하는약 3천여종의세균유전체염기서열을분석할계획이다. 또한세균의 16S rrna 서열도 PCR 증폭후정밀분석하기로했다. 242명의건강한미국인이이사업에참여하여, 남자는각각 15 샘플, 여자는각각 18샘플을채취했다. 약 5천샘플의시료를분석하여인체에는약만종이상의미생물이서식하는것을밝혔다. 전체예산 1억 15백만달러를투입하였으나, 아직까지질환과관련된미생물을동정하고특성을밝히려는처음의목표에는도달하지못했다. 주요임상적결과로는임신을하면질내미생물의다양성은줄어들고, 불명열이있는어린이는비강에바이러스가증가한다것정도이다. 4.3 Metagenomics of the Human Intestinal Tract (MetaHIT) Metagenomics of the Human Intestinal Tract (MetaHIT; 인체장관메타유전체연구단 ) 는프랑스연구자들이주축이되고덴마크, 독일, 스페인, 이탈리아, 네덜란드, 영국, 중국연구자들이참여했다. 2008년 1월부터 4년반동안 2천만유로이상을투입하여 124명의대변샘플에서 540Gb의유전정보를얻었다. 주요연구결과로는 292명의덴마크인을대상으로한비만연구에서미생물이비만발생에도영향을미친다는것을밝혔다. 장내미생물유전자량에따라장상피세포를 3종류로분류했다. 장내미생물유전자가적은사람들은 Bacteroides, Rumnicoccus gnavus가많은제1형장상피세포를가지고있으며, 염증성장질환, 제2형당뇨병, 허혈성심장질환이잘생긴다. 반면, 장내미생물유전자가많은사람들은 Faecalibacterium prausnitzii, Roseburia inulinivorans가많은제3형장상피세포를가지고있고염증이적다. 4.4 The Ribosomal Database Project (RDP) 1980년대후반에일리노이대학교의 Carl R. Woese 박사와 Gary J. Olsen박사는세균 16S rrna가세균마다잘보전되어있어서세균분류에사용할수있다고제안했다. 1989년미국국립과학재단으로부터연구비를지원받아세균 16S rrna 서열정보를데이터베이스로구축하고, 1992년 1월 5일자로 RDP (http://rdp.cme.msu.edu) 1.0판을공시했다. 471개의세균 16S rrna 서열과 165개의곰팡이 28S rrna 서열을포함하고있다. 2013년 7월 18일자로 RDP 11.1판이공시된후, 3년후인 2016년 9월 30일자로 RDP 11.5판이공시되었다. 여기에는 3,356,809개의세균 16S rrna 서열과 125,525개의곰팡이 28S rrna 서열을포함하고있다. 인체메타게놈정보생산및분석기술동향김인겸 Page 8 / 9
5. 결론 최근연구에의하면사람의장내세균무리는체지방, 당뇨, 고지혈증, 성장, 면역조절, 감염병예방등에결정적영향을미칠뿐만아니라, 신생아기에어떤인체공생세균들이형성되는지에따라아이의성격과지능발달에도커다란영향을미친다는사실이속속규명되고있다. 이러한이유때문에최근학계에서는인체세균무리를사람과공생관계에있는미생물로보는시각에서벗어나, 인체세균무리를장기의하나로인식하기시작하면서 잊힌장기 (forgotten organ)" 라고부르기도한다. 인체세균무리와질병과의상관관계규명을위해서메타유전체염기서열분석은필수적이다. 향후메타유전체염기서열분석기술은더욱발전할것이며, 분석단가는더욱저렴해질것이다. 6. 참고문헌 [1] Fraher MH, O'Toole PW, Quigley EM. Techniques used to characterize the gut microbiota: a guide for the clinician. Nat Rev Gastroenterol Hepatol. 2012 Mar 27;9(6):312-22. [2] Seo JS, Rhie A, Kim J, Lee S, Sohn MH, Kim CU, Hastie A, Cao H, Yun JY, Kim J, Kuk J, Park GH, Kim J, Ryu H, Kim J, Roh M, Baek J, Hunkapiller MW, Korlach J, Shin JY, Kim C. De novo assembly and phasing of a Korean human genome. Nature. 2016 Oct 13;538(7624):243-247. [3] Tottey W, Denonfoux J, Jaziri F, Parisot N, Missaoui M, Hill D, Borrel G, Peyretaillade E, Alric M, Harris HM, Jeffery IB, Claesson MJ, O'Toole PW, Peyret P, Brugère JF. The human gut chip "HuGChip", an explorative phylogenetic microarray for determining gut microbiome diversity at family level. PLoS One. 2013;8(5):e62544. The views and opinions expressed by its writers do not necessarily reflect those of the Biological Research Information Center. 김인겸 (2017). 인체메타게놈정보생산및분석기술동향. BRIC View 2017-T09 Available from http://www.ibric.org/myboard/read.php?board=report&id=2706 (Mar 30, 2017) Email: member@ibric.org 본콘텐츠는의후원으로작성되었습니다. 인체메타게놈정보생산및분석기술동향김인겸 Page 9 / 9