Comparative analysis of gut bacterial communities between healthy people and IBD patients 공 현 승 연세대학교 생명시스템대학 시스템생물학과 * Introduction Introduce to IBD 인간의 장 내부에는 다양하고 복잡한 종류의 미생물 군 집이 있다. 이들 미생물들은 인간과 서로 상호작용을 하 고 있고, 대장 내용물 1g당 10 11 개 이상으로 사람 세포의 10배 이상으로 추정되고 있다. 이러한 미생물 군집(Community)은 일반적으로는 인간 에게 큰 해가 되지 않고 영양소와 대사산물들을 공급할 뿐만 아니라, 면역계의 균형을 유지시키는데 도움을 주지 만, 부정적인 역할을 초래하는 경우도 있다. 그 중 최근 식습관이 서구화 되며 젊은 층에서부터 나 타나는 염증성장질환(Inflammatory bowel disease, IBD) 이 대두되고 있다. 아직 염증성 장질환의 발병 원인은 명 확하게 밝혀지지 않았지만, 스트레스나 서구식 식습관이 발병에 기여한다고 생각되고 있다. 염증성장질환은 궤양성 대장염, 크론병, 베제트병 등 여 러 가지 타입이 있으나, 대부분의 환자들이 크론병 (Crohn's disease)이나 궤양성 대장염(Ulcerative colitis) 에 속할 정도로 이 두 질병의 비율이 높다. 그림 1. IBD와 유전자와의 관계 염증성장질환(IBD)은 유전적 요인과 환경적 요인이 복 그림 2. 크론병의 Montreal classification 합적으로 영향을 미치는 것으로 알려져 있다. 유전적 요 인으로는 (그림1)에 속하는 여러 유전자들이 관여하는 것 으로 알려져 있고, 환경적 요인으로는 장내미생물군집이 나 섭취한 음식 등이 관련이 있을 것이라 생각된다. 어떠 한 원인에서든지 일단 환경적 요인에 의해 면역체계반응 이 유발되고, 한번 시작 된 면역체계반응은 멈추지 않아 크론병을 진행시키게 된다. 또한, 직 간접적인 원인에 의 해 장의 내벽이 손상된다면 이는 크론병을 시작하게 하 거나 가속화시키는 원인으로 작용 할 수 있다. 크론병(Crohn's disease, CD)은 발병하는 부위와 구조적 변이에 따라 Montreal classification으로 구분된다. (그림 2) Montreal L-category는 발병하는 부위에 따른 분류방 법으로 L1~L4까지 있고, Montreal B-category는 협착이 나 천공과 같은 병리학적 특징에 따라 B1~B3 + B3p로 나뉜다. 크론병에 대해 분류할 때는 L2B2와 같은 방식으 로 L type과 B type을 명시하여 구분한다. 반면에, 궤양
성대장염(Ulcerative colitis)은 대장 쪽에서만 발생한다는 특징이 있기 때문에 montreal classification과 같은 분류 는 하지 않는다. Sequencing Taxonomic assignment & Diversity indices Trimming 이후에는 Taxonomic assignment를 거친다. Taxonomic assignment에서는 richness와 evenness, coverage와 rarefaction curve를 계산하게 된다. 각각의 의미는 다음과 같다: - Richness : 종의 풍부도를 의미한다. 한 미생물 community에서의 종의 숫자이다. 1) ACE 2) Chao 그림 3. 454 pyrosequencing 이 실험에서는 장내 미생물 군집의 분석방법으로써 크 론병환자, 궤양성대장염환자, 정상인의 각각의 샘플에서 16S rrna 유전자를 PCR한 후, NGS(Next generation sequencing)인 454 pyrosequencing을 이용하였다. pyrosequencing의 과정은 (그림3)과 같다. DNA 중합이 일어날 때, 염기가 하나 추가될 때 마다 피로인산 (Pyrophosphate)이 방출되는 것을 이용한다. 피로인산은 황산 아데니릴 전이효소(Sulfate adenylyltransferase, ATP sulfurylase)에 의해 ATP를 생성하고 분해된다. 생 성된 ATP는 루시퍼라아제(Luciferase)에 의해 빛 에너지 로 전환되는데, 어떤 염기를 투입했을 때 빛이 발생하는 가를 측정하여 주형 DNA(Template DNA)의 서열을 결 정할 수 있다. 만약 동일한 염기가 연속되어 나타날 경우 에는 더 많은 ATP가 발생하므로 더 강한 빛이 발생된다. 따라서 빛의 강도를 측정하여 비교하는 것으로 염기의 중복을 알 수 있다. 하지만, 동일한 염기가 여러 번 중복 해서 나타나는 경우에는 횟수를 제대로 인지하지 못하는 Homo-polymer error가 생길 수 있다. - Evenness : 종의 풍부도가 환경과 일치하는 정도를 의미한다. 수학적으로, 여러 타입의 계산법들이 있다. 1) Jackknife 2) Shannon 3) Simpson - Coverage C = 1-frac{n_1}{N} Coverage는 실제 환경을 얼마나 잘 대변하고 있냐에 대 한 지표이다. Trimming Sequencing data는 그 자체로 바로 분석에 이용 할 수 없고 Trimming이라는 편집과정을 거쳐야 한다. Trimming 과정에서는 quality가 낮은 data와 쓸모없는 sequence를 제거하는 과정이다. 불명확한 서열(N)과, 바 코드서열 등이 이에 속한다. - Rarefaction curve Rarefaction curve는 1부터 N까지 random sampling을 반복적으로 해서 나오는 average species count를 그린 것이다.
Taxonomy analysis 그 후 sequences를 이용하여 실제 미생물 군집 조성을 domain에서 genus까지 분석한다. 16S rrna sequences database를 Bayesian method를 이용하여 높은 신뢰도로 match 되는 domain에서부터 genus까지를 구해 community를 분석한다. * Methods & materials Data 정상인과 IBD환자의 회장 말단 조직의 16s rrna 454 pysosequencing data를 이용한다. Trimming 그러므로, Taxonomic assignmen는 mothur를 이용하여 손쉽게 구할 수 있다. Diversity indices 또한 mothur를 통해 구할 수 있다. 입력하는 command는 다음과 같다: 1: unique.seqs(fasta=fastaname) 2: dist.seqs(fasta=fastafile, output=square) 3: cluster(phylip=distfile) 4: rarefaction.single(list=listfile) -> rarafaction curve 5: summary.single(list=listfile) -> Diversity indices 6: summary.single(list=sabundfile, calc=coverage) -> coverage Taxonomy analysis 16S rrna sequence information을 이용하여 community 분포를 조사하는 것은 RDP classifier 2.9를 이용한다. RDP classifier는 Bayesian method로 불리는 통계학적 분석방법을 사용하여 높은 신뢰도로 domain에 서부터 genus level까지 community를 분석 할 수 있다. 그림 6. RDP classifier 그림 5. CLC Genomics Workbench Trimming 프로그램으로는 CLC Genomics Workbench 5.3을 이용한다. CLC Genomics Workbench은 sequencing된 data를 불러와 contamination된 sequence 나 poor quality parts of reads를 제거하는 역할을 한 다. CLC Genomics Workbench같은 경우에는 몇 가지의 option을 선택 할 수 있는데 default setting으로 진행하 였다.(Quality trimming, ambiguity trimming) 하지만 RDP classifier로 분석한 샘플이 많아질수록, 수 작업으로 원하는 정보만 select하고 sorting하고 데이터를 통합적으로 분석하는데 시간이 너무 많이 소요될 수 있 다. Yonseisort_s Taxonomic assignment & Diversity indices Taxonomic assignment와 Diversity indices 과정에서는 mothur라는 프로그램을 사용한다. mothur는 2009년 the university of Michigan에서 만들어진 microbial ecology community의 분석에 필요한 기능을 담고 있는 오픈소스 프로그램이다. mothur는 16S rrna gene을 분석하기 위 한 대부분의 기능들을 포함하고 있다. 그림 7. Yonseisort_s
Yonseisort_s는 RDP classifier의 결과물(output)로 나온 데이터를 손쉽게 select하고 sorting하여 통합적으로 분석 하는데 도움을 주는 프로그램이다. 데이터를 원하는 level(domain to genus)로 자동으로 정리해줄 뿐 아니라 커뮤니티에서의 각각의 균의 비율 까지 한 번에 계산할 수 있다. 그 후 자료들을 엑셀 함수와 그래프를 이용하여 데이터 를 정리하고, 분석한다. 그림 8. Excel * Results and Discussion Data 정상인과, 크론병환자, 궤양성대장염 환자의 숫자, 남녀비율, 평균나이를 조사하였다. 추가로, 크론병환자는 크론병이 active한 상태인지, inactive한 상태인지 비율을 계산했다.. Rarefaction curves 엑셀을 사용하여 30개의 샘플의 rarefaction curves를 구했다. 종의 풍부도를 계산하기 위해 3%(0.03) rarefaction curves를 이용하였다.
Coverage Richness/Evenness
Taxonomic comparison at the Phylum level Phylum level에서 taxonomic comparison을 수행 한 결과, IBD환자의 경우 community에서 Fusobacteria의 비율이 높게 나타남을 확인 할 수 있었다. 또한, CD환자의 경우 Proteobacteria의 비율이 정상인보다 높게 나타났다. Comparison Gammaproteobacteria and Fusobacteria between active CD and inactive CD 크론병 환자 중에서도 active한 환자와 inactive한 환자에게서도 미생물 군집이 크게 차이 났는데, active한 크론병 환 자에게서는 Fusobacteria가 크게 증가하는 경향이 유의적인 수준으로 나타났다.
크론병 Active환자와, 크론병 inactive 환자, 궤양성대장염환자, 정상인의 Fusobacteria의 비율은 뚜렷하게 active CD 에서 높은 비율로 나타났다. 이는 크론병과 Fusobacteria와 상관관계에 있음을 암시하고 있다. 또한, 최근 IBD 환자에게서 양성종양 및 악성종양의 발병률이 높아지고 있다는 연구결과가 있다. 또한, 염증반응은 암의 발생 및 여러 단계에서 결정적인 역할을 한다. 3) 라는 연구결과와, 장내 염증반응이 진행됨에 따라 Fusobacteria 의 비율이 증가하는 것으로 보았을 때, 장내 미생물 군집에서 Fusobacteria의 비율이 증가함에 따라 염증반응이 심화되 고 이러한 염증반응이 암을 일으키는데 기여한다고 조심스럽게 추측해볼 수 있다. Active와 inactive 크론병에서 Fusobacteria 와 Gammaproteobactetria 의 비율은 서로 반비례함을 확인 할 수 있었는 데, 이는 Fusobacteria 의 비율이 증가함에 따라, 상대적으로 Gammaproteobactetria 의 비율이 감소한 것으로 추측된 다. * Reference 1) 김정목, 장내미생물무리의 조성과 대사가 건강과 질병에 미치는 영향 2) Prof Daniel C Baumgart MD a, Prof William J Sandborn MD b, Crohn's disease, The Lancet http://image.thelancet.com/journals/lancet/article/piis0140-6736(12)60026-9/fulltext 3) Sergei I. Grivennikov,1 Florian R. Greten,2 and Michael Karin1, Immunity, Inflammation, and Cancer, Cell http://www.ncbi.nlm.nih.gov/pmc/articles/pmc2866629/ 4) 신의섭 유창식 김찬욱 박진석 정광용 윤상남 임석병 송준선 김진천, 염증성 장질환에 동반된 악성종양, J Korean Soc Coloproctol. http://synapse.koreamed.org/synapse/data/pdfdata/0009jksc/jksc-25-150.pdf 5) http://www.mothur.org/ : mothur 프로그램 전반에 대한 설명 및 richness/evenness에 대한 수식 참조 6) https://rdp.cme.msu.edu : RDP classifier에 대한 설명 참조 7) http://www.genomenewsnetwork.org/resources/whats_a_genome/chp2_1.shtml