Molecular Systematics
생물계통연구에있어서 DNA 분석의의미 생물의형태를나타내는궁극적인유전물질로서의 DNA 를분석하는것임. - 분자데이타는많은경우형태적으로지지되어온분류 군들이단계통군임을지지해주고있다 ex) 벼과 (Poaceae), 콩과 (Fabaceae), 장미과 (Rosaceae) - 논란이되어온유연관계를명확히함.
분자계통학을통해새롭게밝혀진피자식물들의계통관계에대한대표적예 1) 쌍자엽식물은 paraphyletic group 2) 수련 (water lily; Nymphaea) 은더이상연꽃 (Nellumbo) 과같은그룹이아님. 3) 단자엽식물로알려져있던 Hydatellaceae 는 basal angiosperm 이었음.
Asterales Dipsacales Apiales Aquifoliales Garryales Gentianales Laminales Solanales Ericales Cornales 국화, 초롱꽃인동, 산토끼꽃당귀, 인삼감탕나무 두충용담, 꼭두서니꿀풀, 금어초토마토, 메꽃진달래, 앵초층층나무, 수국 Campanulids (Euasterids II) Lamiids (Euasterids I) Asterids Sapindales Malvales Brassicales Fagales Cucurbitales Rosales Fabales Zygophyllales Celestrales Oxalidales Malpighiales Geraniales Myrtales 귤, 단풍나무무궁화애기장대, 무우자작나무, 상수리박, 베고니아장미, 느릅나무 콩, 자귀나무남가새 노박덩굴굉이밥버드나무, 제비꽃쥐손이풀바늘꽃 Saxifragales 범의귀, 돌나물 Caryphyllales 카네이션, 선인장 Santalales 단향, 겨우살이 Beberidopsidales Gunnerales Buxaceae 회양목 Trochodendraceae Proteales 연꽃, 버즘나무 Sabiaceae 나도밤나무 미나리아재비 Euptelea 양귀비 Ceratophyllales 붕어마름 Malvids (Eurosids II) Fabids (Eurosid I) Ranunculales Rosids Coreeudicots Basal eudicots EUDICOTS 벼, 백합옥수수 MONOCOTS Acorus Canellales Piperales Magnoliales Laurales Chloranthus Austrobailales Nymphaeaceae Hydatellaceae Amborella 창포 후추, 족도리풀목련, 튜립나무녹나무, 아보카도홀아비꽃대 붓순나무, 오미자수련 Magnoliids Basal Angiosperms EXTENT GYMNOSPERMS
수련 (Nymphaea) 연꽃 (Nelumbo)
Hyadtellaceae: Cronquist system 등모든 classic 한분류체계에있어서단자엽식물로분류되었던이식물은분자계통학연구에의해 Nymphaeaceae 의 sister group 임이밝혀짐.
계통학에서사용되는분자적방법 1) DNA-DNA hybridization - 생물간의전체유전체의비교. - DNA 분석초기동물군에서활발히연구 ex) 독수리, 콘돌, 황새간의유연관계연구 - 현재는재현성이부족하여거의사용되고있지않음
참조 : DNA 연구를위한기본적인기술 A) 제한효소 (restriction enzyme) 반응 - 제한효소란특정염기서열을인식하여인식한부위를자르는효소를말함. - 80년대말 ~90년대초반제한효소를이용한 RFLP(restiction fragment length polymorphism; 제한효소조각길이다형성 ) 기술을이용하여 cpdna analysis에의한식물계통연구활발
참조 : DNA 연구를위한기본적인기술 http://www.youtube.com/watch?v=uyaghri30om&feature=related B) Gel electrophoresis agarose 또는 acrylamide 등으로만든 gel에 DNA를통과시키면 + 극으로이동하는데, 이때분자량과전하에따라차별적으로이동하여같은크기의분자들이 band를형성함.
PCR 반응물을전기영동한것
2) RFLP (restriction fragment length polymorphism)
Enzyme Source Recognition Sequence Cut EcoRI Escherichia coli 5'GAATTC 5'---G/AATTC---3' EcoRII Escherichia coli 5'CCWGG 5'---/CCWGG---3' BamHI Bacillus amyloliquefaciens 5'GGATCC 5'---G/GATCC---3' HindIII Haemophilus influenzae 5'AAGCTT 5'---A/AGCTT---3' TaqI Thermus aquaticus 5'TCGA 5'---T/CGA---3' NotI Nocardia otitidis 5'GCGGCCGC 5'---GC/GGCCGC---3' HinfI Haemophilus influenzae 5'GANTC 5'---G/ANTC---3' Sau3A Staphylococcus aureus 5'GATC 5'---/GATC---3' PovII* Proteus vulgaris 5'CAGCTG 5'---CAG/CTG---3' SmaI* Serratia marcescens 5'CCCGGG 5'---CCC/GGG---3
G/GATCC GGATCC GGATCC GGATCC GGATCC GGATCC GGATCC GGAACC GGATCC GGATCC GGATCC GGATCC GGATCC
식물에서는주로 cpdna 의 RFLP 연구가 1980 년대말 ~90 년대초반까지활발히이루어짐
3) DNA sequencing 계통연구를위한 DNA 염기서열분석의장점 : 1) 객관적인형질상태 (character status): A/C/G/T 2) 계통상의미있는형질의수 (informative character) 가무수히많다. 3) 기존의데이터에새로운데이터의첨가가용이하다. 4) 매우적은양의시료에서도데이터를얻을수있다. 5) 실험결과가광범위한분류군에이용될수있다. - 진화속도가느린유전자 : 전체피자식물의계통 - 진화속도가빠른유전자또는유전자들사이의염기서열 (intergenic spacer) 등 : 속또는종들의구분
참조 : DNA 연구를위한기본적인기술 C) PCR (polymerase chain reaction) - 생물체가갖고있는전체 DNA 중특정한일부구간만을똑같은복제품을많이만들어내어이것으로염기서열결정등의다음후속연구를가능하게함. - Kary Mullis는이방법의개발로 Novel prize를받음 (1993).
DNA polymerization: DNA polymerase extends a primer by using a complementary strand as a template. DNA 합성에필요한요소 1) 주형, 2) 프라이머 ( 짧은염기서열 ), 3) DNA 중합효소, 4) 뉴클레오티드 pool, 5) 마그네슘이온 ( 조효소 ) 3) DNA POLYMERASE 2) PRIMER 5 3 T T T G C A A G G G C T A A A C G T T C C C G A G T T C C T C G A G T G T T A C G T T C T T C T C T A G T G T T A C A A A C G T T C C A C G T T C A A A 3 5 1) TEMPLETE 4) dntp s pool A C G T datp dctp dgtp dttp A A 5) Mg ++ T C G T G G T C A T C C G AT A G C Newly synthesised strand 3 5 T T T G C A A G G G C T C A A G G A G C T C A C A A T G C A A G A A G A G A T C A C A A T G T T T G C A A G G T G C A A A C G T T C C C G A G T T C C T C G A G T G T T A C G T T C T T C T C T A G T G T T A C A A A C G T T C C A C G T T C A A A 5
PCR 의원리 http://www.youtube.com/watch?v=2kolniwozku
An example of a PCR method PCR 의온도조건 100 Pre-denature 95 Denature 95 80 Extend 72 Final-extend 72 60 Temp. 40 Anneal 55 20 Cycle 1 Cycle 2 Cycle 30 Soak 4 0 Hold program Cycle program Hold program
심해열수구에서자생하는호열성박테리아 (Thermus aquaticus) 의발견은 PCR 기술발전의획기적인전환점이됨 : 고온에서안정적인 DNA polymerase 의추출 심해열수구 (hydrothermal vents)
호열성박테리아들로부터추출된내열설 DNA 중합효소들 Thermophilic DNA polymerases Thermus aquaticus (Taq) PCR 에서가장많이쓰는 DNA polymerase Thermus thermophilus (Tth) Bacillus stearothermophilus (Bst) Pyrococcus furiosis (Pfu)
참조 : DNA 연구를위한기본적인기술 D) DNA sequencing ( 염기서열결정 ): PCR로증폭된 DNA 가닥들의각각의염기를서열순으로읽을수있는기술 - Sanger에의한방법이가장널리사용 - Sanger method로서한번에읽을수있는염기수는약 800 bp (base pair) 정도.
Sanger method One-dye (or isotope) four-lane system
Four-dye one-lane system: 각각의염기를끊어주는분자에서로다른색의형광물질을표지하여이색이나타내는밴드를읽음으로서염기서열결정 http://www.youtube.com/watch?v=_vwl0izgrto
ABI 377: Gel-type Automatic sequencer 1990 년대부터 2000 년대초반까지많이사용해온 gel type 염기서열자동분석장치
현재사용하고있는 automatic sequencer 에의한분석결과
ABI 3730: Capillary-type Automatic sequencer
참조 : DNA 연구를위한미래기술 NGS (next generation sequencing) Pyro-sequencing 현재또는미래의기술 (2005년최초개발 ) 대용량의시퀀스를한꺼번에획득.
Pyro-Sequencing
Capacity of Next Generation Sequencers ABI 3730; ABI 96 x 1,000 bp = 96,000 bp = 100Kb 950,000 x 450 bp = 405,000,000 bp = 405Mb 인간유전체 : 약 3 Gbp! 현재 NGS 기술은각각의유전자염기서열을결정하는단계를넘어서전체유전체염기서열을결정하는데활발하게이용되고있음. GS Titanium; Roche 454 30,000,000 x 7 x (101 x 2) bp = 42,420,000,000 bp = 42.5Gb Solexa GA2; Illumina 30,000,000 x 7 x (101 x 2) x 4 bp = 169,680,000,000 bp = 169.7Gb HiSeq2000; Illumina 940,000,000 x 75 bp (50+25) = 70,500,000,000 bp = 70.5Gb SOLiD 4; ABI
Krause et al. 2006. Multiplification of the mammoth mitochondial genome and the evolution of Elephantidae. Nature 439: 724-727. Poinar et al. 2006 Metagenomics to paleogenomics: large-scale sequencing of mammoth DNA. Science 311: 392-394. NGS 기술은맘모스, 네안데르탈인의연구와같은화석생물의유전체연구에도이용되고있음.
각종으로부터얻어진 DNA 서열들은정렬 (alignment) 과정을거쳐서종간의유연관계를파악할수있는형질 (character) 들을제공하게된다. 정렬된서열의각각의 site 는모두형질로서작용할수있게됨.
DNA sequence 자체의염기치환뿐아니라 insertion/deletion (indel) 과같은구조적변화도계통연구에있어서중요한형질
Sequencing Data - 초기에는 chloroplast에대하여 RFLP를이용하여서로다른분류군간의제한효소의인식부위만을비교하였음 - PCR-mediated RFLP (or CAPS; cleaved amplified polymorphic sequence): 특정부위를 PCR 후 restriction enzyme을처리하여 band pattern을분석. 큰범위를전반적으로비교 cf) 4-cutter, 6-cutter restriction enzyme Analysis of Molecular Data - 유전자의부위별로축적되는변이율은서로다르다. histon protein: 매우중요한역할을하며분류군간변이율은매우낮다. 전체피자식물의비교또는전체생물들의비교등에사용 - 계통분석을위한유전자부위의선택 천천히변하는유전자부위를선택하면계통수립을위해많은데이터수집이요구됨. 반대로빨리변하는유전자부위를선택하면 reversal ( 역진화 ) 에의해많은형질들이 homoplasy ( 불계적유사성 ) 로작용하여계통수립이어려움. 비교적먼분류군에빠른변이율을보이는 noncoding 구간을이용하면엉뚱한결과를얻을수도있음. 적당한 ( 분류군간약 20% 차이 ) 변이구간을이용하는것이가장좋음.
Plant Genome 식물에는 3 개의독립적유전체가존재함 : chloroplast, mitochondria, nuclear Chloroplast genome - maternal inheritance ( 모계유전 ) - small single-copy region (SSC) + large single copy region (LSC) + inverted repeated region (IR) 로이루어짐 - 유전자들의배열순서는매우안정적임 발견된 rearrangement들은그룹을특징짓는좋은형질이됨 - 식물의분자계통학연구에많이사용된다. - 식물의분자계통연구에흔히이용되는구간 : rbcl, matk, ndhf 등의유전자들과 trnh~psba, trnl~trnf와같은유전자와유전자의사이구간 (intergenic spacer) - 식물계에서엽록체유전체의크기는약 135~160 kbp 기생성식물에서는엽록체유전체의크기가매우작다
엽록체유전체의구조 : LSC + SSC + 2 개의 IR 엽록체에는 1) Phothsynthesis 에관여하는 gene 들 2) trna gene 들 3) rrna gene 들로구성
일반적으로계통연구에많이사용되는엽록체유전체구간들 Frequently Used Gene regions in Chloroplast Genome rbcl~atpb RB ATMR rbcl atpb trnl 5 exon 49317 trnl 3 exon 49873 49855R trnl intron, trnl~trnf trnf 50272R trnk 5 exon matk trnk 3 exon AT1 trnk-3914f MK1 MK3 MK5 MK7 MK9 matk MK2R MK4R trnk-2r LSC Z1 647 895 1024 rbcl 346R647R 895R 1351R 3 rbcl IR SSC IR TRHF THM trnh psba THMR PSAR trnl~psba ndhf 1 MF298 MF561 972 MF1254 MF1795 MF1945 MF2095 0 0.5 1 kb ndhf ORF 350 MF256R 972R MF1165R MF1861R 2110R
엽록체부위의 rbcl 유전자는전통적으로식물분자계통학에서흔히이용되는구간임. Ribulose-1,5-bis-phosphate carboxylase/oxygenase (RuBisCo) Large subunit 1) 기생식물을제외한거의대부분의식물에서나타남 2) 비교적길다 ( 약 1.4kb) 3) Chloroplast DNA 임으로많은 copy가세포내에존재하여 Chase et al. (1993) 은 500여피자식물들로부터 rbcl 유전자염기서열을분석하여최초로피자식물전반에걸친 DNA 분석결과를제시함. 기존의형태적형질을기반으로한분류체계 ( 예 : Cronquist system) 와는상당히다른결과를보였으나계통수의각부분에대한신뢰도 (supporting value) 들이매우낮은 tree 를얻음. 이연구이후학자들은보다많은 DNA 구간을이용하여보다많은분류군을포함한분석을통해전체피자식물의계통을재구성하려고노력함.
4-29
Mitochondria genome - maternal inheritance( 모계유전 ) - 원형유전체이지만다양한크기로존재하고, rearrangement가빈번히일어남 - 배열순서는그룹을특징짓는형질이못됨 - 일반적으로 mitochondria의유전자들은동물계통연구에서는많이사용되지만식물계통연구에서는 chloroplast 유전자들보다는덜사용된다. - atp1, matr 등을사용
다양한크기로재조합된 plant motichondria 유전체 A A A A D B E C F D D B C D E A A F C F B E B E C D D - 전체유전체의크기는일정하나다양한형태와배열로존재함
Nuclear genome - Genome mapping을통해유전자들의배열순서가밝혀지고있음. - 식물에서의일반적인진화속도는 chloroplast genes > mitochondrial genes Nuclear gene들은매우많으므로그진화속도를일반화하기는어렵다. - 전통적으로계통연구에가장많이사용되는핵유전체구간은 rdna (ribosomal DNA) repeating unit 내의 ITS (internal transcribed spacer) 구간임 1) ribosomal DNA는모든생물이공통적으로포함되어있는매우보존적인구간이어서 universal primer에의해증폭가능, 2) spacer 구간이므로많은변이가존재하여 3) multiple copy로존재하여 PCR이용이함 - 계통분석을위한적당한변이율을갖는 single copy nuclear gene을찾는것이현재의큰과제임. 유사유전자들이 multiple copy로존재하면 ( 예, α-, β-hemoglobin) 이들간의상동성을파악하기매우어렵기때문에 single copy gene의분석이가장바람직함.
Ribosomal DNA repeating unit
Chase et al. (1993) 의 rbcl에의한연구이후많은학자들이힘을모아더많은유전자구역과더많은분류군을포함한분석을시도하였는데, 2000년에 U. of Florida의 Soltis 등은 rbcl + atpb + 18S rdna 의세유전자구간을이용한계통분석결과를제시하였고, - 그결과매우안정된피자식물계통수를제시하여이는 - Angiosperm Phylogeny Group System (APG system) 을위한기초가됨 DNA 분석을통한계통연구및유전체연구에대한것은 분자계통학 (Molecular Phylogenetics), 생물정보학 (Bioinformatics) 수업시간에보다자세히언급됨!