Molecular Systematics
생물계통연구에있어서 DNA 분석의의미 생물의형태를나타내는궁극적인유전물질로서의 DNA 를분석하는것임. - 분자데이타는많은경우형태적으로지지되어온분류군들이단계원적임을지지해주고있다 ex) 벼과 (Poaceae), 콩과 (Fabaceae), 장미과 (Rosaceae) - 논란이되어온유연관계를명확히함. ex) 수련 (water lily; Nymphaea) 은더이상연꽃 (Nellumbo) 과같은그룹이아님.
수련 (Nymphaea) 연꽃 (Nelumbo)
Asterales Dipsacales Apiales Aquifoliales Garryales Gentianales Laminales Solanales Ericales Cornales 국화, 초롱꽃인동, 산토끼꽃당귀, 인삼감탕나무두충용담, 꼭두서니꿀풀, 금어초토마토, 메꽃진달래, 앵초층층나무, 수국 Campanulids (Euasterids II) I) Lamiids (Euasterids Asterids Sapindales Malvales Brassicales 귤, 단풍나무무궁화애기장대, 무우 Fagales 자작나무, 상수리 Cucurbitales 박, 베고니아 Rosales 장미, 느릅나무 Fabales 콩, 자귀나무 Zygophyllales 남가새 Celestrales 노박덩굴 Oxalidales 굉이밥 Malpighiales 버드나무, 제비꽃 Geraniales Myrtales 쥐손이풀바늘꽃 Saxifragales 범의귀, 돌나물 Caryphyllales 카네이션, 선인장 Santalales 단향, 겨우살이 Beberidopsidales Gunnerales Buxaceae 회양목 Trochodendraceae Proteales 연꽃, 버즘나무 Sabiaceae 나도밤나무 미나리아재비 Euptelea 양귀비 Ceratophyllales 붕어마름 Malvids rosids II) M (Eu Fabids (Eurosid I) Ranunculales Rosids Coreeudicots Basal eudicots EUDICOTS 벼, 백합옥수수 MONOCOTS Acorus 창포 Canellales Piperales Magnoliales Laurales Chloranthus Austrobailales Nymphaeaceae Hydatellaceae Amborella 후추, 족도리풀목련, 튜립나무녹나무, 아보카도홀아비꽃대 붓순나무, 오미자수련 Magnoliids Basal Angiosperms EXTENT GYMNOSPERMS
Hyadtellaceae
계통학에서사용되는분자적방법 1) DNA-DNA hybridization - 생물간의전체유전체의비교. - DNA 분석초기동물군에서활발히연구 - 현재는거의사용되고있지않음
2) RFLP (restriction fragment length polymorphism) p
식물에서는주로 cpdna 의 RFLP 연구가 1980 년대말 ~90 년대초반까지활발히이루어짐
3) DNA sequencing 계통연구를위한 DNA 염기서열분석의장점 : 1) 객관적인형질상태 (character status): A/C/G/T 2) 계통상의미있는형질의수 (informative character) 가무수히많다. 3) 기존의데이터에새로운데이터의첨가가용이하다. 4) 매우적은양의시료에서도데이터를얻을수있다. 5) 실험결과가광범위한분류군에이용될수있다. - 진화속도가느린유전자 : 전체피자식물의계통 - 진화속도가빠른유전자또는유전자들사이의염기서열 (intergenic spacer) 등 : 속또는종들의구분
DNA 연구를위한기본적인기술 A) PCR (polymerase chain reaction) - 생물체가갖고있는전체 DNA 중특정한일부구간만을똑같은복제품을많이만들어내어이것으로염기서열결정등의다음후속연구를가능하게함. - Kary Mullis는이방법의개발로 Novel prize 를받음 (1993).
DNA polymerization: DNA polymerase extends a primer by using a complementary strand as a template. DNA 합성에필요한요소 1) 주형, 2) 프라이머 ( 짧은염기서열 ), 3) DNA 중합효소, 4) 뉴클레오티드 pool, 5) 마그네슘이온 ( 조효소 ) 3) DNA POLYMERASE 2) PRIMER 5 3 T T T G C A A G G G C T 5) Mg ++ A A A C G T T C C C G A G T T C C T C G A G T G T T A C G T T C T T C T C T A G T G T T A C A A A C G T T C C A C G T T C A A A 3 5 1) TEMPLETE 4) dntp s pool A C G T datp dctp dgtp dttp A A T C G T G G T C A T C C G AT A G C Newly synthesised strand 3 5 T T T G C A A G G G C T C A A G G A G C T C A C A A T G C A A G A A G A G A T C A C A A T G T T T G C A A G G T G C A A A C G T T C C C G A G T T C C T C G A G T G T T A C G T T C T T C T C T A G T G T T A C A A A C G T T C C A C G T T C A A A 5
PCR 의원리
An example of a PCR method PCR 의온도조건 100 Pre-denature 95 Denature 95 80 Extend 72 Final-extend 72 60 Temp. Anneal 40 55 20 Cycle 1 Cycle 2 Cycle 30 Soak 4 0 Hold program Cycle program Hold program
심해열수구에서자생하는호열성박테리아의발견은 PCR 기술발전의획기적인전환점이됨 : 고온에서안정적인 DNA polymerase 의추출 심해열수구 (hydrothermal vents)
Thermophilic DNA polymerases Thermus aquaticus (Taq) PCR에서가장많이쓰는 DNA polymerase Thermus thermophilus (Tth) Bacillus stearothermophilus (Bst Bst) Pyrococcus furiosis (Pfu)
PCR 수행시매사이클이지날때마다기하급수적으로증폭이이루어지지만약 30 사이클이상진행시키면 1) DNA polymerase의성능이떨어지고 2) dntp ( 뉴클레오티드들 ) 이소진되고 3) 여러가지반응부산물이생겨반응을저해함으로 30 사이클이상이되면더이상증폭되지않는다
DNA 연구를위한기본적인기술 http://www.youtube.com/watch?v=uyaghri30om&feature=related B) Gel electrophoresis agarose 또는 acrylamide 등으로만든 gel에 DNA를통과시키면 + 극으로이동하는데, 이때분자량과전하에따라차별적으로이동하여같은크기의분자들이 band 를형성함.
PCR 반응물을전기영동한것
DNA 연구를위한기본적인기술 C) 제한효소 (restriction enzyme) 반응 - 제한효소란특정염기서열을인식하여인식한부위를자르는효소를말함. - 80 년대말 ~90 년대초반제한효소를이용한 RFLP(restiction fragment length polymorphism; 제한효소조각길이다형성 ) 기술을이용하여 cpdna analysis에의한식물계통연구활발
Enzyme Source Recognition Sequence Cut EcoRI Escherichia coli 5'GAATTC 5GAATTC 5' ---G/AATTC---3 3' EcoRII Escherichia coli 5'CCWGG 5'---/CCWGG---3' BamHI Bacillus amyloliquefaciens 5'GGATCC 5'---G/GATCC---3' HindIII Haemophilus influenzae 5'AAGCTT 5AAGCTT 5'---A/AGCTT---3' TaqI Thermus aquaticus 5'TCGA 5'---T/CGA---3' NotI Nocardia otitidis 5'GCGGCCGC 5'---GC/GGCCGC---3' HinfI Haemophilus influenzae 5'GANTC 5'---G/ANTC---3' Sau3A Staphylococcus aureus 5'GATC 5'---/GATC---3' PovII* Proteus vulgaris 5'CAGCTG 5'---CAG/CTG---3' SmaI* Serratia marcescens 5'CCCGGG 5'---CCC/GGG---3
DNA 연구를위한기본적인기술 D) DNA sequencing ( 염기서열결정 ): PCR 로증폭된 DNA 가닥들의각각의염기를서열순으로읽을수있는기술 - Sanger 에의한방법이가장널리사용 - Sanger method로서한번에읽을수있는염기수는약 800 bp (base pair) 정도.
Sanger method http://www.youtube.com/watch?v=mz-4lsfecm4&feature=related
F d l t 각각의염기를끊어주는분자에서로다른색의형광물질 Four-dye one-lane system: 각각의염기를끊어주는분자에서로다른색의형광물질을표지하여이색이나타내는밴드를읽음으로서염기서열결정
ABI 377: Gel-type Automatic sequencer
ABI 3730: Capillary-type Automatic ti sequencer ABI 3100
DNA 연구를위한미래기술 Phyro-sequencing 현재또는미래의기술 (2005 년최초개발 ) 대용량의시퀀스를한꺼번에획득.
Phyro-Sequencing
한번에읽을수있는염기수 Roche GS-FLX 100M Illumina ABI SOLid 4G 10G
Krause et al. 2006. Multiplification of the mammoth mitochondial genome and the evolution of Elephantidae. Nature 439: 724-727. 727 Poinar et al. 2006 Metagenomics to paleogenomics: large-scale sequencing of mammoth DNA. Science 311: 392-394.
개인유전체시대의시작 : 각자의전체유전체를밝혀개인식별, 개인적유전병치료, 궁극적으로는클로닝에이용될수있음 미래사회를장악하고있는 DNA 염기배열이다. 우주선을발사하는회사 < 가타카 > 를출입하기위해본인확인을하려면매일약간양의혈액을엄지손가락으로부터뽑아내야한다. 유전체정보는분류를위한계통파악을위한궁극적인정보임.
Plant Genome - Three genomes in each plant: chloroplast, mitochondria, nuclear - Mitochondria genome maternal inheritance( 모계유전 ), circular but order of genes is variable rearrangement 가빈번히일어남 배열순서는그룹을특징짓는형질이못됨 - Chloroplast genome maternal inheritance( 모계유전 ) 유전자들의배열순서는매우안정적으로 rearrangement는매우드믈게일어남 발견된 Rearrangement 들은그룹을특징짓는좋은형질이됨 small single-copy region + large single copy region + inverted repeated region들로이루어짐 - Nuclear genome Genome mapping 을통해유전자들의배열순서가밝혀지고있음. 식물에서의일반적인진화속도는 chloroplast genes > mitochondrial genes Nuclear gene 들은매우많으므로그진화속도를일반화하기는어렵다.
옥수수 Chloroplast genome
Gene map of the Gossypium hirsutum ch loroplast genome. The thick lines indicat e the extent of the inverted repeats (IRa and IRb), which separate the genome int o small (SSC) and large (LSC) single copy regions. Genes on the outside of the ma p are transcribed in the clockwise directi on and genes on the inside of the map a re transcribed in the counterclockwise dir ection. Numbered lines around the map indicate the location of repeated sequen ces found in the cotton genome (see Tab le 1 for details). The SSC region is in the reverse orientation relative to tobacco [8 0]. This does not reflect any differences i n gene order for cotton but simply reflec ts the well-known phenomenon that the SSC exists in two orientations in chloropl ast genomes [84]. 엽록체에는 1) Phothsynthesis 에관여하는 gene 들 2) trna gene들 3) rrna gene들로구성
4-29
Genome Rearrangement Data는분류학에있어서상당히유용하게이용됨. 현재는 mapping의과정이아니라 whole genome sequencing등의기법을이용하여 genome structure를밝힘 Sequencing Data - 초기에는 chloroplast 에대하여 RFLP 를이용하여서로다른분류군간의제한효소의인식부위만을비교하였음 - PCR-mediated RFLP (or CAPS; cleaved amplified polymorphic sequence): 특정부위를 PCR 후 restriction enzyme 을처리하여 band pattern 을분석. definition: A technique for identifing polymorphisms at a particular locus. The locu s is amplified by PCR, followed by digesting with restriction enzymes. Polymorphisms may result in different size restriction fragments. 큰범위를전반적으로비교 cf) 4-cutter, 6-cutter restriction enzyme Analysis of Molecular Data - 유전자의부위별로축적되는변이율은서로다르다. histone protein: 매우중요한역할을하며분류군간변이율은매우낮다. 전체피자식물의비교또는전체생물들의비교등에사용 - 계통분석을위한유전자부위의선택 천천히변하는유전자부위를선택하면계통수립을위해많은데이터수집이요구됨. 반대로빨리변하는유전자부위를선택하면 reversal( 역진화 ) 에의해많은형질들이 homoplasy ( 불계적유사성 ) 로작용하여계통수립이어려움. 비교적먼분류군에빠른변이율을보이는 noncoding 구간을이용하면심각한결과를초래함. 적당한 ( 분류군간약 20% 차이 ) 변이구간을이용하는것이가장좋음.
Alignment of Sequences - 일반적으로정렬프로그램에의해정렬후눈으로정렬상태를재확인하여조정하는방법을채택 - 많은 insertion 과 deletion 은정렬상의문제를일으킴 chloroplast 유전자들예를들어 rbcl, ndhf 등은 indel 이거의없어정렬상의문제가없음 - Coding sequence 는 reading frame 을유지하여정렬하여야만함.
rbcl study Ribulose-1,5-bis-phosphate carboxylase/oxygenase (RuBisCo) Large subunit 1) 기생식물을제외한거의대부분의식물에서나타남 2) 비교적길다 ( 약 1.4kb) 3) Chloroplast DNA 임으로많은 copy 가세포내에존재하여 Chase et al. (1993) 은 500 여피자식물들로부터 rbcl 유전자염기서열을분석하여최초로피자식물전반에걸친 DNA 분석결과를제시함. 기존의형태적형질을기반으로한분류체계와는상당히다른결과를보였으나부분적으로 supporting value 들이매우낮은 tree 를얻음. Other Chloroplast Genes - atpb, matk, ndhf 등을주로분석 Mitochondrial Genes - atp1, matr 등을사용 Nuclear Genes - rdna repeating Unit - 계통분석을위한적당한 Single copy nuclear gene을찾는것이현재의큰과제임.
Frequently Used Gene regions in Chloroplast Genome trn nl 5 exon trn nl 3 exon trn nf rbcl RB ATMR atpb 49317 49873 5 6 49855R 50272R trnk 5 exon trnk 3 exon ATM 4 AT1 trnk-3914f MK1 MK3 MK5 MK7 MK9 matk MK2R MK4R 7 8 9 trnk-2r LSC 3 Z1 647 895 1024 rbcl 346R647R 895R 1351R 3 TRHF 10 THM trnh psba IR SSC IR THMR PSAR IR ORF 350 2 MF1945 MF1795 MF2095 ndhf 1 1 MF298 MF561 972 MF1254 MF1795 MF1945 MF2095 0 0.5 1 kb P14 ORF-R ORF-2R MF256R 972R ndhf ORF 350 MF1165R MF1861R 2110R
Ribosomal RNA repeating unit rbcl + atpb + 18S rdna analyses (Soltis et al. 2000) - 상당히안정된피자식물전체의계통을보여줌