4. 결론 1. 서론 휴먼게놈프로젝트이후에, 복잡한생물학적궁금증을해소할수있는개선된시퀀싱기술의필요성이대두되어왔으나시퀀싱의비싼가격과처리양의한계는기술의실용화에크나큰장벽으로평가되었다. 지난 10년간이루어진비약적인차세대시퀀싱기술의발전은단일샘플에서읽을수있는 DNA의기본쌍의수 (r

Similar documents
160106_STEPI_Insight_179호(정기철,김석관_외)rp.hwp

SMARTer Sequencing Kits for Next Generation Sequencing

Illumina 시퀀싱 포트폴리오 브로셔

뉴스레터6호F?2??訝

주간건강과질병 제 10 권제 44 호 연구단신, Brief report 병원체염기서열생산을위한라이브러리제작기법소개 질병관리본부국립보건연구원생물안전평가과양효진, 최현정, 채희열, 강연호 * * 교신저자 : Librar

SMARTer 시리즈

PowerPoint 프레젠테이션

Chapter 26

Microsoft Word - pv_0602.doc

Nuclease (핵산 분해 효소)

Chapter 14 유전정보 (Genetic Information) A + G = C + T 일정 ( 샤가프룰 ] - Watson & Crick(1953년 ) : double helix model of DNA( 이중나선구조 ) 제시 1. 유전정보의전달경로 DNA 상의정

슬라이드 1

[로플랫]표준상품소개서_(1.042)

歯MW-1000AP_Manual_Kor_HJS.PDF


정신분석학자 나게라도 고갱의 의자 가 양성적 갈등 을 드러내는 그림이라고 보았다. 그는 고흐 가 화려한 양탄자를 깔고 열 두 송이의 해바라기를 그려 벽에 거는 등 고갱이 머물 방을 정성스럽게 꾸몄 던 사실에서 고흐의 심리 속에 감추어진 여성성을 읽어 냈다. 나게라는 고

Chapter 6. Nucleotides and Nucleic Acids 세포대사에서뉴클레오타이드 (nucleotide) 의기능은무엇인가? Objective 유전체학 (genomics) 과단백체학 (proteomics) 기본개념이해 재조합 DNA 기술 (recombin

Chapter 4. Bacteria (the first microbes)


<4D F736F F F696E74202D20B1E8BCB120B1B3BCF6B4D420B0ADBFACC0DAB7E1>

실험 Set Up Guide 실험주제 Real Time PCR 실험원리 Quantitative Real-Time PCR (qrt-pcr) 은 1992년에도입되어생명공학에응용되기시작하였이기술은잘알려져있는 PCR기법을개량한것이다. PCR은핵산의효소증폭을이용하며, 극히적은양

환경중잔류의약물질대사체분석방법확립에 관한연구 (Ⅱ) - 테트라사이클린계항생제 - 환경건강연구부화학물질연구과,,,,,, Ⅱ 2010

(Microsoft PowerPoint - src.ppt [\300\320\261\342 \300\374\277\353] [\310\243\310\257 \270\360\265\345])

Microsoft PowerPoint - Week03-Chap1-Basics-3-Sequencing.pptx

1

<4D F736F F F696E74202D20322DC0AFC0FCC0DAB9DFC7F6C0C7C1B6C0FD205BC8A3C8AF20B8F0B5E55D>

Invitrogen GeneArt Platinum Cas9 Nuclease character design & illustration: ryuji nouguchi Invitrogen GeneArt Genomic Cleavage Detection Kit

발생하는오류로인해실제유전정보를이용하기에는많은제약이따르기때문에, 실제염기서열데이터를이용하여매핑도구들의정확한성능평가를한다는것은사실상불가능하다. 이러한매핑도구의성능을평가하기위해대부분의논문에서가상의리드서열을생성하는시뮬레이터를사용하고있으며이로인해염기서열을분석하는데있어서매핑도구뿐

항목

<BBFDC8ADC7D02E687770>

歯스왑노트1

Automated high multiplex qPCR platform for simultaneous detection and quantification of multiple nucleic acid targets

자연언어처리

Microsoft PowerPoint - Ch8

BC6HP Korean.ai

Print

Microsoft PowerPoint 년 제품소개-BIO.pptx

뉴스지14호-칼라

(72) 발명자 김종훈 서울특별시동대문구전농 3 동 67-3 이승구 서울특별시노원구중계 4 동주공 2 단지아파트 206 동 211 호 - 2 -

Jkbcs016(92-97).hwp

전기전자뉴스레터-여름호수정2

Microsoft PowerPoint - 알고리즘_5주차_1차시.pptx

OCW_C언어 기초

Vertical Probe Card Technology Pin Technology 1) Probe Pin Testable Pitch:03 (Matrix) Minimum Pin Length:2.67 High Speed Test Application:Test Socket

2 / 26

<4D F736F F F696E74202D20312DC0AFC0FCC0DAC0C7BAD0C0DABBFDB9B0C7D0205BC8A3C8AF20B8F0B5E55D>

생물정보학및 RNA-Sequence 매핑도구소개 Introduction of Bioinformatics & RNA-Sequence Mapping Tools 권대건 부산대학교컴퓨터공학과 Abstract Frederick Sanger 에의

Cloning

Microsoft Word - in_0205.doc

<484D53B0ADC0C72E687770>

결과보고서

주의내용 주 의 1. 이보고서는질병관리본부에서시행한학술연구용역사업의최종결 과보고서입니다. 2. 이보고서내용을발표할때에는반드시질병관리본부에서시행한 학술연구용역사업의연구결과임을밝혀야합니다. 3. 국가과학기술기밀유지에필요한내용은대외적으로발표또는공개 하여서는아니됩니다.

ICT인문사회융합동향 - 2 동향

<3130C0E5>

KMC.xlsm

(Establishment and Management of Proteomics Core Facility)

제1장 마을유래 605 촌, 천방, 큰동네, 건너각단과 같은 자연부락을 합하여 마을명을 북송리(北松里)라 하 였다. 2006년에 천연기념물 468호로 지정되었다. 큰마을 마을에 있던 이득강 군수와 지홍관 군수의 선정비는 1990년대 중반 영일민속박물 관으로 옮겼다. 건

[Brochure] KOR_TunA


PowerPoint Presentation


한국전지학회 춘계학술대회 Contents 기조강연 LI GU 06 초강연 김동욱 09 안재평 10 정창훈 11 이규태 12 문준영 13 한병찬 14 최원창 15 박철호 16 안동준 17 최남순 18 김일태 19 포스터 강준섭 23 윤영준 24 도수정 25 강준희 26

Microsoft Word _1

Can032.hwp

RVC Robot Vaccum Cleaner

조사보고서 구조화금융관점에서본금융위기 분석및시사점

<C1A632C2F720BAB8B0EDBCAD20BFB5C8AD20C1A4BAB820C7C1B7CEB1D7B7A5C0C720BEF0BEEEBDC7C5C2C1B6BBE72E687770>

THE JOURNAL OF KOREAN INSTITUTE OF ELECTROMAGNETIC ENGINEERING AND SCIENCE Sep.; 30(9),


untitled

MOBIS 12<110B><116F><11AF>_<110E><116C><110C><1169><11BC>.pdf

H3250_Wi-Fi_E.book

서론 34 2

À̵¿·Îº¿ÀÇ ÀÎÅͳݱâ¹Ý ¿ø°ÝÁ¦¾î½Ã ½Ã°£Áö¿¬¿¡_.hwp

Database Search 편 * Database Explorer 8개의카테고리로구성되어있으며, 데이터베이스의폴더역할을하는 subset ( 혹은 subbase) 을생성하여데이터를조직및관리하게된다. 클릭! DNA/RNA Molecules : feature map의데이터

TOYOBO Reagent 만의독보적인기술 ReverTra Ace M-MLV RTase 의 RNase H domain 에 mutation 시키므로 RNase H activity 를낮추고,mRNA 의 degradation 을막아 cdna 합성효율을높임 KOD Polyme

A

목 차 < 요약 > Ⅰ. 검토배경 1 Ⅱ. 반도체산업이경기지역경제에서차지하는위상 2 Ⅲ. 반도체산업이경기지역경제에미치는영향 7 Ⅳ. 최근반도체산업의여건변화 15 Ⅴ. 정책적시사점 26 < 참고 1> 반도체산업개관 30 < 참고 2> 반도체산업현황 31

PCServerMgmt7

BC6DX Korean.ai

Market Review 해외시장 마감지수 전일대비 등락률 마감지수 전일대비 등락률 국내 KOSPI 금리 국고채(년) KOSPI 미 국채(10년)

1217 WebTrafMon II

sirna 실험은잘됐는데... 그러면이제유전자의기능을완전히억제하고싶은데... 1 화 : CRISPR 은손쉽다 CRISPR 에게맡겨봐! 내게염기서열만알려주면 knock out 을시켜버릴게! Gene editing( 게놈편집 ) 을이용하면특정유전자의기능을완전히 knock-


2016 학년도약학대학면접문제해설 문제 2 아래의질문에 3-4분이내로답하시오. 표피성장인자수용체 (epidermal growth factor receptor, EGFR) 는수용체티로신인산화효소군 (receptor tyrosine kinases, RTKs) 의일종으로서세

Microsoft PowerPoint - Week03-Chap1-Basics-3-Sequencing.pptx

EZ-Cloning kit

(b) 미분기 (c) 적분기 그림 6.1. 연산증폭기연산응용회로

Microsoft Word - 11-나희삼

*?꾩옄怨쇳븰7???댁??몄쭛)理쒖쥌

BC6DX-II Korean.ai

The Coreプロモーション計画案

슬라이드 1

PowerPoint Template

Slide 1

< C6EDC1FDBABB2E687770>

Integ

?

Spring SALE 개나리 꽃이 피었습니다! 당신의 얼굴에도 웃음 꽃이 피었습니다! Seakem LE Agarose (Cat. No ) One하면 덤으로 한 개 더! 1+1 기간 : 2011년 3월 2일 ~ 4월 15일 ~ 30 % Sa le 고객지원센터

Chapter 11

Transcription:

BRIC View 2017-R18 BRIC View 리뷰논문요약 차세대씨퀀싱기술의 10 년 Laura Ha Pennsylvania State University E-mail: lxh5015@psu.edu 요약문 2003년휴먼게놈프로젝트가완성된이래다양한씨퀀싱기술과가격의비약적인발전이이루어져왔다. 이렇게생산된방대한양의데이터는유전자의엄청난복잡성을이해하는데크게기어했을뿐만아니라, 상대적으로길이가긴 DNA 가닥을시퀀싱하는데가능해짐에따라, 깊이있는유전자연구가가능하게되었다. 하지만, 지난 10년간이루어진비약적인발전에도불구하고, 높은오류율과낮은판독길이 (read length) 는아직까지도문제점으로지적되고있다. 이논문에서는차세대시퀀싱기술이사용하고있는다양한접근방법과차세대시퀀싱기술분야의비약적인발전이어떻게유전학연구에응용되고있는지알아보고자한다. Key Words: DNA sequencing, Genome, Genomics, Next Generation Sequencing 본자료는 Coming of age: Ten years of next-generation sequencing technologies. Nat Rev Gen. 17, 333 351 (2016) 의논문을한글로번역, 요약한자료입니다. 목차 1. 서론 2. 짧은판독길이 (short-read) 를가진차세대시퀀싱기술들 2.1. 결찰을통한시퀀싱 (Sequencing by Ligation, SBL) 2.2. 결합을통한시퀀싱 (Sequencing by Synthesis, SBS) 2.3. 짧은판독길이 (short-read length) 를가진차세대시퀀싱기술들의비교 3. 긴판독길이 (long-read length) 를가진차세대시퀀싱기술들 3.1. 단일분자실시간시퀀싱 (Single molecule real-time sequencing, SMART) 3.2. 짧은판독길이시퀀싱을응용한합성고판독시퀀싱 (Synthetic long reads) 차세대씨퀀싱기술의 10 년 Laura Ha Page 1 / 9

4. 결론 1. 서론 휴먼게놈프로젝트이후에, 복잡한생물학적궁금증을해소할수있는개선된시퀀싱기술의필요성이대두되어왔으나시퀀싱의비싼가격과처리양의한계는기술의실용화에크나큰장벽으로평가되었다. 지난 10년간이루어진비약적인차세대시퀀싱기술의발전은단일샘플에서읽을수있는 DNA의기본쌍의수 (read length) 의증가뿐아니라시퀀싱에들어가는비용또한크게낮추어임상실험도구로서의가능성을시사하였다. 하지만, 이런비약적인발전에도불구하고전통적인생거시퀀싱 (Sanger sequencing) 에비하여현재의차세대시퀀싱기술은착오율이 0.1-15% 로높을뿐아니라판독길이 (read length) 는 35-700 bp로더낮아아직까지도성공적실용화단계에어려움을가지고있는실정이다. 또한, 차세대시퀀싱기술중비교적긴판독길이 (read length) 를가진방법들조차, 비싼가격과낮은처리양으로효율성면에서많은인기를누리지못하고있는현실이다. 이리뷰에서는차세대시퀀싱기술이사용하고있는다양한접근방법과차세대시퀀싱기술분야의비약적인발전이어떻게유전학연구에응용되고있는지알아보려고한다. 2. 짧은판독길이 (short read length) 를가진차세대시퀀싱기술들 시퀀싱을위한준비단계는크게 DNA를작은조각으로자르는파쇄와템플릿의양을증가시키는복제 / 증폭 (clonal amplification) 의두단계로나뉜다. 시퀀싱준비의첫단계인, 샘플 DNA의파쇄의경우 DNA가적절한방법으로작은조각들로나누어진다. 이렇게만들어진 DNA 조각들은복제와증폭 (clonal amplification) 단계를위한어댑터와결합된다. DNA에연결된어댑터는보통고체표면 (solid surface) 에고정된올리고핵산염과상보적관계에있기때문에, DNA가연결된어댑터와올리고핵산염에결합이고체표면 (solid surface) 에서일어나게된다. 고체표면 (solid surface) 에서의성공적결합후, empcr을통하여 DNA 템플릿의복제가이루어지고최대 100만개의복제된 DNA 조각이고체표면 (solid surface) 에만들어진다. DNA의복제와증폭을위한다양한고체표면 (solid surface) 기술이개발되어왔는데, 구슬기반 (bead based), 고체상태 (solid state), DNA 나노볼생성 (DNA nanoball generation) 이그대표적인예이다. 차세대씨퀀싱기술의 10 년 Laura Ha Page 2 / 9

그림 1. 고체표면 (Solid surface) 브릿지 DNA 증폭방법의예시 고체상태증폭기술 (solid state amplification) 의경우는, 정방향및역방향프라이머 (forward and reverse prime) 가고체표면 (solid surface) 에공유결합으로연결되어있고이 primer는외가닥 DNA가결합할수있는상보적말단 (complementary ends) 을제공한다. 이방법의경우, 성공적인 DNA 증폭을위해서템플릿의밀도를적적히컨트롤하는것이중요한데, 최근의차세대시퀀싱플랫폼은패터닝이된플로우셀 (flow cell) 를이용함으로써더많은 DNA 템플릿이국소적으로생성되고좋은시퀀싱결과를내는게효율적이다. 현재까지템플릿증폭을액체안에서할수있는기술은매우제한적으로발전되어왔다. 그중가장잘알려진기술이 Beijing Genomic Institute (BGI) 의기술인 DNA 나노볼 (DNA nanoball) 이다. DNA가반복적인결합과원형화 (circularization), 그리고분리를통하여 4개의각기다른어댑터층을가진템플릿을만들어낸다. 이러한회전원형증폭 (rolling circle amplification, RCA) 과정을통하여 2천만개의 DNA 나노볼 (DNA nanoball) 이만들어지며 DNA 증폭이이루어진다. 이렇게고체표면 (solid surface) 에서복제되고증폭된 DNA는준비과정을마치고, 시퀀싱단계에들어가게된다. 이장에서소개할짧은판독길이 (read length) 를가진시퀀싱의방법은크게결찰을통한시퀀싱 (sequencing by ligation) 과결합을통한시퀀싱 (sequence by synthesis) 으로나뉜다. 두가지방법을사용하는차세대시퀀싱기술들에대해조금더자세히알아보도록하자. 차세대씨퀀싱기술의 10 년 Laura Ha Page 3 / 9

2.1 결찰을통한시퀀싱 (Sequencing by ligation, SBL) 그림 2. 결찰을통한시퀀싱기술예시 (SOLiD) SBL을사용하는차세대시퀀싱기술들은형광단에연결되어있는프로브가먼저타깃 DNA와결합한후 2~10의뉴클레오티드로이루어진중합체인올리고핵산염이결합한다. 이러한결합은결찰 (ligation) 의시작점이되어형광단으로하여금특정스펙트럼의빛을투사하도록한다. SBL에서는이러한형광단의발광을이미징함으로써염기의정체를식별해낸다. SBL 방법을사용하는대표적플랫폼중하나는 SOLiD이다. SOLiD 플랫폼은두개의뉴클레오티드염기를가진형광단 / 프로브를이용하는데, 각각의형광시그널은다이뉴클레오티드 (dinucleotide) 를나타낸다. 따라서총 16개의다이뉴클레오티드 (dinucleotide) 의조합이가능하고 4종류의형광색으로는표현이불가능함으로각각의형광시그널은여러가지의다이뉴클레오티드 (dinucleotide) 조합을나타내게된다. 따라서이미징에서만들어지는날것그대로의데이터는추가적인데이터처리과정을필요로한다. SOLiD의경우에프로브의결합, 결찰, 이미징, 분열의반복으로상보적인 DNA 사슬 (complementary strand) 의연장이일어나는데여러번의사이클을거치면서템플릿내의모든뉴클레오티드염기가안전하게시퀀싱될수있도록씽글뉴클레오티드 차세대씨퀀싱기술의 10 년 Laura Ha Page 4 / 9

(single nucleotide) 의오프셋 (offset) 이도입된다. 2.2 결합을통한시퀀싱 (Sequencing by Synthesis, SBS) SBS의가장큰특징은 SBL과는달리폴리메라아제 (polymerase) 가이용된다는점이다. 형광단시그널은신장가닥 (elongation strand) 의뉴클레오티드의결합을통하여표출되고이런형광의발광을모니터함으로써시퀀싱이이루어진다. SBS은결합방법에따라싸이클릭가역적종결 (cyclic reversible termination, CRT) 과싱글뉴크리오티드첨가 (Single nucleotide addition, SNA) 로나뉜다. 그림 3. 결합을통한시퀀싱기술 (Illumina) 싸이클릭가역적종결 (CRT) 를사용하는가장대표적시스템은 Illumina이다. 싸이클릭가역적종결 (CRT) 방법은생거시퀀싱 (Sanger sequencing) 과비슷하게라이보스 (ribose) 의 3 에있는히드록실기 (hydroxyl group) 가차단되어있는종단분자 (terminator molecules) 를이용한다. 시퀀싱의시작은 DNA 템플릿이어댑터와상보적인시퀀스를가진프라이머와합체되고, 이이중가닥 (double strand) DNA에폴리메라아제가결합한다. 매싸이클마다 4개의형광단으로표식화된 dntp 혼합물이추가되고각각의 dntp는신장가닥 (elongating complementary strand) 과결합하며형광을발산한다. dntp 식별은두개혹은 4개의레이저채널을가진 total internal reflection fluorescence microscopy를통하여달성된다. 싸이클릭가역적종결 (CRT) 를사용하는또다른시스템은 Qiagen의 Intelligent BioSystems CRT 플랫폼이다. 이시스템의특징은 Illumina와비슷한접근방식을가지나, 샘플준비부터 차세대씨퀀싱기술의 10 년 Laura Ha Page 5 / 9

분석까지한번에처리되는올인원차세대시퀀싱 (all-in-one Next Generation Sequencing) 플랫폼이라는것이다. 싱글뉴크리오티드첨가 (SNA) 는싸이클릭가역적종결 (CRT) 와다르게 4종류의형광단이연결된뉴클레오티드가한꺼번에넣어지는것이아니라, 순차적으로추가된다. 처음으로만들어진차세대시퀀싱기기는싱글뉴크리오티드첨가 (SNA) 의일종인 454 Pyrosequencing이다. 이시스템은템플릿이연결된구슬 (bead) 과효소혼합체 / 칵테일을 PicoTiterPlate에분배한다. 플레이트안에서 dntp와 DNA 가닥의결합으로생체발광 (bioluminescence) 이일어나고이빛을 Charge coupled device (CCD) 카메라를이용하여감지해시퀀싱이이루어진다. 2.3 짧은판독길이 (short read length) 를가진차세대시퀀싱기술들의비교 각각의짧은판독길이를가진차세대시퀀싱플랫폼들은처리량, 가격, 오류프로파일, 판독구조 (read structure) 에서차이를보인다. SOLiD와 Complete Genomics 시스템은 99.99% 라는높은정확성을가지고있으나민감도 (sensitivity) 와특이성 (specificity) 는부족함을가진다. 또한 SOLiD는최대판독길이가 75 bp로매우낮기때문에 genomic assembly와 structural variant detection 응용에어려움이있다. Illumina가상대적으로짧은판독길이를가진차세대시퀀싱시장을장악할수있었던이유는높은레벨의호환성 (cross platform compatibility) 과플랫폼의다양성때문이다. 하지만 Illumina는 CRT 시스템인만큼하나의뉴클레오티드염기가반복되는시퀀스부분 (homopolymer) 의오류에취약하고 AT와 GC가밀집된부분에서과소표시 (under representation) 가일어나거나대치오류 (substitution error) 가일어나는문제점을가지고있다. 표 1. 짧은판독길이를가진차세대시퀀싱기술들의비교 플렛폼판독길이처리량소요시간오류율 Gb 당가격 SOLiD 50-75 bp 80Gb-160Gb 6 일 <0.1% $130 Illumina MiSeq v3 75-300bp 3.3-15Gb 21-56 시간 0.1% $110-250 Illumina HiSeqX 150 bp 800-900Gb per flow cell 3 일 <0.1% $7 454 GS 400-600 bp 35Mb 10 시간 1% $40,000 3. 긴판독길이 (long read length) 를가진차세대시퀀싱기술들 게놈은길고반복적인요소를가질뿐아니라구조적다양성을가진매우복잡한구조체이다. 이렇게복잡하고긴구조체는짧은판독길이를가진차세대시퀀싱테크놀로지로는풀어내는것에는한계가있다. 따라서긴판독길이를기반으로한시퀀싱기술은이런거대한 차세대씨퀀싱기술의 10 년 Laura Ha Page 6 / 9

구조적특성을효과적으로파헤침으로써게놈의성분적모호함을해결하는데도움을준다. 긴판독길이를사진차세대시퀀싱기술의경우특히트랜스크립톰 (transcriptomics) 의분석에매우유용한정보를제공한다. 뿐만아니라연구자가엑손 (exon) 의결합이나유전자동형단백질 (gene isoform) 을정밀하게구분할수있도록도움을준다. 현재까지두종류의긴판독길이를가진시퀀싱기술이존재하는데단일분자실시간시퀀싱 (single molecule real-time sequencing) 과짧은판독길이시퀀싱테크놀로지를기반으로합성하여긴길이의 DNA를시퀀싱해내는 synthetic long reads 시퀀싱기술이그것이다. 두기술중단일분자실시간시퀀싱 (single molecule real-time sequencing) 은증폭된 DNA 조각의복제품을기반으로시그널을감지하지않는다는점에서그리고 dntp 추가에화학적사이클링을사용하지않는다는점에서짧은판독길이시퀀싱방법과다르다. 3.1 단일분자실시간시퀀싱 (Single molecule real-time sequencing, SMART) 현재가장널리이용되는긴판독길이시퀀싱플랫폼은 Pacific Bioscience의단일분자실시간시퀀싱 (SMART) 이다. 이장비는수천개의피코리터웰 (picoliter well) 을가진특별한플로우셀 (flow cell) 을이용하는데웰의바닥에고정된폴리메라아제가 DNA 가닥을읽으면서시퀀싱을진척시킨다. dntp가각각의단일분자염기와결합하게되면바닥에고정된폴리메라아제가 dntp에연결된형광단을분리시킨다. 이렇게분리된형광단이내뿜는형광은레이저와카메라시스템으로지속적으로시각화되고녹음되어시퀀스가판독된다. 단일분자에서나오는형광의강도가매우약하기때문에피코리터웰에서고도의집중된레이저를응집하여형광을측정하는 Zero Mode Waveguide라는기술이이미징에사용된다. 그림 4. 긴판독길이를가진차세대시퀀싱기술 (SMART) 차세대씨퀀싱기술의 10 년 Laura Ha Page 7 / 9

SMART의경우비록 DNA 템플릿이 3 kb보다길경우여러번시퀀스되는데어려움이있지만짧은 DNA 템플렛의경우여러번시퀀스되는데문제가없고이런복수판독은공통배열 (consensus sequence) 를만드는데사용된다. 2014년에 Oxford Nanopore Technology에서개발된 MinION은 DNA가단백질구멍을통과하게함으로써시퀀싱을시작하는데단백질에서일어나는 DNA 이동은전압의끊어짐을일으키고이것은단백질구멍내의전류의변화를일으킨다. 여기서일어나는전극의변화를시간에따라추적함으로써시퀀스가판독된다. 3.2 짧은판독길이시퀀싱을응용한합성고판독시퀀싱 (Synthetic long read sequencing) 합성고판독 (synthetic long reads) 시퀀싱기술의특징은기존의짧은판독길이시퀀서에의해시퀀스된 DNA 조각 (fragment) 에바코딩을더하는것이다. 현재이기술을이용하는기술중하나인 Illumina synthetic long read sequencing 플랫폼의경우, DNA 템플릿이 8-10 kb 정도길이로나누어지고, 이렇게조각난 DNA를극미량웰 (microtitre well) 에 1 웰당 3,000개정도의템플릿을가지도록분배한다. 이웰안에서 DNA는 350 bp 정도의작은조각으로다시조각내어지고바코딩된다. 이렇게만들어진같은웰안의 DNA 조각들은같은바코드를가지게되고, 풀링 Pooling 이라는작업을통하여모든웰안에있던 DNA가모아진후에짧은판독길이시퀀싱의방법으로시퀀싱된다. 아래의표는다양한긴판독길이를가진차세대시퀀싱플랫폼들은처리량, 가격, 오류프로파일, 판독구조 (read structure) 에서차이를비교한표이다. 표 2. 긴판독길이를가진차세대시퀀싱기술들의비교 플렛폼판독길이처리량소요시간오류율 Gb 당가격 Pacific Bioscience 20Kb 500Mb-1Gb 4 시간 13% $1000 Oxford Nanopore MK 1 Min- ION 200Kb 1.5Gb 최대 48 시간 12% $750 Illumina Synthetic long read 100Kb 600Mb 7-60 시간 0.1% $1,000 4. 결론 지난 10년간의차세대시퀀싱기술의발전은총유전체시퀀싱 (whole Genome Sequencing) 분야의흥행을이루었을뿐아니라, 전사체학연구 (transcriptomic research) 분야나, 유전체의규제메커니즘에관한엑솜시퀀싱과표적시퀀싱분야에서도눈부신발전을이루어냈다. 2012년 Ellis 연구팀에의하여연구된유방암환자의방향화효소 (aromatase inhibitor) 테라피와유전자의관련성에서보여지듯이, 차세대시퀀싱기술의성장은많은연구자들에게유전체의심도있는연구와각각의유전자가내포하고있는생물학적의미를이해할수있는기회를제공해주었다. 차세대씨퀀싱기술의 10 년 Laura Ha Page 8 / 9

최근의차세대시퀀싱패러다임의변환은긴 DNA를시퀀싱해내는능력의진화이다. 복잡하고반복되는부분이많은 DNA 경우, 그동안짧은판독길이시퀀싱기술로는시퀀스를풀어내는데어려움이있어왔다. 하지만최근연구에서 Chaisson 그룹이발명한긴판독길이시퀀싱기술을용하여 GrCH37의매우복잡한표준유전체의신원을성공적으로확인해냈다. 이번리뷰에서우리는차세대시퀀싱기술의현주소를살펴보았다. 비록아직까지는많은숙제들이남아있으나, 방대한 DNA 양의염기서열정보를병렬적으로처리할수있는차세대시퀀싱기술의능력은새로운생명체의유전정보를확인하거나암이나기타질병진단을위한용도로써의그활용도가기대된다. The views and opinions expressed by its writers do not necessarily reflect those of the Biological Research Information Center. Laura Ha(2017). 차세대씨퀀싱기술의 10 년. BRIC View 2017-R18 Available from http://www.ibric.org/myboard/read.php?board=report&id=2770 (Jul 11, 2017) Email: member@ibric.org 본콘텐츠는의후원으로작성되었습니다. 차세대씨퀀싱기술의 10 년 Laura Ha Page 9 / 9