생물정보분석으로생명현상이해하기 한윤수 중앙대학교생명과학과 왓슨과크릭의 DNA 구조발표 (1953) 현대분자생물학의시작 A, C, G, T 로구성된유전정보
분자생물학의중심원리 (Central Dogma) 크릭 (1956): DNA makes RNA makes protein 복제 DNA ( 핵산 ) 역전사 전사 복제 RNA ( 핵산 ) 해독 단백질 ( 아미노산 ) 유전부호 (Genetic Code) DNA 서열 단백질서열 http://study.zum.com/book/12514
생명활동은정보의흐름 ( 유전자발현 ) 세포 유전체 염색체 전사 해독 DNA ( 유전자발현 ) RNA ( 단백질발현 ) 단백질 http://content.edgar-online.com/edgar_conv_img/2013/02/26/0001193125-13-076887_g444115g97x50.jpg 인간유전체계획 (Human Genome Project) 유전체서열정보 조립설명서 ( 발생, 형질 ) 작동설명서 ( 생존, 행동 ) 복제설명서 ( 유전, 진화 ) 유전체정보 생명현상 인간 ~32억개DNA 글자 ~25,000 개단백질 인간의유전체를구성하는모든 DNA 서열결정 (1999) 인간에게유용한모델생물들의유전체서열결정 : 대장균, 효모, 초파리, 예쁜꼬마선충, 생쥐, 쥐,
유전체정보연구의역사 효모 12.1Mb (1996); 대장균 4.6Mb (1997) 예쁜꼬마선충 100Mb (1998); 초파리 130Mb (2000) 인간 3.2Gb (2001, 2004); 한국인 (2009) http://www.nature.com/nature/journal/v470/n7333/pdf/nature09764b.pdf 차세대서열결정법 (NGS) 자동서열결정법의비약적발달 DNA 한글자, 2 달러 백만글자, 1 달러 Next Generation Sequencing: 한번에최대 1 조개서열 비용 ( 천달러 ) 유전체서열결정비용 NGS 출현 무어 (Moore) 의법칙 ( 컴퓨팅가격은 18 개월마다반으로감소 ) 현재인간유전체결정비용은약 5 천달러 http://www.nature.com/news/technology-the-1-000-genome-1.14901
The 1000 Genome Project 천개의유전체계획 (2008-2012, ) 1,092 개의인간유전체서열발표 DNA 서열과인간의형질간의관계분석 인종별특징, 형질, 유전병, 적응성, http://humanorigins.si.edu/evidence/genetics/skin-color DNA 서열정보의폭발적증가 미국립생물공학정보센터 (National Center for Biotechnology Information) NCBI 18 개월마다 2 배로증가 ; 현재 ~9천억글자 수백종의유전체서열정보 http://www.ncbi.nlm.nih.gov/genbank/statistics
생물정보의종류 : 유전체와유전자서열 유전체 DNA 서열, 개인별다양성 유전자의서열, 구조, 위치, 조절부위 https://genome.ucsc.edu 생물정보의종류 : 유전자발현정보 유전자발현의형태, 위치, 시기, 양 뇌의여러부위에서의도파민신호전달관련유전자의발현양상 뇌부위 도파민신호전달관련유전자 http://www.nature.com/nature/journal/v489/n7416/full/nature11405.html
생물정보의종류 : 단백질서열과구조 단백질의서열, 입체구조, 해독후변형, 기능, 수명 >gi 62362414 ref NP_005148.2 tyrosine protein kinase ABL1 isoform a [Homo sapiens] MLEICLKLVGCKSKKGLSSSSSCYLEEALQRPVASDFEPQGLSEAARWNSKENLLAGPSENDPNLFVALY DFVASGDNTLSITKGEKLRVLGYNHNGEWCEAQTKNGQGWVPSNYITPVNSLEKHSWYHGPVSRNAAEYL LSSGINGSFLVRESESSPGQRSISLRYEGRVYHYRINTASDGKLYVSSESRFNTLAELVHHHSTVADGLI TTLHYPAPKRNKPTVYGVSPNYDKWEMERTDITMKHKLGGGQYGEVYEGVWKKYSLTVAVKTLKEDTMEV EEFLKEAAVMKEIKHPNLVQLLGVCTREPPFYIITEFMTYGNLLDYLRECNRQEVNAVVLLYMATQISSA MEYLEKKNFIHRDLAARNCLVGENHLVKVADFGLSRLMTGDTYTAHAGAKFPIKWTAPESLAYNKFSIKS DVWAFGVLLWEIATYGMSPYPGIDLSQVYELLEKDYRMERPEGCPEKVYELMRACWQWNPSDRPSFAEIH QAFETMFQESSISDEVEKELGKQGVRGAVSTLLQAPELPTKTRTSRRAAEHRDTTDVPEMPHSKGQGESD PLDHEPAVSPLLPRKERGPPEGGLNEDERLLPKDKKTNLFSALIKKKKKTAPTPPKRSSSFREMDGQPER RGAGEEEGRDISNGALAFTPLDTADPAKSPKPSNGAGVPNGALRESGGSGFRSPHLWKKSSTLTSSRLAT GEEEGGGSSSKRFLRSCSASCVPHGAKDTEWRSVTLPRDLQSTGRQFDSSTFGGHKSEKPALPRKRAGEN RSDQVTRGTVTPPPRLVKKNEEAADEVFKDIMESSPGSSPPNLTPKPLRRQVTVAPASGLPHKEEAGKGS ALGTPAAAEPVTPTSKAGSGAPGGTSKGPAEESRVRRHKHSSESPGRDKGKLSRLKPAPPPPPAASAGKA GGKPSQSPSQEAAGEAVLGAKTKATSLVDAVNSDAAKPSQPGEGLKKPVLPATPKPQSAKPSGTPISPAP VPSTLPSASSALAGDQPSSTAFIPLISTRVSLRKTRQPPERIASGAITKGVVLDSTEALCLAISRNSEQM ASHSAVLEAGKNLYTFCVSYVDSIQQMRNKFAFREAINKLENNLRELQICPATAGSGPAATQDFSKLLSS VKEISDIVQR ABL1 RNA 중합효소 RNA DNA 글리벡 http://en.wikipedia.org/wiki/imatinib http://www.rcsb.org/pdb/home/home.do 생물정보의종류 : 유전자조절네트워크 유전자들의상호조절네트워크 http://www.nature.com/nm/journal/v16/n10/full/nm1010-1079.html http://www.nature.com/nature/journal/v466/n7302/full/nature09204.html
바이오빅데이터 (BIO BIG DATA) 생물정보 생명체의형질 http://www.nature.com/nature/journal/v489/n7416/full/nature11405.html 생물정보분석 : 암유발유전자발견 암특이적돌연변이가있거나발현이변하는유전자 정상인 만성림프구성백혈병환자 http://www.jci.org/articles/view/24176
생물정보분석 : 유전질환유전자검출 유전질환환자의유전체서열분석 돌연변이유전자 지텔만증후군 (Gitelman Syndrome) 콩팥의나트륨, 칼륨등전해질재흡수기능상실 근육경련, 허약, 사지마비 SLC12A3 유전자의돌연변이 http://www.pnas.org/content/106/45/19096.long $1,000 유전체시대 한사람의유전체전부를 ~100만원정도에결정 개인유전체 (Personal Genome) 정보 사람마다조금씩다른유전자형태 서로다른형질 얼굴모양, 피부색, 골격구조, 운동능력, 예술성, 성격, 질병민감성, 유전병, 특정암에대한민감성예측 안젤리나졸리의유방암예방수술 http://bgiamericas.com/applications/human/ http://www.illumina.com/technology/next-generation-sequencing.ilmn
유전체 DNA 정보로부터형질의예측 ACTN3 유전자, 마라토너와스프린터 R/R 형, 스프린터 ; X/X 형, 마라토너, X/R 형 : 중간 http://bgiamericas.com/applications/human/ http://www.wired.com/2008/10/the-gene-for-jamaican-sprinting-success-no-not-really/ http://kohlmanngen677s13.weebly.com/ http://www.nytimes.com/2008/11/30/sports/30genetics.html?pagewanted=all&_r=1& DNA 정보로몽타주그리기 얼굴의형태를조절하는 24 개의유전자연구 DNA 서열로부터얼굴의형태추정가정 POLR1Da 유전자의영향을받는부위 효과없음 최대효과 http://www.nature.com/news/mugshots-built-from-dna-data-1.14899
생물정보분석의활용 : 진화학 DNA의작은변화가형태에는큰변화 요리과정에서중간단계를조금변화시키면그결과는매우다르다 형태를기초로한생물의계통분류는오류가있을수있다 하나의종은약간씩서로다른유전체사본들을서로섞고복사하여비슷하게유지한다 종분화가일어나면유전체의섞임이멈춘다 유전체서열이비슷하면형태와무관하게최근에종분화 생명의대분류 : 5 왕국? 1. 동물 2. 식물 3. 균류 ( 곰팡이 ) 4. 원생생물 5. 세균 ( 박테리아 ) ( 단세포원핵생물 ) ( 단세포진핵생물 ) ( 단세포원핵생물 )
분자계통분류학 유전체 DNA 또는단백질서열을이용한계통의분류 한종은조금씩다른유전체사본들을서로섞는개체집단 종분화가일어나면유전체서열이달라지기시작 유전체서열이비슷할수록최근에분화한계통 계통분류학과진화학에혁명적인영향 인간원숭이 1 코끼리 8 주머니쥐 25 생명의대분류 : 3 영역 진핵생물 동물, 식물, 균류등다세포진핵생물은수많은단세포진핵생물사이의가지들 세균 ( 박테리아 ) 고세균
생명의나무 (Tree of Life) 모든생물의진화역사에따른계통분류 http://www.tellapallet.com/tree_of_life.htm 티라노사우루스는새의친척 화석골격연구에따르면새는공룡의일종 티라노사우루스도새처럼깃털이? http://www.walkingwithdinosaurs.com/suploads/dinosaur-details/dinosaur-tyrannosaurus/tyrannosaur-dino-large.png http://img3.wikia.nocookie.net/ cb20140110005309/dinosaurs/images/6/68/new_tyrannosaurus_test_render_project_mesozoica_by_sketchy_raptor-d6wv444.png
티라노사우루스의콜라젠단백질? 티라노사우루스의화석뼈에서콜라젠추출 콜라젠은동물몸무게의 20-30% 로매우양이많음 http://www.sciencemag.org/content/307/5717/1952.full 티라노사우루스의콜라젠단백질서열? 콜라젠단백질서열일부결정 새와가까움 포유류 악어 타조닭 도마뱀 http://www.sciencemag.org/content/320/5875/499.long
코끼리와맘모스의가족관계? 아프리카코끼리 1 2 3 아시아코끼리 맘모스 맘모스는아시아코끼리의친척 냉동된맘모스사체에서 DNA 서열결정 아프리카코끼리 맘모스 아시아코끼리 (~6 백만년전 ) (~7 백만년전 ) http://www.plosbiology.org/article/info%3adoi%2f10.1371%2fjournal.pbio.0050207
맘모스의한대기후적응 헤모글로빈의단백질서열정보 맘모스특이적서열 헤모글로빈구조정보 산소이용효율증가 아시아코끼리 맘모스 아프리카코끼리 맘모스 http://www.nature.com/ng/journal/v42/n6/abs/ng.574.html 인간의피부색 인간의피부색 : 자외선에의한피부손상과비타민D 생산 MC1R 등색관련유전자 : 머리카락, 피부, 눈색결정 적도 인간피부색의분포
네안데르탈인의유전체 DNA 정보 유럽, 서아시아, 중앙아시아 : 13만년-3만년전 네안데르탈인의피부색은? 현대인사피엔스와 6천년이상공존 네안데르탈인과현생인류의혼혈? 네안데르탈인 네안데르탈인의피부색 네안데르탈인의뼈에서 MC1R 서열 특이적변이 : 307 번아르지닌 글리신 단백질활성감소 검은색감소 밝은피부, 머리카락 정상 : 검은피부 네안데르탈인 : 밝은피부 http://www.sciencemag.org/content/318/5855/1453
네안데르탈인과현대인의혼혈 네안데르탈인의유전체서열 현대유럽과아시아인의일부유전자는네안데르탈인 http://images.nationalgeographic.com/wpf/media-live/photos/000/601/cache/neanderthal-genome_60159_600x450.jpg 고인류와현대인류의혼혈 네안데르탈인, 데니소바인등고인류와혼혈 현대인 데니소바인 네안데르탈인 http://www.nature.com/nature/journal/v505/n7481/full/nature12886.html
고인류로부터얻은좋은형질 유라시아의풍토병 ( 기생체 ) 에대한저항성유전자 유럽인의지방대사유전자 : 한대기후적응, 유럽인의비만? 티벳의고산지대적응유전자 : 산소운반효율증대 http://www.dailymail.co.uk/femail/article-1173148/british-women-dont-mind-europes-biggest-french-females-slimmest-worry-weight.html http://www.npr.org/blogs/health/2014/07/02/326947693/thanks-to-extinct-humans-tibetans-adapted-to-high-altitude 유전체정보비교로인간특이적유전자 오리너구리 주머니쥐 개 생쥐 여우원숭이타지어 마모셋 오랑우탄리서스 고릴라침팬지인간
생물정보학자가되려면 생물학, 전산학, 통계학, 데이터베이스, 실험생물학자 : 기본적인생물정보학지식이필수 컴퓨터프로그래밍언어 : C, Python, Perl, Java, 전문인력의수요증대 통계학 수학 생물정보학의 4 개의기둥 알고리듬 프로그래밍 생물학의학데이터베이스텍스트분석웹분석도구 http://www.amberbio.com/