SUR - BIO - 005, APRIL 2009 1 REVIEW ON VisGenome Single and Comparative Genome Browser 정우근 Chung Woo-Keun 부산대학교컴퓨터공학과 wkchung@pusan.ac.kr ABSTRACT 본보고서에서는 VisGenome : visualization of single and comparative genome representations 이에대하여논의한다. VisGenome 은 Rat, Mouse, Human 의 Chromosome 에대하여 LOD(Level of Detail) Visualization 이가능하다. VisGenome 은크게 Single 또는 Comparative 한 Visualization 이가능하다. VisGenome 은 Ensembl 과연동되어 Single Chromosome 에대한정보를제공하고, 서로다른 Species 간에 Chromosome 에대한 homologies 가가능하다. 또한 VisGenome 은 Ensembl[1] 에서제공되는 Query System 을 Link System 을통하여제공하고있다. 본보고서에서는 VisGenome 의사용방법과 VisGenome 에제공되는정보에대하여알아본다. KEYWORDS Genome Browser, Comparative 1 Introduction 본단락에서는 VisGenome의설치및사용법을배우기에앞서 VisGenome에대하여간략하게대하여알아보도록하자. 본보고서에서논의할 VisGenome은 Glasgow대학에서 BHF Blood Pressure Group와심장혈관병에걸린쥐의모델과비교하기위하여제작되었다. VisGenome은 rat, human의 QTLs에대한자료를병에걸린 gene을위하여앞서말한 genomic데이타에대한 LOD(Level of detail) 시각화, 비교분석을서비스로제공하고있다. 또한, 3가지종 human, rat그리고 mouse에대하여 QTLs에대한분석을제공하고있으며, 또한앞서말한 3가지종에대하여 genotyping, micro array그리고 proteomics대한서비스도제공하고있다. VisGenome은한화면에두종간의 QTLs를실험데이터와함께비교분석및데이터시각화를제공하고있다. 또한단일 Chromosome에대하여임의의 LOD까지의줌옵션을제공하고있다. VisGenome은 EnSembl 와연동하여 Ensembl에서제공되는데이터와뷰를함께사용할수있다. 본단락에서는설치및사용법에앞서 VisGenome이사용자에게무엇을제공하는대하여간단하게알아보았다. 다음단락에서는 VisGenome의설치및사용법에대하여알아보겠다. 2 Installation 본단락에서는 VisGenome의설치및시작방법에대하여알아보도록하겠다. VisGenome의버젼은두가지의버젼이존재한다. Web Start버젼과다운받아서할수있는 File버젼이있다. VisGenome은 Java로이루어진 Browser로써 Component기반의프로그램으로써 WEB또는사용자의컴퓨터환경을고려하지않고서도수행할수있는환경을제공하고있다. ( 주소 : http://www.dcs.gla.ac.uk/ asia/visgenome ) 2.1 Web Start VisGenome 웹버젼의시작방법이다. 웹에서의 VisGenome 의시작방법은윗단락에서의 Link 를따라가서 WEB Start 버튼클릭만으로실행이가능하다.
SUR - BIO - 005, APRIL 2009 2 2.2 Installation 파일버젼의 VisGenome 시작방법이다. 사용자는 http://www.dcs.gla.ac.uk/ asia/visgenome 또는 http://www.dcs.gla.ac.uk/ asia/visgenome/index files/jars 에서 3 가지의파일을찾을수가있다. VisGenome DatabaseVersion 1 5 OneJar.jar, VisGenome FileVersion 1 5.jar and data.zip. 이 3 가지파일은위의두가지버젼 WEB, File버젼과관련이있다. Ensembl와접속하여사용하고, DataBase를이용하는 VisGenome FileVersion 1 5.jar버젼을추천한다. 또는더빠른환경을제공하는 FileVersion 사용하여도좋다. 하지만 FileVersion은 Ensembl v.42에서 Data를다운받아야한다. 만약사용자가 FileVersion를사용한다면, FileVersion에필요한 data.zip파일은 VisGenome과같은디렉토리상에위치해야한다. 물론압축을해지하지않아도된다. 그림 1. VisGenome 의시작메뉴, Single 또는 Comparative 뷰어를제공하고있다. 만약 VisGenome DataBaseVersion1 5 OneJar.zip(VisGenome FileVersion 1 5.zip) 을저장하였다면, Command 창에서다음과같이실행을해주기바란다. copy VisGenome DataBaseVersion 1 5 OneJar.zip VisGenome DataBaseVersion 1 5 OneJar.zip. 2.3 Application Startup VisGenome 의시작방법이다. VisGenome DataBaseVersion1 5 OneJar.zip(VisGenome FileVersion 1 5.jar) 클릭하거나또는 VisGenome DataBaseVersion1 5 OneJar.zip(VisGenome FileVersion 1 5.zip) 가저장된경로에서다음과같은명령어를 Command창에서실행을해주기바란다. 1. java -jar VisGenome Database Version 1 5 OneJar.jar 2. java -jar -Xms256m -Xmx256m VisGenome DatabaseVersion 1 5 Onejar.jar 파일버젼일경우다음과같이하면된다. 1. java -jar VisGenome Database Version 1 5 OneJar.jar 2. java -jar -Xms256m -Xmx256m VisGenome FileVersion 1 5 Onejar.jar -Xms256m -Xmx256m 은사용자의컴퓨터환경에따라서달리하여주면된다. VisGenome 은사용자의선택에따라 Single 또는 Comparative 뷰어를제공하고있다. 그림참조 1. 이 Single 또는 Comparative 뷰어는 Ensembl 과연동되어실행이도기떄문에시간이다소걸린다.
SUR - BIO - 005, APRIL 2009 3 그림 2. VisGenome 의두가지 Option Single 또는 Comparaive 중에서 Single 옵션을선택시 화면을보여주고있다. 3 Single Representation 본단락에서는 VisGenome의 Single뷰어에대한사용법을알리고자한다. 그림 2에서보는것과같이 Single Option사항을선택할경우초기화면을보여주고있다. Single뷰어는그림 2에서보이는 Chromosome의선택으로해당 Chromosome에대한시각화를제공한다. 그러면 VisGenome은선택한 Chromosome에대한세밀한정보를제공한다. VisGenome은사용자의컴퓨터의환경에따라서많은 Choromsome을선택할수있도록제공하고있다. 그림 4는선택한 Chromosome들에대한정보를 Tab단위로구분지어놓고있다. 현재 4 는하나의 Chromosome의선택된사항이다. 다수의 Chromosome선택시선택된 Chromosome의갯수만큼 Tab이생성될것이다. 그림 4에서보이는것처럼그림 3에서선택한 Chromosome에대한세부사항을보여주고있다. ( chromosome with bands, Affy Probe Sets, Genes, Markers그리고 QTLs ) 그림3에서보이는 Start, End Position에좌표를기입하면해당좌표에대한영역이빨간박스로표기되며해당 Chromosome에대한세부사항을역시보여주게된다. 그림4의 A에해당한다. VisGenome 은그림4 보이는 Toggle 버튼을이용하여 Affymetrix Probe Sets 그리고 Markers 에대한 Labelling 서비스를제공하고있다. VisGenome은두가지의 Labelling모드를제공하고있다. 모든 Object에대한 Labelling또는최상위 object에대한 Labelling서비스를제공하고있다. Toggle버튼에대한 Labelling서비스는 microarray probes와 marker의실험값에대한가장적합한데이터를제공하고있다. 사용자가 Affy Probe Sets또는 Markers에마우스이벤트도제공하고있다. Toggle을활성화시켰을경우 Object에마우스를가져갔을경우해당 Object에해당하는 Label이하이라이트되는것을알수있다.
SUR - BIO - 005, APRIL 2009 4 그림 3. VisGenome 의 Single 뷰어이다. A 에해당하는빨간색의영역안에속하는정보를 B 에 서보여주고있다. 그림 4. 패널은 3가지의파트로구분된다. Region Range는사용자가 Start, End Position으로기입한정보에대한 Chromosome의영역을보여준다. Labelling서비스는 Object에대한 Label을제공하고있다. Information은 Single뷰어에서 Gene란에대한 Mouse Event를제공한다. 4 Comparative Representation 본단락에서는 VisGenome의 Comparative뷰어에대한사용법을알리고자한다. Comparative옵션은서로다른종족에서 2개의 Chromosome의선택으로시작된다. Single뷰어와마찬가지로사용자가원하는만큼의 Chromosome 이선택이가능하다. 그림 6과같이 Comparative뷰는선택한 Comparative한옵션마다 2가지의탭서비스를제공한다. 그림 6
SUR - BIO - 005, APRIL 2009 5 그림 5. VisGenome 의 Comparative Option 이다. B 는두개의 Chromosome 에대하여서로 상동하는영역을보여주고있다. 각각의 Chromosome 의영역은 A 이다. 에서와같이 Display Option 을통하여 Chromosome 에대한설정값을변경할수있다. 또한 Gene 에대한옵 션은그림 7 와같이설정이가능하다. 5 Zooming, Panning and Access to Ensembl Pages 본단락에서는 VisGenome 의 Zoom, Panning 그리고 Ensembl 과의연동방법에대하여설명한다. 5.1 Zooming VisGenome에서제공하는 Zoom옵션은마우스우클릭으로조작할수있다. genes또는 object에대하여조작이가능하다. 우클릭을클릭한상태로마우스를우측으로움직일경우확대가가능하며, 좌측으로마우스를움직일경우축소가가능하다. Zoom option은 8에서좌측과같이많은데이터를우측과같이확대하여유용하게사용이가능하다. 5.2 Panning VisGenome은패닝기능도제공한다. 마우스좌측클릭을유지한후패널을위, 아래로이동할수있는옵션을제공하고있다. Comparative옵션일경우양측에있는 Chromosome을제외하고, 안의중요정보들을서로다른방향으로도변경할수있다.
SUR - BIO - 005, APRIL 2009 6 그림 6. Comparative Option 사항이다. Chromosome 에대한영역설정이가능하다. 그림 7. Comparative Option 에서의 Further Info 는 homologous gene 을보여주고있다. Comparative Option에서사용자가선택한두종족의 Chromosome이서로상등하는관계라면 Gene Partner Information, Information란에정보가표시된다. 서로상등하지않다면 Information란에만정보가기입되어있을것이다. 지금은서로상등하지않는상태를보여주고있다. 5.3 Invocation of Ensembl web pages VisGenome 은 Ensembl 에서의 Query 를가능하게해주는기능도지원하고있다. 그림 9 에서보이는것처럼 좀더다양한정보를원하는 Gene 을클릭하면 VisGenome 이 Ensembl 에자동으로 Query 를전송하여결과를 웹브라우저창으로보여준다. 이기능은 Single, Comparative 한모든옵션에서지원한다.
SUR - BIO - 005, APRIL 2009 7 그림 8. VisGenome Zooming option 이다. 좌측은확대전사진이며, 우측은확대후사진이다. 5.4 The red square VisGenome은 Single그리고 Comparative옵션에서는그림 3, 그림5에서보이는 A와같은 ( 빨간박스 )Red Square를지원한다. 앞서말한바가있는빨간박스는사용자가관심있어하는곳에위치하면그부분의세부사항을보여주는것이다. 사용자는빨간박스의위치, 또는크기를조정할수가있다. 그림 3에보이는 B값은오로지빨간박스에위치한곳의세부사항을보여주는것이다. 그림 9. 관심있는 Gene 을클릭할경우, Ensembl 에 Query 를전송하여그결과를알려준다. 5.5 Labelling 그림 4 에있는 Toggle 버튼은 Single 옵션에서만실행할수가있으며, Toggle 버튼이활성화되면 Affy Probe Sets 그리고 Markers 에대한정보를표시해준다. Toggle 활성화한것은그림 10 에좌측에해당하며, Toggle
SUR - BIO - 005, APRIL 2009 8 버튼을활설화하지않은것은그림 10 의우측에해당된다. 또한 Toggle 활성화된상태에서는마우스이벤트도 동작한다. Toggle 이활성화된상태에서 Affy Probe Sets 또는 Markers 에 Object 에마우스를위치하면해당하 는곳의 Label 이하이라이트되는것을알수가있다. 그림 10. 본그림은두가지의그림으로이루어져있다. 두가지의그림모두같은영역에대한정보를보여주고있다. 왼쪽의그림은 Label옵션에대하여활성화가된것을보여주고있으며, 반대쪽오른쪽의그림은 Label옵션에대하여비활성화가되어있다. 왼쪽에있는그림은각 Label에대하여해당요소들에대하여활성화되어있다. 요소들에대하여마우스이벤트도제공하고있다. 사용자가원하는요소를마우스오버이벤트를발생시킬경우, 해당요소와 Label에대하여하이라이트를제공한다. 6 Conclusion 본단락에서는 VisGenome 의설치및사용법을이전에 VisGenome 에대하여간략하게대하여알아보았다. 본보고서에서논의한 VisGenome 은 Glasgow 대학에서 BHF Blood Pressure Group 와심장혈관병에걸린쥐의모델과비교하기위하여제작되었었다.. VisGenome 은 genomic 데이타에대한 LOD(Level of detail) 분석이가능하도록서비스를제공하고있었다. 또한 rat, human 의 QTLs 에대한자료를병에걸린 gene 을위하여상세히제공하고있다. QTLs 에대한분석은 3 가지종, human, rat 그리고 mouse 에대하여제공하고있으며, genotyping, micro array 그리고 proteomics 대한서비스도제공하고있다. VisGenome 은한화면에두종간의 QTLs 를실험데이터와함께제공하고있다. 또한단일 Chromosome 에대하여임의의 LOD 까지의줌옵션을제공하고있다. VisGenome 은 EnSembl 와연동하여 Ensembl 에서제공되는데이터와뷰를함께사용할수있었다. VisGenome 은사용자에게다소편리한 UI 를제공하고, 비교분석을위한툴을상세히제공하였다. 또한 Ensembl 에서의 Query 도지원하고있었다. 하지만 Web Start 및 File, Database 버젼에서 Chromosome 이나초기설정에서많은시간을초래하는결과를나타냈었다. 이유인즉, Chromosome 이나여타데이타들을 Ensembl 에서가져오기때문이다. 그리하여하나의해결책으로 Ensembl 에서의데이타를다운받아사용자의컴퓨터에저장하도록추천하였나, 이역시그리원활한환경을제공하지는못하였다. 하지만 VisGenome 은다른두종족간의 Chromosome 비교나정보를출력하는면에있어나뛰어난성능을보여었다. 참고문헌 1. T. J. Hubbard, B. L. Aken, K. Beal, B. Ballester, M. Caccamo, Y. Chen, L. Clarke, G. Coates, F. Cunningham, T. Cutts, T. Down, S. C. Dyer, S. Fitzgerald, J. Fernandez-Banet, S. Graf, S. Haider, M. Hammond, J. Herrero, R. Holland, K. Howe, K. Howe, N. Johnson, A. Kahari, D. Keefe, F. Kokocinski, E. Kulesha, D. Lawson, I. Longden, C. Melsopp, K. Megy, P. Meidl, B. Ouverdin, A. Parker, A. Prlic, S. Rice, D. Rios, M. Schuster, I. Sealy, J. Severin, G. Slater, D. Smedley, G. Spudich, S. Trevanion, A. Vilella, J. Vogel, S. White, M. Wood, T. Cox, V. Curwen,
SUR - BIO - 005, APRIL 2009 9 R. Durbin, X. M. Fernandez-Suarez, P. Flicek, A. Kasprzyk, G. Proctor, S. Searle, J. Smith, A. Ureta-Vidal, and E. Birney, Ensembl 2007., Nucleic acids res 35 (2007). 2. Joanna Jakubowska, Ela Hunt, Matthew Chalmers, Martin McBride, and Anna F. Dominiczak, VisGenome: visualization of single and comparative genome representations, Bioinformatics 23 (2007), 2641 2642. 3. Kim Rutherford, Julian Parkhill, James Crook, Terry Horsnell, Peter Rice, Marie-Adele Rajandream, and Bart Barrell, Artemis: sequence visualization and annotation, Bioinformatics 16 (2000), 944 945.