국내인플루엔자유전자데이터베이스 (KISED) 소개 Introduction of the Korea Influenza Sequence and Epitope Database (KISED) Abstract Background: Since 2008, the Korea Centers for Disease Control and Prevention (KCDC) has developed the Influenza Sequence and Epitope Database (ISED) in order to provide analytical platform and management of genetic information about influenza viruses. Thereafter, genetic information related to influenza viruses has been accumulated through improvements in analytical tool services. Particularly, the website s name was changed into the Korea Influenza Sequence and Epitope Database (KISED) and public access to it was allowed. Current status: The two main functions of KISED comprise of sequence search and analysis of influenza virus genomes collected globally. The specific sequence search tool allows sorting and retrieval of influenza virus sequence data through a query from local and international sources. The sequence analysis platform provides basic viral genomic characteristics such as epitope mapping, comparison of antiviral resistance, sequence similarity with selected seasonal vaccine strains, and phylogenetic analysis. Currently, the KISED retains a total of 295,356 Type A and 31,687 Type B influenza virus sequence information. Prospective future: The KISED can be utilized as a useful tool for identifying genetic and/ or antigenic variability of queried genetic information in relation to selected vaccine strains. Moreover, antiviral resistance characteristics at the genetic level of interesting viruses can easily be obtained. The KISED will play a role in enhancing national strategy for rapid pandemic preparedness through continuous refinement of its infrastructure, and for triggering influenza virus research fields not only in Korea, but globally as well. 질병관리본부감염병센터인플루엔자바이러스과 김준섭, 김지경, 이주연, 김기순 * * 교신저자 (tigerkis@nih.go.kr/ 043-719-8190) 들어가는말 인플루엔자바이러스는 Orthomyxoviridae과에속하며 8개의분절된 RNA 가닥으로이루어진바이러스로써, 매트릭스 (Matrix, M) 와핵산단백질의항원성차이를바탕으로인플루엔자 A, B 및 C의 3가지형으로분류된다 [1]. 인플루엔자바이러스는지속적인유전자변이를통해항원진화를하며, 특히특정부위 ( 항원결정, 병원성, 종간전이, 약제내성관련부위등 ) 에서의변이로인해단백질기능변화가초래될경우인플루엔자대유행 (pandemic) 의원인이될수있다. 인플루엔자바이러스의항원변이여부등특성분석은 주로 Hemagglutiniation Inhibition (HI) 과같은혈청학적방법이사용되어왔으나, 최근에는보다신속하게다양한분석방법을적용할수있는바이러스유전정보분석이진행됨에따라대량의유전자정보를효율적으로관리하고공유할수있는유전자서열데이터베이스 (Database, DB) 에대한중요성이더욱부각되고있다. 현재가장대표적인국외인플루엔자바이러스유전자데이터베이스로는미국 National Center for Biotechnology Information (NCBI)[3] 내 Influenza Virus Sequence Database가있으며, 이외에도 Influenza Research Database (IRD) [4], 그리고 Global Initiative on Sharing All Influenza Data www.cdc.go.kr 1025
주간건강과질병 제 8 권제 43 호 (GISAID) [5] 가많이이용되고있다. 인플루엔자바이러스는매년새로운형태의소변이로인한변이주가생성될수있으며, 실제국내외적으로상당한양의유전정보가생산되어백신주선정등에활용되고있다. 국내에서도질병관리본부에서주관하는인플루엔자및호흡기바이러스실험실감시 (Korea Influenza & Respiratory Viruses Surveillance System, KINRESS) 를통해확보되는국내유행주의유전정보에대한효율적인분석및관리를위하여자체인플루엔자바이러스유전자데이터베이스인 KISED(Korea Influenza Sequence & Epitope Database) 를 데이터베이스이다. 특히, KISED에는미국생물정보기관인 NCBI로부터확보된국외인플루엔자바이러스유전자정보이외에도, 국내 KINRESS 참여의료기관과전국 17개보건환경연구원이연계되어확보한국내유행주에대한유전자정보를추가적으로포함하고있다. KISED를통하여이들유전자정보의공유뿐아니라 KISED 내에서제공되는유전자분석도구를이용하여기본적인분석결과확보가가능해짐으로국내인플루엔자바이러스유행특성분석및백신, 치료제개발등관련연구기능활성화에기여할것으로기대된다. 개발하였다. KISED 에는주로국내외계절인플루엔자바이러스 및조류인플루엔자에대한유전자정보가확보되어있는데, 대표적인국외인플루엔자바이러스유전자데이터베이스의주요기능및특징을비교하면 Table 1과같다. KISED는신 변종인플루엔자발생및대유행에대비하여국내외인플루엔자바이러스의유전자정보를국가차원에서체계적으로통합 관리하고사용자에게제공하기위하여개발된 몸말 KISED 개요 질병관리본부는국가차원에서국내유행인플루엔자바이러스의유전자정보를체계적으로관리하고신변종인플루엔자 Table 1. The features of the genetic database for influenza virus Tools KISED NCBI IRD GISAID Log in type Open Open Open Only member Target Nucleotides Proteins Nucleotides Proteins Nucleotides Proteins Nucleotides Proteins Epitope search Yes No Yes No Search 3D structure Yes (web link) Yes Yes No GIS search Yes No Yes No BLAST Yes Yes Yes Yes Target Limited data sources all all all Vaccine relatedness Yes No No No Analysis Epitope No No Yes No Antiviral Yes No No No Phylogenetic Yes Yes Yes Yes Download type Yes (Web) Yes (FTP) Yes (Web) Yes (Web) Alignment tools Yes Yes Yes Yes Deposition off line on line on line on line Abbreviation: KISED=Korea Influenza Sequence & Epitope Databas, NCBI=National Center for Biotechnology Information, IRD=Influenza Research Database, GISAID=Global Initiative on Sharing All Influenza Data, GIS search=geographic Information System, BLAST=Basic Local Alignment Search Tool. 1026 www.cdc.go.kr
바이러스탐색을통한인플루엔자바이러스진단제및백신개발에활용가능한연구인프라를구축하고자 2008 년부터 Influenza Sequence & Epitope Database (ISED) 를개발하였다. 이후대유행인플루엔자 A(H1N1)pdm09 국내분리주의유전자정보, 항바이러스제인 NA억제제 ( 타미플루, 릴렌자등 ) 에대한치료제내성변이주분석정보와 M2 이온통로억제제 ( 아만타딘, 리만타딘 ) 에대한약제내성변이분석기능을추가하였다. 특히, 2011년에는유전자정보검색엔진을강화하고분석도구기능을개선하였으며, 웹사이트명칭을 Korea Influenza Sequence & Epitope Database (KISED) 로변경하였다. 이후, BLAST 서비스및 epitope 데이터베이스를추가하는등사용자들이보다편리하게유전자정보를검색하고기본적인분석이가능하도록기능을강화하여 2015 년 3월새롭게웹시스템을오픈하였다 (Figure 1). KISED의주요기능은크게인플루엔자바이러스유전자검색과유전자서열분석으로구성되어있다. 유전자검색도구는국내외인플루엔자바이러스유전자정보를인플루엔자바이러스형, 아형, 분리주이름으로검색할수있고, 확인된유전자서열을사용자가다운로드받을수있도록서비스를제공한다. 유전자분석기능은유전자서열을기반으로항원결정기분석, 치료제내성분석, 백신주와의서열유사성비교, 유전자변이분석및계통분석등의유전적특성을분석하는서비스로서유전자변이예측및특성분석에활용이가능하다. 유전자정보구성 KISED내유전자정보는질병관리본부에서주관하는인플루엔자감시사업인 KINRESS로부터확보된계절인플루엔자임상분리주에대한유전자정보및국내인플루엔자바이러스연구자에의해생산 / 기탁된것으로구성되어있다. 또한, 미국 NCBI 등으로부터확보한국외인플루엔자바이러스유전자정보도포함하고있다. 유전자서열전처리및 KISED 등록 유전자정보 ( 원데이터 ) 는염기서열확인등전처리과정을거친후유전자분석 ( 약제내성, epitope 정보분석, 백신주와의상동성분석, 염기및단백질서열변이분석, 계통진화 ) 을위하여최종적으로 KISED에등록된다. 현재, KISED에등록된인플루엔자바이러스유전자정보는 A형 295,356 건, B형 31,687건이며이중국내인플루엔자바이러스유전자서열은 A형 3,534 건, B형 925건이다 (Table 2). KISED 주요기능 (1) Search 도구 사용자는인플루엔자바이러스의형, 아형, 유전자종류, 국가, 숙주, 분리주명등다양한검색옵션을선택하여신속용이하게유전자생물정보 ( 염기및아미노산서열 ) 를검색할수있다 (Figure 2). 1) Nucleic acid 인플루엔자바이러스의형, 아형, 국가, 숙주, 유전자종류별로다양한조건에서사용자의유전자염기서열과 KISED내의유전자염기서열을조합하여인플루엔자바이러스의염기서열생물정보를검색할수있다. 2) Vaccine strains 계절인플루엔자바이러스의경우 WHO 권장북반구및 Figure 1. KISED homepage (http://influenza.cdc.go.kr) 남반구권장백신주의유전자정보가등록되어있어사용자가 각절기별백신주유전자서열을검색하고다운로드가가능한 www.cdc.go.kr 1027
주간건강과질병 제 8 권제 43 호 서비스를제공한다. 또한각절기별백신주간의유전자서열변이 (Sequence Variation) 검색과국가별분리주와백신주간의서열상동성 (Sequence Homology) 검색이가능하다. 3) Drug resistance 인플루엔자바이러스유전자수준에서치료제내성은 NA, M2 유전자를대상으로분석할수있다. Drug resistance 검색도구를통해서 NA 억제제인오셀타미비르, 자나미비르에대한내성유무, M2 억제제인아만타딘과리만타딘에대한약제내성유무를확인할수있다. 4) Epitope matching 항원표면의특정부위인항원결정기 (Epitope) 는면역시스템에서 Homology), N-glycosylation, 계통분류 (phylogenetic tree) 분석서비스등을제공한다 (Figure 3). Analysis 도구는제일먼저 MSA(Multiple Sequence Alignment) 수행으로시작하며, MSA 수행후정렬된서열중, 특정분리주삭제, 염기삭제및추가등의편집이가능하다. MSA가완료되면분석결과를일괄적으로제공한다. Sequence Variation 분석결과는염기서열혹은단백질서열의변이를표와염기별색상을이용하여시각화하였으며, 약제내성정보및항원결정기상의변이를분석할수있다. 유전자상동성은입력서열간의서열상동성정보및입력서열과백신주간의상동성을확인할수있다. N-glycosylation 분석결과는 N-glycosylation 부위로 중요한기능을담당한다. KISED 에서는특정분리주의유전자 상의 T-cell, B-cell epitope 의 domain 과해당단백질의 3D 구조정보를제공한다. 5) Flu BLAST NCBI에서제공하는 BLAST 도구를 KISED에적용하여사용자가입력한서열과 KISED내의모든서열간의유사성을검색할수있다. (2) Analysis 도구 Analysis 도구는 1 개이상의사용자입력서열의유전적 변이 (Sequence Variation), 유전자상동성 (Sequence Figure 2. Search Tools in the KISED. Users can combine various options, such as virus type, nation, host, RNA segment, subtype, and collection year. Search tools consists of nucleic acid, vaccine strains, drug resistance, epitope matching, and Flu-BLAST. Table 2. Number of influenza virus sequences in KISED Segment Host Subtype PB2 PB1 PA HA NP NA MP NS Total Human A 12,126 18,813 8,523 37,842 12,732 26,124 37,458 25,459 179,077 B 1,985 1,980 1,983 7,949 2,003 5,684 3,991 6,112 31,687 Avian A 8,034 13,452 7,959 12,949 7,957 9,785 16,323 15,714 92,173 Swine A 1,845 2,913 1,843 5,423 1,886 3,199 4,377 2,620 24,106 1028 www.cdc.go.kr
지속적으로축적하고인플루엔자연구에활용될수있는 분석도구추가등을통하여서비스를더욱확대해나갈 계획이다. 참고문헌 1. Cox NJ and Subbarao K. 2000. Global epidemiology of influenza: past and present. Ann. Rev. Med., 51, 407-421. 2. Yang IS1, et. al., 2009. Influenza sequence and epitope Figure 3. Analysis Tools in the KISED. Users can access the data through search options and the results can be subjected to further analysis, such as multiple sequence alignment. KISED allows access to sequence analysis tools by clicking Analysis option. database. Nucleic Acids Res., Jan;37(Database issue):d423-430. doi: 10.1093/nar/gkn881. Epub 2008 Nov 9. 3. NCBI Influenza Resource Database. http://www.ncbi.nlm.nih. gov/genomes/flu/flu.html 4. NIAID. http://www.niaid.nih.gov 예측되는패턴을보여준다. 마지막으로 Phylogenetic Tree 분석결과는입력서열간의계통분석을수행하여염기나단백질 5. IRD. http://www.fludb.org 6. GISAID. http://platform.gisaid.org 잔기간의분자적진화정도를시각화된이미지형식으로 제공한다. 맺는말 KISED는국내인플루엔자바이러스유행주및국외인플루엔자바이러스유전자데이터베이스에서공개된유전자정보를확보하여이를체계적으로관리하고, 유전자정보검색과유전자변이성, 표면항원성, 약제내성, 백신주와의상동성, 계통분석등의유전적분석용도구를제공하는웹기반 DB 시스템이다. KISED를활용하여사용자는유전자정보검색및다운로드를통하여국내외인플루엔자바이러스유전정보를공유할수있으며기본적인유전자서열분석도가능하다. 향후, KISED는국내 외분리인플루엔자바이러스의진화적, 유전적상관관계연구, 백신주선정및치료제효과연구, 인체위해도예측등의연구를위한기초분석기능지원및신변종인플루엔자의대유행을대비한국가차원의컨소시엄뱅크가될수있도록국내외정보를 www.cdc.go.kr 1029