DBPIA-NURIMEDIA

Similar documents
지능정보연구제 16 권제 1 호 2010 년 3 월 (pp.71~92),.,.,., Support Vector Machines,,., KOSPI200.,. * 지능정보연구제 16 권제 1 호 2010 년 3 월

Can032.hwp

04( ) CPLV14-28.hwp

DBPIA-NURIMEDIA

김경재 안현철 지능정보연구제 17 권제 4 호 2011 년 12 월

04 Çмú_±â¼ú±â»ç

02-³í´Ü1

Jkbcs016(92-97).hwp

DBPIA-NURIMEDIA


<313120C0AFC0FCC0DA5FBECBB0EDB8AEC1F2C0BB5FC0CCBFEBC7D15FB1E8C0BAC5C25FBCF6C1A42E687770>

Journal of Educational Innovation Research 2018, Vol. 28, No. 3, pp DOI: NCS : * A Study on

Microsoft PowerPoint - 26.pptx


WHO 의새로운국제장애분류 (ICF) 에대한이해와기능적장애개념의필요성 ( 황수경 ) ꌙ 127 노동정책연구 제 4 권제 2 호 pp.127~148 c 한국노동연구원 WHO 의새로운국제장애분류 (ICF) 에대한이해와기능적장애개념의필요성황수경 *, (disabi

Microsoft PowerPoint Relations.pptx

12È«±â¼±¿Ü339~370

DBPIA-NURIMEDIA

°í¼®ÁÖ Ãâ·Â

Crt114( ).hwp

2017 년 6 월한국소프트웨어감정평가학회논문지제 13 권제 1 호 Abstract

化學科


<4D F736F F D20B1E2C8B9BDC3B8AEC1EE2DC0E5C7F5>

07_À±ÀåÇõ¿Ü_0317

이도경, 최덕재 Dokyeong Lee, Deokjai Choi 1. 서론

04김호걸(39~50)ok

Microsoft PowerPoint - 김미영

Probabilistic graphical models: Assignment 3 Seung-Hoon Na June 7, Gibbs sampler for Beta-Binomial Binomial및 beta분포는 다음과 같이 정의된다. k Bin(n, θ):

ePapyrus PDF Document

Sequences with Low Correlation

High Resolution Disparity Map Generation Using TOF Depth Camera In this paper, we propose a high-resolution disparity map generation method using a lo

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


09È«¼®¿µ 5~152s

<4D F736F F F696E74202D20B1E8BCB120B1B3BCF6B4D420B0ADBFACC0DAB7E1>

exp

05( ) CPLV12-04.hwp

Microsoft PowerPoint Predicates and Quantifiers.ppt

저작자표시 - 비영리 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 이차적저작물을작성할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물

Jkbcs032.hwp

03-ÀÌÁ¦Çö

Journal of Educational Innovation Research 2019, Vol. 29, No. 1, pp DOI: (LiD) - - * Way to

Microsoft PowerPoint - 27.pptx

핵 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (14) 27 (29) 2

DBPIA-NURIMEDIA

대한한의학원전학회지24권6호-전체최종.hwp

(2005) ,,.,..,,..,.,,,,,

Pharmacotherapeutics Application of New Pathogenesis on the Drug Treatment of Diabetes Young Seol Kim, M.D. Department of Endocrinology Kyung Hee Univ

2 : (Juhyeok Mun et al.: Visual Object Tracking by Using Multiple Random Walkers) (Special Paper) 21 6, (JBE Vol. 21, No. 6, November 2016) ht

Lecture12_Bayesian_Decision_Thoery


À±½Â¿í Ãâ·Â

차 례... 박영목 **.,... * **.,., ,,,.,,

DBPIA-NURIMEDIA

Artificial Intelligence: Assignment 6 Seung-Hoon Na December 15, Sarsa와 Q-learning Windy Gridworld Windy Gridworld의 원문은 다음 Sutton 교재의 연습문제

1030 ¿©¼º»ý¸í12³â»ç ¼öÁ¤

11장 포인터

단순 베이즈 분류기

03( ) CPLV11-74.hwp

바이오헬스산업_동향(140324).hwp

연구분야 ( 코드 ) 과제번호 과제성격 ( 기초, 응용, 개발 ) 응용실용화대상여부비실용화 연구과제명 과제책임자 세부과제 지원목적과제프로그램공개가능여부공개 ( 공개, 비공개 ) ( 국문 ) 전장유전체유전자다형데이터를이용한표적유전자의발굴 ( 영문 ) Ide


Journal of Educational Innovation Research 2017, Vol. 27, No. 3, pp DOI: (NCS) Method of Con

에너지경제연구 Korean Energy Economic Review Volume 17, Number 2, September 2018 : pp. 1~29 정책 용도별특성을고려한도시가스수요함수의 추정 :, ARDL,,, C4, Q4-1 -

JVM 메모리구조

통계연구 (2010), 제 15 권제 2 호, 한국의일상생활에서남녀의수면시간과관련요인탐색 은기수 1) 차승은 2) 요약 수면은생물학적현상으로하루 24시간의일상생활중단위활동으로는가장많은시간을차지하는활동가운데하나이다. 그러나현대사회가 24/7 사회로진전되고개인

석사논문.PDF

PowerPoint 프레젠테이션


저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할

80 경찰학연구제 13 권제 2 호 ( 통권제 34 호 ) Ⅱ. 이론적논의와선행연구검토


example code are examined in this stage The low pressure pressurizer reactor trip module of the Plant Protection System was programmed as subject for

09( ) CPLV16-04.hwp

ÀÇÇа�ÁÂc00Ì»óÀÏ˘

DBPIA-NURIMEDIA

DBPIA-NURIMEDIA


C# Programming Guide - Types

정보기술응용학회 발표

½Éº´È¿ Ãâ·Â

R을 이용한 텍스트 감정분석

2013여름시론(3-5)

<33312D312D313220C0CCC7D1C1F820BFB0C3A2BCB12E687770>

???? 1

슬라이드 1

PowerPoint 프레젠테이션

(001~006)개념RPM3-2(부속)

Journal of Educational Innovation Research 2018, Vol. 28, No. 1, pp DOI: * A Analysis of


제1강 인공지능 개념과 역사

adfasdfasfdasfasfadf

Microsoft PowerPoint - e pptx

저작자표시 - 비영리 - 변경금지 2.0 대한민국 이용자는아래의조건을따르는경우에한하여자유롭게 이저작물을복제, 배포, 전송, 전시, 공연및방송할수있습니다. 다음과같은조건을따라야합니다 : 저작자표시. 귀하는원저작자를표시하여야합니다. 비영리. 귀하는이저작물을영리목적으로이용할


<4D F736F F D20C3D6BDC C0CCBDB4202D20BAB9BBE7BABB>

핵 심 교 양 1 학년 2 학년 3 학년합계 문학과예술 역사와철학 사회와이념 선택 교양학점계 학년 2 학년 3 학년합계비고 14 (15) 13 (

I

Transcription:

980 정보과학회논문지 : 컴퓨팅의실제및레터제 16 권제 10 호 (2010.10) 진화연산기반계층적하이퍼네트워크모델에의한암특이적 microrna-mrna 상호작용탐색 (Exploring Cancer-Specific microrna-mrna Interactions by Evolutionary Layered Hypernetwork Models) 김수진 하정우 (Soo-Jin Kim) (Jung-Woo Ha) 장병탁 (Byoung-Tak Zhang) 요약 microrna (mirna) 와 mrna 조절상호작용탐색은다양한생물학적현상에있어새로운시야를제공해줄수있다. 최근생물학적프로세스에서 mirna 는유전자발현을제어하고세포를기능적으로조절하는중요한역할을하는요소로밝혀졌다. 이에복잡한생물학시스템에서 mirna 의기능적활동을이해하기위해서는 mirna 와 mrna 간상호작용분석은필수적이다. 그러나아직까지복잡한 mirna 와 mrna 간상호작용관계를추론하는 이논문은지식경제부한국산업기술평가관리원 (KI002138, 10035348), 교육과학기술부한국연구재단 (No. 2010-0017734, No. 2010-0018950), 질병관리본부학술연구용역사업 (2009-S6-B-001), BK21-IT 사업및컴퓨터연구소 (ICT) 에의해지원되었음 이논문은 2010 한국컴퓨터종합학술대회에서 진화연산기반계층적하이퍼네트워크모델에의한암특이적 microrna-mrna 상호작용탐색 의제목으로발표된논문을확장한것임 학생회원 : 서울대학교생물정보학협동과정 sjkim@bi.snu.ac.kr 학생회원 : 서울대학교컴퓨터공학부 jwha@bi.snu.ac.kr 종신회원 : 서울대학교컴퓨터공학부교수 btzhang@bi.snu.ac.kr 논문접수 : 2010년 8월 9일심사완료 : 2010년 8월 25일 CopyrightC2010 한국정보과학회ː개인목적이나교육목적인경우, 이저작물의전체또는일부에대한복사본혹은디지털사본의제작을허가합니다. 이때, 사본은상업적수단으로사용할수없으며첫페이지에본문구와출처를반드시명시해야합니다. 이외의목적으로복제, 배포, 출판, 전송등모든유형의사용행위를하는경우에대하여는사전에허가를얻고비용을지불해야합니다. 정보과학회논문지 : 컴퓨팅의실제및레터제16권제10호 (2010.10) 것은어려운문제이기때문에많은연구자들이실험적, 전산학적접근방법을제안하며활발한연구를진행하고있다. 본논문에서는이종의발현데이터로부터기능적으로상호작용하는 mirna-mrna 조합을탐색하기위한진화연산기반의새로운하이퍼네트워크모델을제안한다. 이에실험결과로제안하는방법을인간암관련 mirna 와 mrna 발현데이터에적용하여암특이적 mirna-mrna 상호작용집합을탐색하고발견한 mirna-mrna 상호작용관계가생물학적으로유의함을제시한다. 키워드 : 기계학습, 진화연산, 생물정보학, mirna-mrna 상호작용 Abstract Exploring microrna (mirna) and mrna regulatory interactions may give new insights into diverse biological phenomena. Recently, mirnas have been discovered as important regulators that play a major role in various cellular processes. Therefore, it is essential to identify functional interactions between mirnas and mrnas for understanding the context- dependent activities of mirnas in complex biological systems. While elucidating complex mirna-mrna interactions has been studied with experimental and computational approaches, it is still difficult to infer mirna-mrna regulatory modules. Here we present a novel method, termed layered hypernetworks (LHNs), for identifying functional mirnamrna interactions from heterogeneous expression data. In experiments, we apply the LHN model to mirna and mrna expression profiles on multiple cancers. The proposed method identifies cancer-specific mirna-mrna interactions. We show the biological significance of the discovered mirna- mrna interactions. Key words :Machine Learning, Evolutionary Learning, Bioinformatics, mirna-mrna Interactions 1. 서론 최근 micrornas(mirnas) 는세포분화, 증식, 성장, 사멸등다양한세포적프로세스에있어주요역할을하는중요한조절자로밝혀졌다. 특히여러유형의종양에수반하여주요유전자의발현을제어하고세포를기능적으로조절함으로써암의발생과진행을유도하는데있어결정적인역할을한다고많은연구를통해보고되고있다. 따라서암발생메커니즘을포함한복잡한생물학시스템에서 mirna의기능과활동기전을이해하기위해서는 mirna와 mrna간기능적상호작용을찾아내는것은필수적이라할수있다. 그러나 mirna와 mrna간정확한조절메커니즘을설명하는데아직많은어려움이존재한다. 이분야에있어이전연구들은주로유전체수준에서 mirna와목표유전자의예측에초점을맞추어많은전산학적방법들이제안되었다. 다

진화연산기반계층적하이퍼네트워크모델에의한암특이적 microrna-mrna 상호작용탐색 981 양한생물학적프로세스에서는유전자조절네트워크의중요한구성요소로서 mirna와 mrna는상호작용적으로함께작용한다. 즉 mirna와 mrna 상호작용탐색은다른생리학적조건에서 mirna와 mrna의조합적효과를찾아내는데필수적인첫단계라할수있다. 이런쟁점에초점을맞추어 Yoon and DeMicheli은 weighted bipartite graph 모델을이용하여유전자조절에수반되는 mirna와목표유전자의그룹을찾는전산학적방법을제안하였다 [1]. 그러나오직서열정보만을기반으로예측하기때문에복잡한 mirna-mrna 조절집합을결정짓기에는충분하지않다. Huang et al. 은 mirna-mrna 상호작용을탐색하기위해베이지안네트워크매개변수학습을응용한확률적프레임워크를제안하였다 [2]. 또한 Joung et al. 은공진화적학습전략에기반한바이클러스터링기법을사용하여 mirnamrna 모듈을발견하였다 [3]. 이두방법은 mirnamrna 조합을찾기위해여러정보를통합하여모델을구축하였지만 mirna와 mrna 상호작용의다양성과복잡성때문에여전히기능적인 mirna-mrna 집합을추론하는것은어려운문제로남아있다. 본연구에서우리는암관련발현데이터로부터암특이적 mirna-mrna 상호작용조합을탐색하기위한새로운방법을제안한다 [4]. 제안하는방법은새롭게수정된하이퍼네트워크모델로계층적하이퍼네트워크 (layered hypernetworks: LHNs) 라고한다. 제안하는모델은기존하이퍼네트워크에서진보된모델로학습과정에진화연산이내포되어있는계층적구조를가지고있다. 한개체이상으로구성된데이터가주어졌을때계층적하이퍼네트워크는두개의층으로구성된다. 하부층의하이퍼네트워크는데이터의각개체특성을반영하여구축되고, 상부층의하이퍼네트워크는하부층하이퍼네트워크의학습결과로부터샘플링에의해주어진개체간의관계를분석한다. 이런특성은 mirna와 mrna 상호작용집합발견과같은복잡하고이종적인문제를분석하는데유용하다. 계층적하이퍼네트워크프레임워크에서거대한검색공간에서최적의고차원조합집합을찾기위해서학습과정은진화연산에의해수행된다. 본논문에서는제안한계층적하이퍼네트워크모델을인간암관련 mirna와 mrna 발현데이터 [5,6] 에적용하여높은분류정확도로암특이적 mirna-mrna 상호작용집합을탐색한다. 이에실험결과로본제안하는모델은지지벡터머신 (support vector machines) 에경쟁력있는성능을보이고, 결정트리 (decision trees), 베이지안네트워크 (Bayesian networks), 나이브베이즈 (naïve Bayes), 랜덤포레스트 (random forests) 에비해서는우월한분류성능을보여주었다. 또한발견된 mirna-mrna 조합들은암에서기능적으로상호작용하는집합으로문헌검색등으로생물학적유의성을검증하였다. 2. 하이퍼네트워크모델 하이퍼네트워크는다수인자들간의고차원연관관계를학습할수있는확률적그래프모델이다 [7]. 이는기존의일반그래프와는달리 2개이상의정점을동시에연결가능한하이퍼에지 (hyperedge) 로모델로서하이퍼네트워크에서정점은데이터를구성하는인자 (attribute) 를의미하며하이퍼에지는가중치가할당된인자들간의고차원적조합을의미한다. 수식적으로하이퍼네트워크 H 는 H = (V, E, W) 로각각 V, E, W 는정점, 하이퍼에지, 가중치들의집합으로정의된다. k-차수 (cardinality) 의하이퍼에지를 k-하이퍼에지라하며모든하이퍼에지가 k-차수하이퍼에지들로만구성된하이퍼네트워크를 k-하이퍼네트워크라한다. 하이퍼네트워크는이론적으로데이터 를저장하기위한확률적메모리모델로간주될수있기때문에 k-하이퍼네트워크의에너지는다음과같은식으로정의될수있다. E ( n) ( k) ( n) i i= 1 ε (x ; W) = w I(x, Ei), (1) 위의식에서 는 i번째 k-차수하이퍼에지 E i 의가중치이고, x (n) 는하이퍼네트워크에저장된 n번째데이터패턴이며, I(x (n), E i) 는하이퍼에지 E i 에서 x (n) 의요소조합을나타낸다. 이때, 하이퍼네트워크로부터데이터가생성될확률은 Gibbs 분포가정하에다음과같이주어진다. exp (2) Z(W) 는부분함수로 Z(W) 는아래와같은식으로정의된다. exp (3) 즉, 하이퍼네트워크는학습을통해랜덤변수조합의확률분포를추정하는모델이며. 모델학습은진화기법을기반으로한구조학습과파라미터학습에의해진행된다. 3. 계층적하이퍼네트워크모델 계층적하이퍼네트워크모델은기존하이퍼네트워크를발전시킨모델로두개의층으로구성된계층적구조의하이퍼네트워크모델이다. 하부층은하나이상의모달리티로구성되어있는데이터의특성을반영하는

982 정보과학회논문지 : 컴퓨팅의실제및레터제 16 권제 10 호 (2010.10) 모달리티의존적인하이퍼네트워크로구축되고, 상부층은각모달리티특성을반영하고있는하부층의하이퍼네트워크결과로부터모달리티간의관계를분석하고통합한다. 기존의하이퍼네트워크모델과마찬가지로수식적으로상부층의하이퍼네트워크는파라미터로가중치벡터가주어질때에너지함수가정의된다. 이에두개의모달리티를가지고있는주어진데이터셋이 D일 때, ( n) N 1 2 ( n) N D {x } n= 1 {(, ) } n= 1 = = m m, 하부층의 k- 하이퍼 네트워크로부터생성된상부층의하이퍼네트워크에너 ( ) 지함수 ε (x n ; W ) 는다음과같이정의된다. m m (4) m 1 과 m 2 은데이터샘플 x를구성하고있는각모달리티변수의벡터이다. 식 (2) 와같이두모달리티의 n 번째데이터생성의확률 P(x (n) W ) 는아래와같다. ( n) 1 1 2 ( n) Px ( W) = exp ε {(, ) ; W} ZW ( ) m m (5) 4. 계층적하이퍼네트워크의진화적학습알고리즘 4.1 하부층진화적하이퍼네트워크의학습하부층에서의하이퍼네트워크는데이터를구성하는모달리티각각의인자들의조합공간을확률적으로표현함으로학습은매우넓은문제공간을검색하는과정이라할수있다. 이를현실적으로가능하게하기위해랜덤샘플링기반의진화적학습방법을이용하여하이퍼에지의적합도, 즉하이퍼에지의가중치를학습한다. 이는예제데이터셋에서하이퍼에지를구성하는인자값을비교하여정확하게예측된예제의개수와정확하게예측되지않은예제의개수를기반으로업데이트된다. 가중치 w는두요소의선형합으로다음과같이계산된다. w α α 2 = (# c (# w) ) + (1 ) (# c+ # w) (6) # c 와 # w 는정확하게예측된훈련예제와부정확하게예측된훈련예제의개수이다. 식 (6) 에서첫번째항은정확도요소로정확하게예측된예제가많고부정확하게예측된예제보다적을때점수가높아진다. 두번째항은데이터에서하이퍼에지의커버리지를나타내는것으로더많은훈련예제에일치하면점수가높아진다. 또하이퍼네트워크의다양성을향상시키기위한전략으로가중치에기반하여하이퍼에지를교체하는정책을도입한다. 이전연구 [8] 에서는특정값으로교체되는하이퍼에지의비율을고정했었는데본연구에서는하부층의하이퍼네트워크를진화시키기위한하이퍼에지교체비율을유연하게조정할수있는함수 R(t) 를아래와같이정의하였다. exp, (7) M 과 m 은교체비율의최대값과최소값을나타내고 0과 1사이의범위를가지며, t 는진화과정에서의세대수이며, c 는임의적상수이다. c 를조정함으로써수렴속도를조절할수있다. 4.2 상부층진화적하이퍼네트워크의학습상부층의하이퍼네트워크는모달리티간의관계를표현한다. 상부층하이퍼네트워크의하이퍼에지는하부층의각하이퍼네트워크의결과로생산된하이퍼에지통합에의해생성되므로각모달리티간의상호작용관계를분석할수있다. 상부층하이퍼네트워크에서도역시하부층하이퍼네트워크로부터산출된하이퍼에지의모든조합을학습하기에는불가능하기때문에랜덤선택에기반하여하이퍼에지들을학습하여통합한다. 4.3 하이퍼에지분석을위한유의성점수측정모달리티간유의한관계를찾기위해우리는본연구에서메트릭을정의한다. 제안하는메트릭은유의성점수 S라하며이는각모달리티의인자가하이퍼에지에동시에존재하는빈도에기반하여계산한다. 즉, 모든하이퍼에지에서두인자의각쌍이동시에나타나는빈도수를기반으로유의성점수 s ij 는다음과같다. N 1 (( i, j) En ) sij = wij, wij =, n= 1 0 ( otherwise) (8) 위와같이유의성점수는 i 번째인자와 j 번째인자가정점으로동시에나타나는하이퍼에지의수로정의된다. 따라서높은유의성점수를가진인자의쌍은유의미하게상호작용하는모듈로간주될수있다. 5. 실험결과 5.1 데이터전처리및실험파라미터설정본연구에서는인간암관련 mirna와 mrna의발현프로파일데이터를사용하여암특이적 mirnamrna 상호작용조합을탐색하였다 [5,6]. 실험데이터는 21개의정상조직과 68개의암조직으로부터 151개 mirna와 10,262개 mrna의발현정도를측정한것이다. 실험을위해각샘플의유전자평균값을기반으로발현수준을표준화시키고, 그표준화된발현값을각유전자의샘플평균값을기준으로 mirna와 mrna의 표 1 계층적하이퍼네트워크실험파라미터설정 파라미터 차수 (#mirna, #mrna) (3, 3) 교체비율 ( 최소값, 최대값 ) (0.1, 0.9) 값 # 샘플링비율 80 # 통합비율 10

진화연산기반계층적하이퍼네트워크모델에의한암특이적 microrna-mrna 상호작용탐색 983 발현수준을 0 또는 1로이산화하였다. 또한생물학적으로더유의성있는결과를얻기위해전체 mrna 목록에서 [9] 에따라 mrna를추출하여실험을수행하였다. 실험에사용된파라미터는표 1과같이설정하였다. 5.2 분류성능표 2는제안하는알고리즘과다른기계학습방법들과의분류성능을비교한결과이다. 다른기계학습방법으로는 WEKA에서제공되는지지벡터머신 (support vector machines), J48 결정트리, 베이지안네트워크 (Bayesian networks), 나이브베이즈 (naïve Bayes), 랜덤포레스트 (random forests) 를사용하였으며 10-fold-cross validation을이용하여 10번반복수행, 분류정확도의평균을구하였다. 그결과계층적하이퍼네트워크는 95.30% 분류정확도로결정트리, 나이브베이즈, 랜덤포레스트, 베이지안네트워크보다높은성능을보였고지지벡터머신에도비할만한성능을보여주었다. 그러나계층적하이퍼네트워크모델은분류뿐만아니라직접적으로해석가능한결과를제공할수있으므로다수인자간상호작용관계분석이필수적인복잡한생물학문제를해결하는데있어유용하다할수있다. 표 2 다른기계학습방법들과성능비교결과분류기법정확도 ( 표준편차 ) 지지벡터머신 97.30 (0.58) 계층적하이퍼네트워크 95.39 (0.98) 베이지안네트워크 (# 부모 =3) 92.92 (1.59) 랜덤포레스트 (# 트리 =50) 90.90 (0.98) 나이브베이즈 89.21 (0.79) J48결정트리 84.41 (2.70) 5.3 암특이적 mirna-mrna 상호작용탐색표 3은계층적하이퍼네트워크모델에의해탐색된높은점수의 mirna-mrna 상호작용조합을보여주고있다. 제안한메트릭 ( 유의성점수 S) 을적용하여통합된하이퍼에지에서동시에나타나는인자의빈도수를기반으로 mirna와 mrna의유의한관계를추출하였다. 상호작용집합을구성하고있는각 mirna와 mrna 간유의성점수를계산을하고평균을구하였다. 또, 표 3에서보여주고있는 mirna와 mrna는이전연구들 을통해암과관련되어있는 mirna와 mrna로다수밝혀졌다. hsa-mir-21은유방암, 난소암, 대장암, 간암등다양한인간암에서높게발현되어 PDCD4, PTEN, TPM1과같은암억제유전자의발현을억제하여종양유발을유도한다 [10]. 또 hsa-mir-29a는폐암에서과잉발현되어암억제유전자의발현을억제하고암세포의분화, 전이에있어서도기능적인조절역할을한다 [11]. 또한, hsa-mir-154 역시만성림프성백혈병에서유의하게높은수준으로발현되고 [12], hsa-mir-184은신경교종진행의억제기능을한다고알려져있다 [13]. 더욱이표 3에서보여주는 mrna의대부분이다양한암기전에기능적으로연관되어있음이여러연구를통해보고되었으며, 또한같은집합내에있는 mrna은생물학적시스템에서비슷한생물학적기능을공유하고있음을보여준다. 5.4 발견된 mirna-mrna 상호작용조합의생물학적유의성우리는제안한모델에의해탐색된 mirna-mrna 상호작용조합을검증하기위해유전자온톨로지 (Gene Ontology) 를사용하여같은집합내에있는 mrna의기능적응집성을분석하였다. 찾아진 mirna-mrna 상호작용조합이잠재적인기능을내포하고있다면조합을구성하고있는 mrna들은생물학적으로유의미한기능적관련성이반영되어있을것이다. GOstat[14] 을이용하여집합 I에대해통계적으로유의한 GO term을검증하였다. q-value<0.01에해당하는유전자온톨로지분석결과, 전체적으로집합 I을구성하고있는 mrna 는세포자살, 죽음, 분화, 발달등세포주기메커니즘관련한특정기능의카테고리에속해있었다. 이는암진행이나발달에매우밀접한관련이있는기능으로제시하는결과는탐색된상호작용조합이세포적프로세스에서암특이적인기능적역할을내포하고있음을암시한다할수있다. 또, 그림 1은상호작용집합 I에서실험적인증거를바탕으로생물학적으로더의미있는 mirna-mrna 상호작용조합의부분집합을추출한결과이다. 위에서언급한바와같이 hsa-mir-21과 hsa-mir-29a는세포성장과발달에많은영향을주는조절인자로인간악성 표 3 계층적하이퍼네트워크에의해탐색된높은유의성점수의 mirna-mrna 상호작용집합 No. mirnas mrnas ( 평균점수 ) I II hsa-mir-21, has-mir-29a hsa-mir-154, hsa-mir-184 SFERS2 (959), NFIB (956), CRYAB (917), ALDH1A1 (916), CDKN1B (901), SART1 (864.5), HSPA1A (861.5), TGFBR2 (851.5), PPAP2B (837), PPP2CB (820), ARMCX1 (815.5), FLNB (814), HSP90B1 (797.5), GADD45G (795.5), MYLK (766), CTNNB1 (758.5), EPS8 (755), HNRPK (748.5), ZAK (745), FGFR1 (740.5), RRAGA (732.5), MT1X (730.5), CYP51A1 (728), BIRC4 (726), ZNF133 (713), GNA11 (712.5), YWHAE (712), ALDH2 (708.5), BNIP3L (708.5), TPM1 (704.5) NFIB (824.5), SFRS2 (821.5), CRYAB (809), CDKN1B (792), ALDH1A1 (788), PPAP2B (772), HSPA1A (767), SART1 (756), PPP2CB (752), TGFBR2(737.5), FLNB (707), EPS8 (705.5)

984 정보과학회논문지 : 컴퓨팅의실제및레터제 16 권제 10 호 (2010.10) 그림 1 실험적증거가뒷받침된생물학적으로유의한 mirna-mrna 상호작용조합의서브집합 (validated: 실험적으로검증된목표유전자, predicted: 전산학적으로예측된목표유전자 ) 종양을포함하여다양한기능적장애를이끄는데주요역할을한다. 또, 그림 1을구성하고있는유전자 NFIB [15], TPM1[16], TGFBR2[17] 는암과매우밀접한관련이있음이밝혀져있다. 특히 NFIB와 TPM1은실험적으로 hsa-mir-21의목표유전자임이검증되었으며, 이는서로밀착하여발암현상을유도하는데중대한영향을준다고보고되어있다 [15,16]. 결과적으로제안한방법이생물학적으로유의하게명백히암과관련되어있는암특이적 mirna-mrna 상호작용조합을발견하는데유용한모델임을추론할수있다. 6. 결론 본논문에서는이종의발현데이터로부터암특이적 mirna-mrna 상호작용조합을효과적으로탐색할수있는새로운방법을제안하였다. 제안한계층적하이퍼네트워크는하나이상의모달리티사이의관계를분석, 조합할수있는구조로되어있어 mirna와 mrna와같이이종적요소간의생물학적으로타당한상호작용조합을탐색하는데적합한모델이다. 또한높은분류성능과더불어다양한리소스사이의연관관계이해를위한해석가능한결과를제공함으로써복잡한생물학문제를해결하는데유용하다. 실험적으로제안한모델을인간암관련 mirna와 mrna 발현데이터에적용하여높은분류정확도로암특이적 mirna-mrna 상호작용조합을탐색하였다. 또발견한 mirna-mrna 상호작용조합에대해유전자온톨로지분석과문헌검색을수행하여생물학적으로도유의함을제시하였다. 본연구에서는계층적하이퍼네트워크학습과정에있어랜덤선택기반으로진행하였지만향후연구에서는계층적하이퍼네트워크프레임워크에상관관계정보와같은사전지식 (prior knowledge) 을도입하여생물학적으로더의미있는결과를얻을수있도록개선할것이다. 참고문헌 [1] S. Yoon and G.D. Micheli, "Prediction of regulatory modules comprising micrornas and target genes," Bioinformatics, 21, pp.ii93-ii100, 2005. [2] J.C. Huang et al., "Detecting microrna targets by linking sequence microrna and gene expression data," In Proceedings of RECOMB, pp.114-129, 2006. [3] J.-G. Joung et al., "Discovery of microrna-mrna modules via population based probabilistic learning," Bioinformatics, vol.23, no.9, pp.1141-1147, 2007. [4] S.-J. Kim et al., "Evolutionary layered hypernetworks for identifying microrna-mrna regulatory modules," IEEE World Congress Computational Intelligence (WCCI 2010), pp.2299-2306, 2010. [5] J. Lu et al., "MicroRNA expression profiles classify human cancers," Nature, 435, 834-838, 2005. [6] S. Ramaswamy et al., "Multiclass cancer diagnosis using tumor gene expression signature," PNAS, vol.98, no.26, pp.15149-15154, 2001. [7] B.-T. Zhang, "Hypernetworks: A molecular evolutionary architecture for cognitive learning and memory," IEEE Computational Intelligence Magazine, vol.3, no.3, pp.49-63, 2008. [8] J.-W. Ha et al., "Evolutionary hypernetwork models for aptamer-based cardiovascular disease diagnosis," The Genetic and Evolutionary Computation Conference (GECCO 2007), pp.2709-2716, 2007. [ 9 ] P.A. Futreal et al., "A census of human cancer genes," Nature Reviews Cancer, 4, pp.177-183, 2004. [10] S. Zhu et al., MicroRNA-21 targets tumor suppressor genes in invasion and metastasis, Cell Research, 18, pp.350-359, 2008. [11] M. Fabbri et al., "MicroRNA-29 family reverts aberrant methylation in lung cancer by targeting DNA methyltransferases 3A and 3B," PNAS, vol.104, no.40, pp.15805-15810, 2007. [12] G.A. Calin et al., "MicroRNA profiling reveals distinct signatures in B cell chronic lymphocytic leukemias," PNAS, vol.101, no.32, pp.11755-11760, 2004. [13] M. Malzkorn et al., "Identification and functional characterization of micrornas involved in the malignant progression of gliomas," Brain Pathology, 2009. [14] T. Beissbarth and T.P. Speed, "GOstat: Find statistically overrepresented Gene Ontologies within a group of genes," Bioinformatics, vol.20, no.9, pp.1464-1465, 2004. [15] S. Fujita et al., "mir-21 gene expression triggered by AP-1 is sustained through a double-negative feedback mechanism," Journal of Molecular Biology, vol.378, no.3, pp.492-504, 2008. [16] S. Zhu et al., "MicroRNA-21 targets the tumor suppressor gene tropomyosin 1 (TPM1)," Journal of Biological Chemistry, vol.282, no.19, pp.14328-14336, 2007. [17] R.L. Elliott and G.C. Blobe, "Role of transforming growth factor beta in human cancer," Journal of Clinical Oncology, vol.23, no.9, pp.2078-2093, 2005.