임영일 CAPEC, Department of Chemical Engineering, Technical University of Denmark, DK-2800 Lyngby, Denmark Phone: +45 4525 2804, Fax: +45 4593 2906, Email: lim@kt.dtu.dk 2. SBE 에관한연구동향과현황 Systems Biology and Engineering (SBE) 에관련된여러학문들 (genomics, proteomics, bioinformatics, systems biology, separation science, systems engineering, applied mathematics, computational science and software engineering) 에관한전문적연구및통합움직임은세계여러연구기관에서엿볼수있다. 본장에서는이들분야들과 SBE 와의연관관계를설명하고, 알려진연구주제나연구자들에관하여알아본다. 2.1 Bioinformatics 유전자와생물분자의구조와기능의복잡성 / 다양성으로인하여체계적정보구축이요구된다. Protein databank (http://www.pdb.org/, Berman et al., 2000) 에서는단백질의서열, 구조, 기능에관한정보를게시하고검색할수있다. Danish centre for human genome research (http://proteomics.cancer.dk/, Gromov et al., 2002) 에서는인간유전자에서발현되는단백질에관한 2D-PAGE (2-dimensional polyacrylamide gel electrophoresis) 정보를인터넷사이트를통하여갱신하고있다. 1992 년에설립된 The Institute for Genomic Research (TIGR, http://www.tigr.org/) 에서는수십여종의알려진종들 (e.g., viruses, prokaryotes, eubacteria, eukaryotes) 의유전자서열 (genome sequence) 을찾아볼수있다. TIGR 는최근 21 개의미생물의전체유전자를해독하였다. Princeton 대학의전산화공연구실 (http://titan.princeton.edu/) 을이끄는 C. A. Floudas (floudas@titan.princeton.edu) 교수는자체개발한 global optimization 알고리즘인 αbb (α-branch and Bound) 를이용하여분자자유에너지함수의최적화를통해단백질구조 / 형상예측에관하여연구한다 (Klepeis & Floudas, 2003). 이연구는초기조건으로어느단백질의아미노산서열이주어졌을때, 이들의 2 차구조 (e.g., α-helices and strands, β-sheet, and disulfide bridge formation) 를예측하고, αbb 최적화알고리즘을이용하여단백질의 3 차구조 (i.e., protein folding) 를전산모사한다. 단백질의 3 차구조 (tertiary structure) 가단백질의기능과흡착에큰영향을미치기때문에, 단백질분리메커니즘 (i.e., separation and adsorption mechanism) 을규명하는데있어단백질구조예측은필수적이라할수있다. 2.2 Functional genomics Systems Biology and Engineering (SBE) 분야를뒷받침하기위해빼놓을수없는연구방향은기능유전체학 (functional genomics) 또는단백질체학 (proteomics) 이다. 유전정보해독 (genome sequence) 을주도해온 genome era 이후의주된연구방향은 genome sequencing 보다도휠씬더복잡한 functional genomics 이다 (Vukmirovic & Tilghman, 2000). 생물학은 complexity and data-rich science 로특성지어진다. 유전정보로부터발현되는단백질 / 효소생성과정, 이들의대사 / 조절 / 신호경로등은 DNA microarray, protein chips 등으로직간접적으로측정이되며, 방대한자료가수집된다 (Lockhart & Winzeler, 2000). 이들자료분석을통하여정보 - 지식화 (i.e., from information to knowledge) 하는작업은 systems biology 분야에서의여러반응경로, 반응상수를알아내는데큰기여를할것이다. II-1
2.3 Systems biology 살아있는세포의동적거동을수학적모델링을통하여체계적으로이해하려고하는 systems biology 는최근떠오르는생명공학기술중의하나이다. 세포의컴퓨터모사에대한중요성은 1980 년대부터부각되었고, 1990 년대후반에서야세포전체에대한모델링과모사가이루어졌다 (Tomita, 2001). Systems biology 의가장중요한연구목적중의하나는컴퓨터모사를통하여새로운유전자를설계하고, 이새로운유전자를보유한세포의대사, 유전자조절, 신호전달경로에대한수학적모델링을통해세포의동적거동을분석하는것이다. 이분야에서일본은앞선연구를진행하고있는것으로보인다 : the Kitano symbiotic systems project (Japan Science and Technology Corporation, http://www.symbio.jst.go.jp/symbio/, Kinato, 2002), the E-Cell project (http://www.e-cell.org, Tomita et al., 1999), the SBML project (http://www.sbml.org/, Hucka et al., 2003), Institute for Advanced Bioscience (Keio university, http://bioinfo.sfc.keio.ac.jp/iab/, Japan). 한국은실험을통한모델개발에충분한경쟁력이있어보인다. 한국과학기술원의이상엽교수가이끄는대사공학연구실 (Metabolic & Biomolecular Engineering National Research Laboratory, http://mbel.kaist.ac.kr/) 과박선원교수가이끄는 Process systems lab. (http://love.kaist.ac.kr) 에서는대사과정에서각경로마다생물분자유량을계산해내는 MetaFluxNet v1.5.2 (Lee et al., 2003) 를개발했고, 계속적으로갱신하고있다. 가상세포모사를위해서 E-Cell 의보완프로그램으로 MetaFluxNet 는유용해보인다. 이외에국제적으로알려진연구진및연구과제는다음과같다 : 영국맨체스터대학의 Control Systems Centre (University of Manchester, http://www2.umist.ac.uk/csc/) 소속의 Wolkenhauer (see Wolkenhauer, 2002), 독일 Max-Planck Institute Magdeburg (http://www.mpi-magdeburg.mpg.de/) 의 Systems Biology group 의 E. D. Gilles (see Kremling et al., 2000, 2001a, 2001b), 미국의 J. C. Schaff 가주도하는 the V-Cell project (National Resource for Cell Analysis and Modeling, University of Connecticut Health center, http://www.nrcam.uchc.edu, Loew & Schaff, 2001), Microbial cell project (http://www.microbialcellproject.org/). 특히 1996 년부터시작된 E-Cell project (Tomita et al., 1999) 는세포의동적거동을모델링 / 모사할수있는통합환경으로 480 여개의유전자를보유한 M. genitalium 원핵세포의 127 개기본적인유전자만을포함한가상세포내대사과정을모사 (in silico experiments) 하고, 생성물들의농도를예측하는작업을성공적으로끝냈다. 하지만, M. genitalium 세포 in silico 모델에는유전자조절경로나신호전달경로등에관련된반응식은포함하고있지않으며, 지속적인개발상태에있다. E-Cell 을이용한적혈구세포가상모사도실험결과와비교할만한좋은성과를보이고있다 (Tomita, 2001). 세포내대사 / 조절 / 신호경로모델링과분리공정에서흡착메카니즘의복잡성으로인하여범용의재활용가능한모델링을위한프로그래밍언어개발은필수적이다. 이분야는 Software engineering 과밀접한관계를갖고있으며, SBML (System biology markup language, http://www.sbml.org, Hucka et al., 2003) 은이러한목적으로개발중에있으며, XML (extensible markup language) 과 UML (unified modeling language) 에기반을두고있다. System biology 에관한개괄적인설명은 Report #3 에서다룰것이다. 조직 / 기관모사 (tissue/organ simulation) 단일세포의동적모사가아직초보적인단계이고, 다양한기능을갖는수많은세포들의상호관계에대한모사는더더욱복잡하고어렵다. 즉, 유전자정보로부터의세포 / 조직 / 기관의수학적모델링을통하여생물체의거동을해석한다는것은아직불가능하다. 하지만, 생물체특히인체내의특정한역할을하는부위 (e.g., 조직, 기관 ) 의모사는부분적으로이루어지고있다 (Bassingthwaighte, 2002). 이러한움직임은 The Physiome Project (http://www.physiome.org/) 에서좀더구체화되고있다. 와싱턴대 Bassingthwaighte 교수 (Dept. of bioengineering, Univ. of Washington, USA) 는 The Physiome Project 의한일환으로인체심장에관한물리적현상과동적기능에관한정량적모사에초점을둔 The Cardiome Project (Bassingthwaighte et al., 1998) 를수행중에있다. The Center for Modeling Integrated Metabolic Systems (MIMS, http://www.csuohio.edu/mims/) 소속의 Cabrera 교수 (Dept. Biomedical engineering, Case Western Reserve Univ., USA) 는동맥혈액상의 glucose/ 산소등의농도변화에따른조직의대사반응에미치는영향을모델링하여정맥의혈중 glucose/ 산소등의농도를예측하는연구를진행중에있다. 이모델은혈관내여러화학물질들의대류, 확산, 반응에관한편미방 / 미방 / 대수식등으로구성되어있다 (Cabrera, et al., 1998). 이연구는약물전달과정이나, 외부환경변화에따른인체의반응을모사 / 예측하는것을목적으로하고있다. 이분야에관한개괄적인설명은 Report #4 에서다룰것이다. II-2
2.4 Bioreactor engineering 생물반응기내의세포배양액속에는수많은미생물들이존재한다. 이들각각의동적거동은생물반응기의설계와제어에큰영향을준다. 앞서설명한 Systems biology 에서구현된세포모사결과를생물반응기모델식으로연결함으로서우리는유전정보로부터생물반응기모사까지체계적인분석이가능하다. 세포배양에있어서미생물수와생성물의자가진동 (autonomous oscillation) 현상은잘알려진사실이다 (Zhu et al., 2000). 이러한미생물수의동적거동은 cell population balance equation 으로표현할수있다 (Jones and Kompala, 1999). 이분야는크게 3 가지방법으로접근할수가있다 : i) structured/unsegregated modeling (Jones and Kompala, 1999): 세포의외부환경변화 (e.g., feeding flowrate, substrate concentration change) 에따른세포내대사반응을화학적 / 생물학적모델식 (i.e., chemically/biologically structured) 으로표현하고단일세포의동적거동 (i.e., 수많은세포들로세분화되지않은, unsegregated) 을연구. 이방법은앞서설명한세포모사 (2.3 systems biology) 와거의같은접근방법이다. ii) segregated/unstructured modeling (Zhu et al., 2000): 다양한크기 / 나이 (mass and age) 를갖고있는미생물들의입자분포식 (cell population balance equation, PBE) 을바탕으로세포성장속도식을표현하기위해단순한먹이 (substrate) 의질량수지식만을이용하는것 (i.e., chemically/biologically unstructured). iii) segregated/structured modeling (Mhaskar et al., 2002): 미생물들의입자분포식 (cell population balance equation, PBE) 과세포외부환경변화에관련된세포내대사반응 (metabolic reactions) 을동시에고려하는연구. 첫번째방법 (structured/unsegregated model) 은복잡한세포내대사반응을모사하여세포의동적거동을해석하기때문에가장복잡하고현학적인연구일것이다. 하지만, 다양한크기 / 나이를갖는세포들이생물반응기내에존재함으로 cell population balance equation 을이용하는두번째와세번째방법이더현실적인접근이다. 특히세포들간의상호관계와세포외부환경에관련된세포내대사반응을함께고려하는세번째방법이가장합리적인접근으로보인다. Segregated/structured model 을통하여생물반응기내세포들의크기 / 나이분포를예측할수있고, 또한목적단백질의생성속도를예측할수있으며, 생물반응기제어를위하여이모델식을이용한다. 이분야는 Report #5 에서요약된다. 2.5 Separation/purification science and engineering 생물공정은주로미생물의발효반응기, 세포분쇄과정, 분리 / 정제공정으로구성된다. 비교적작은분자량의단순한물질분리에초점이맞추어져있는화학공정분리에서는가압 / 가열에의한증류탑이많이사용되지만, 폴리펩타이드 (Mw<10 kda) 나단백질 (Mw>10 kda) 과같은열에약한거대분자를다루는생물공정의분리에는상온 / 상압의전기영동법 (1D or 2D electrophoresis) 이나크로마토그래피법 (chromatography), 분리막법 (membrane in ultra-filtrations for size exclusion) 등과같은정밀하고섬세한장치가사용된다. 분리공정의주요목적은단백질이나펩타이드생성반응후나오는혼합용액에서물 / 숙주단백질 / 단백질분해효소등을제거하는것이다. 특히크로마토그래픽공정은대용량단백질의분리와정제에서많이사용하며, 고순도의최종제품을위해서는생물반응에관련된여러불순물 ( 비정상단백질, 덩어리단백질, 불완전단백질, 비활성단백질등 ) 의정제과정이필요하기때문에, 여러단계의크로마토그래픽분리공정 (e.g., ion exchange, reversed phase, affinity, hydrophobic interaction and size exclusion) 을포함할수있다. 하지만, 크로마토그래픽공정개발에있어서생물분자의복잡한흡착메카니즘으로인하여아직까지실험적공정개발에치중하고있다 (Iyer et al., 1999). Rensselaer Polytechnic Institute (http://www.rpi.edu/dept/chem-eng, USA) 화공과 Steven M. Cramer 는산업용크로마토그래픽단백질분리공정 (preparative protein chromatography) 에관한모델링 / 모사 / 최적화와실험을통한검증에관한연구를하고있다 (Gallant & Cramer, 1996). 크로마토그래픽분리공정의수학적모델링은일반적으로고정상과유동상사이의질량보존을위한편미방, 흡착반응에대한미분식, 그리고고체 - 액체상평형농도를예측하기위한대수식으로기술된다 (Lim et al., 2003). 여기에서, 고체 - 액체상단백질평형농도예측은분리성능을좌우하는가장중요한모델식이기때문에, 많은연구자들의관심대상이다. II-3
단백질의구조 (structure) 와형상 (conformation) 의변화에따른흡착메커니즘에관한연구 (K. K. Unger, Mainz university, http://www.uni-mainz.de, Germany) 와온도, ph, 염농도등의변화에따른평형농도예측모델개발 (G. Carta, Virginia University, http://www.che.virginia.edu/, USA) 등은현재활발히진행중에있다. 연속적크로마토그래픽공정으로생물분자의대량생산에적합한 SMB (simulated moving bed) protein chromatography 는최근각광을받고있는분리기술이다 (Juza et al., 2000; Xie, Moon & Wang, 2003). 미국 Purdue university 의생물분자분리실험실 (http://atom.ecn.purdue.edu/~biosep/, USA) 을이끄는 N.-H. L. Wang 교수는 SMB 공정에많은연구결과를발표하고있다. M. Morbidelli (http://www.morbidelligroup.ethz.ch/, ETH Zurich, Switzerland) 는 SMB 공정설계와최적화등에관하여이론개발과실험결과에관하여연구를하고있다. 이분야는 Report #6-#7 에서좀더자세하게설명할것이다. 2.7 결론 SBE 의목적은유전정보로부터발현되는단백질과같은생물분자를예측하고, 생물공정설계단계에서세포모사결과를응용하는것이며, 생성물의분리와정제에이르는분리공정을모델링 / 모사하는것이다. 또한인위적공정이라기보다는생체내생물학적공정이라고볼수있는조직 / 기관들에관한수학적모델링을통하여, 물리적 / 생물학적현상을예측하는것이다. 생물공학에대한관심이높아가고있고, 이에관련된과학과기술이팽창하고있지만, 생물분자의다양성과복잡성으로인하여좀더근본적이고기초적인연구가계속진행되어야한다. 예를들어, 비교적많은유전자수를보유한세포에관한모델링과가상모사에있어서가장절실한문제중의하나는정량적정보의부족이다. 어떤단백질이무슨분자와서로반응한다는정성적자료와경로등은알려져있지만, 필요한효소의농도, 반응속도상수, 해리상수등은잘알려져있지않은경우가많다 (Tomita, 2001). 따라서, 이러한기초연구가선행되어야하는컴퓨터를이용한생물세포모델링과공정개발은많은부족한점을안게될것이고, 지속적으로보완되어야한다. Systems Biology and Engineering (SBE) 분야에있어서부분적이고, 전문적인연구는, 앞서기술했듯이많이찾아볼수있지만, 전체적이고통합된환경을구축하려고하는움직임은아직시기상조인듯하다. 하지만, Systems Biology and Engineering 분야로의빠른진출은생물공학기술 (biotechnology) 의체계화및상업화에큰기여를할것이고, 고급기술을선점할수있는기회를갖게될것이다. References Bassingthwaighte et al. (1998), Blood flows and metabolic components of the cardiome, Prog. Biophy. & Mol. Bio., 69, 445-461. Bassingthwaighte, J. B. (2002), Proteins, cells, organs: hierarchical structuring in modeling biological systems, Preceding of the 2 nd joint EMBS/BMES conferences, p2176-2177, Houston, USA. Berman, H. M. et al.(2000), The Protein Data Bank, Nucleic Acids Research, 28, 235-242. Cabrera, M. E. et al. (1998), Modeling metabolic dynamics from cellular processes to organ and whole body responses, Prog. Biophy. & Mol. Bio., 69, 539-557. Gallant, S. R., S. Vunnum, S., S. M. Cramer, (1996), Optimization of preparative ion-exchange chromatography of proteins: linear gradient separations, J. Chromatogr. A, 725(2), 295-314. Gromov, P. S., M. Østergaard, I. Gromova and J. E. Celis (2002), Human proteomic databases: a powerful resource for functional genomics in health and disease, Prog. Biophys. & Mol. Biol., 80, 3-22. Hucka, M. et al. (2003), The systems biology markup language (SMBL); a medium for representation and exchange of biochemical network models, Bioinformatics, 19(4), 524-531. Iyer H, Tapper S, Lester P, Wolk B, Van Reis R. 1999. Use of the steric mass action model in ion-exchange chromatographic process development. J Chromatogr A 832: 1-9. Jones, K. D. and D. S. Kompala (1999), Cybernetic model of the growth dynamics of S. cerevisiae in batch and continuous cultures, J. Biotechnol., 71, 105-131. Juza et al. (2000), Simulated moving bed chromatography and its application to chirotechnology, Trends in Biotech., 18, p108. Kitano, H. (2002), Systems biology: a brief overview, Science, 295, 1662-1664. II-4
Klepeis, J. L. and C. A. Floudas (2003), Ab initio Tertiary Structure Prediction of Proteins, J. Glob. Opti., 25(1), 113-140. Kremling A. and E. D. Gilles (2001a), The organization of metabolic reaction networks: II. Signal processing in hierarchical structured functional units, Metab. Eng., 3, 138-150. Kremling A., K. Bettenbrock, B. Laube, K. Jahreis, J. W. Lengeler and E. D. Gilles (2001b), The organization of metabolic reaction networks: III. Application for diauxic growth on glucose and lactose, Metab. Eng., 3, 362-379. Kremling A., K. Jahreis, J. W. Lengeler and E. D. Gilles (2000), The organization of metabolic reaction networks: I. a signal-oriented approach to cellular models, Metab. Eng., 2, 190-200. Lee D.Y, Yun H.S, Lee S.Y. and Park S.W. (2003) MetaFluxNet: the management of metabolic reaction information and quantitative metabolic flux analysis. Bioinformatics (In press). Lim, Y. I., S. C. Chang and S. B. Jørgensen (2003), A novel PDAE solver: iterative CE/SE method, Comp. Chem. Eng. (in press). Lockhart D. J. & E. A. Winzeler (2000), Functional genomics: genomics, gene expression and DAN arrays, Nature (insight review), 405, 827-836. Loew, L. M. and J. C. Schaff (2001), The Virtual Cell: a software environment for computational cell biology, Trends in Biotechnology, 19(10), 401-406. Mhaskar, P., M. A. Hjortsø and M. A. Henson (2002), Cell population modeling and parameter estimation for continuous cultures of S. cerevisiae, Biotechnol. Prog., 18, 1010-1026. Tomita, M. (2001), Whole-cell simulation: a grand challenge of the 21 st century, TRENDS in Biotechnology, 19(6), 205-210. Tomita, M. et al. (1999), E-CELL: software environment for whole-cell simulation, Bioinformatics, 15, 72-84. Vukmirovic O. G. & S. M. Tilghman (2000), Functional genomics: Exploring genome space, Nature (insight review), 405, 820-822. Wolkenhauer O. (2002), Mathematical modeling in the post-genome era: understanding genome expression and regulation-a system theoretic approach, BioSystems, 65, 1-18. Wolkenhauer, O., H. Kitano and K.-H. Cho (2003), Systems biology: looking at opportunities and challenges in applying systems theory to molecular and cell biology, IEE Control systems Magazine, Aug. 2003, 38-48. Xie, Y., S.-Y. Mun, and N.-H. L. Wang (2003), Startup and Shutdown Strategies of Simulated Moving Bed for Insulin Purification, Ind. Eng. Chem. Res.42, 1414-1425. Zhu, G.-Y., A. Zamamiri, M. A. Henson and M. A. Hjortsø (2000), Model predictive control of continuous yeast bioreactors using cell population balance models, Chem. Eng. Sci., 55, 6155-6167. II-5