(19) 대한민국특허청 (KR) (12) 공개특허공보 (A) (11) 공개번호 10-2011-0099600 (43) 공개일자 2011년09월08일 (51) Int. Cl. C07K 19/00 (2006.01) C12N 15/62 (2006.01) C12N 15/63 (2006.01) C07K 1/16 (2006.01) (21) 출원번호 10-2010-0018735 (22) 출원일자 2010 년 03 월 02 일 심사청구일자 전체청구항수 : 총 21 항 2010 년 03 월 02 일 (71) 출원인 한국과학기술원 대전유성구구성동 373-1 (72) 발명자 김학성 대전광역시유성구지족동반석마을 3 단지아파트 310 동 304 호 이지오 대전광역시유성구구성동한국과학기술원자연과학동 ( 뒷면에계속 ) (74) 대리인 (54) 인터날린단백질의 N- 말단및 LRR 패밀리단백질이융합된수용성융합폴리펩타이드및이의제조방법 (57) 요약 본발명은인터날린단백질의 N- 말단및 LRR (Leucine rich repeat) 패밀리단백질이융합된수용성폴리펩타이드에관한것이다. 보다구체적으로, 본발명은인터날린단백질의 N- 말단및 LRR 패밀리단백질이융합된수용성폴리펩타이드, 상기폴리펩타이드를제조하는방법, 상기폴리펩타이드를코딩하는핵산서열을포함하는벡터, 벡터를포함하는숙주세포, 숙주세포내에서벡터를발현시켜서수용성및접힘이향상된융합폴리펩타이드를생산하는방법및융합폴리펩타이드의수용성및접힘을향상시키는방법에관한것이다. 대표도 - 도 8 손민 - 1 -
(72) 발명자 김동섭 대전광역시유성구구성동한국과학기술원정문술빌딩 이상철 대전광역시유성구구성동한국과학기술원자연과학동 이병철 서울시광진구구의동 648-3 영진빌라 101 호 한지은 대전광역시유성구구성동한국과학기술원자연과학동 이중재 대전광역시유성구구성동한국과학기술원자연과학동 박근완 대전광역시유성구구성동한국과학기술원정문술빌딩 홍승표 대전광역시유성구구성동한국과학기술원정문술빌딩 이발명을지원한국가연구개발사업 과제고유번호 2010-0002220 부처명 교육과학기술부 연구관리전문기관 연구사업명 미래유망융합기술파이오니어사업 연구과제명 반복단백질을이용한단백질치료제개발 기여율 주관기관 한국과학기술 연구기간 2008년 04월 15일 ~ 2011년 02월 28일 - 2 -
특허청구의범위 청구항 1 인터날린단백질의 N- 말단및 LRR (Leucine rich repeat) 패밀리단백질이융합된수용성융합폴리펩타이드. 청구항 2 제 1 항에있어서, 상기인터날린단백질은인터날린 A, 인터날린 B, 인터날린 C, 인터날린 H 및인터날린 J 로이 루어진군에서선택된것인융합폴리펩타이드. 청구항 3 제1항에있어서, 상기 LRR 패밀리단백질은가변임파구수용체 (Variable lymphocyte repeat; VLR), 톨유사수용체 (Toll-like receptor; TLR), TV3, U2A 및리보뉴클레아제억제제 (RI) 로이루어진군에서선택된것인융합폴리펩타이드. 청구항 4 제 1 항에있어서, 상기 LRR 패밀리단백질은 LRR 반복모듈의개수가 1 개내지 9 개인융합폴리펩타이드. 청구항 5 제 1 항에있어서, 상기인터날린단백질의 N- 말단및 LRR 패밀리단백질이링커 (linker) 를통해연결된것인융 합폴리펩타이드. 청구항 6 제 5 항에있어서, 상기링커는 VLR 반복모듈인융합폴리펩타이드. 청구항 7 제 1 항에있어서, 상기인터날린단백질의 N- 말단은하기의반복모듈패턴을 폴리펩타이드 : 포함하는것인융합 [LxxLxxLxLxxN] 여기서, L 은알라닌, 글리신, 페닐알라닌, 티로신, 루이신, 이소루이신, 발린또는트립토판 ; N 은아스파라진, 글루타민, 세린, 시스테인또는트레오닌, x 는친수성아미노산임. 청구항 8 제 7 항에있어서, 상기인터날린단백질의 N- 말단은서열번호 13 인융합폴리펩타이드. 청구항 9 제 1 항에있어서, 상기융합폴리펩타이드는서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10 또는서열번호 - 3 -
12 로기재되는아미노산서열을가지는것인융합폴리펩타이드. 청구항 10 (a) 인터날린단백질의반복모듈과 LRR 패밀리단백질의반복모듈간의유사도가높은순으로정렬하는단계 ; (b) 상기 (a) 단계의정렬된반복모듈중유사도가높은모듈을선정하는단계 ; (c) 상기 (b) 단계에서선정된모듈중인터날린단백질의반복모듈이 N-말단에위치하고, LRR 패밀리단백질의반복모듈을 C-말단에위치하도록설계하는단계 ; (d) 상기 (c) 단계에서설계된융합폴리펩타이드의결합에너지를계산하여인터날린단백질과 LRR 패밀리단백질의결합부위가안정된최적의융합폴리펩타이드를선정하는단계 ; 및 (e) 상기 (d) 단계에서선정된융합폴리펩타이드에포함된인터날린단백질의반복모듈중표면친수성잔기들을변형시켜서에너지함수값을최소화하는최종서열조합을선정하는단계를포함하는, 제1항의융합폴리펩타이드를제조하는방법. 청구항 11 제 10 항에있어서, 상기 (c) 단계는반복모듈을추가또는제거하는단계를추가로포함하는것인방법. 청구항 12 제 10 항에있어서, 상기 (c) 단계는인터날린단백질과 LRR 패밀리단백질을링커로연결시키는단계를추가로 포함하는것인방법. 청구항 13 제 12 항에있어서, 상기링커는 VLR 반복모듈인것인방법. 청구항 14 제10항에있어서, 상기 (e) 단계의인터날린단백질의반복모듈은하기반복모듈패턴으로표시되는것인방법 : [LxxLxxLxLxxN] 여기서, L은알라닌, 글리신, 페닐알라닌, 티로신, 루이신, 이소루이신, 발린또는트립토판 ; N은아스파라진, 글루타민, 세린, 시스테인또는트레오닌, x는친수성아미노산임. 청구항 15 제 1 항의융합폴리펩타이드를코딩하는핵산서열을포함하는벡터. 청구항 16 제 15 항에있어서, 상기핵산서열은코돈최적화된것인벡터. - 4 -
청구항 17 제 15 항에있어서, 상기벡터는단백질정제용태그서열을추가적으로포함하는것인벡터. 청구항 18 제 15 항내지제 17 항중어느한항의벡터로형질전환된숙주세포. 청구항 19 (a) 제15항내지제17항중어느한항의벡터를제조하는단계 ; (b) 제조된벡터를숙주세포에도입하는단계 ; 및 (c) 상기숙주세포로부터융합폴리펩타이드를회수하는단계를포함하는, 수용성및접힘이향상된융합폴리펩타이드를생산하는방법. 청구항 20 제 19 항에있어서, (d) 컬럼을이용하여융합폴리펩타이드를정제하는단계를추가적으로포함하는방법. 청구항 21 (a) 제15항내지제17항중어느한항의벡터를제조하는단계 ; (b) 제조된벡터를숙주세포에도입하는단계 ; 및 (c) 상기숙주세포로부터융합폴리펩타이드를발현하는단계를포함하는, 융합폴리펩타이드의수용성및접힘을향상시키는방법. 명세서 [0001] 기술분야본발명은인터날린단백질의 N-말단및 LRR (Leucine rich repeat) 패밀리단백질이융합된수용성폴리펩타이드에관한것이다. 보다구체적으로, 본발명은인터날린단백질의 N-말단및 LRR 패밀리단백질이융합된수용성폴리펩타이드, 상기폴리펩타이드를제조하는방법, 상기폴리펩타이드를코딩하는핵산서열을포함하는벡터, 벡터를포함하는숙주세포, 숙주세포내에서벡터를발현시켜서수용성및접힘이향상된융합폴리펩타이드를생산하는방법및융합폴리펩타이드의수용성및접힘을향상시키는방법에관한것이다. [0002] 배경기술단백질은생물의생체내조절의대부분을맡고있는물질로서, 단백질자체의성질을파악하거나단백질과다른물질과의상호작용을연구하고조절하는기술은각종질병의치료등을위해최근더욱중요시되고있다. 이러한단백질의연구및활용에서가장어려운점중의하나는단백질을충분한양으로생산하기어렵다는데있다. 특히많은인간유래의단백질들은단백질을대량생산하는데유용하게이용되는시스템인박테리아에적용이불가능한경우가많아생산량이적은동물세포나식물세포등을이용해야하는실정이다. [0003] LRR (Leucine Rich Repeat) 패밀리단백질은루이신이일정한위치에서반복되는모듈의조합으로이루어진단 백질을통틀어이르는용어로, 이러한 LRR 패밀리단백질은 N- 말단, 다양한개수의반복모듈및 C- 말단으로구 분된조합이안정적인구조를이루고있다. LRR 패밀리단백질의반복모듈은다음과같은특징을갖는다 ; (1) - 5 -
하나이상의반복모듈을갖는다, (2) 반복모듈은 20 내지 30개의아미노산으로이루어져있다. (3) 반복모듈은보존패턴 "LxxLxxLxLxxN" 를갖는다. 여기에서, L은알라닌, 글리신, 패닐알라닌, 티로신, 루이신, 이소루이신, 발린및트립토판과같은소수성아미노산을, N은아스파라진, 글루타민, 세린, 시스테인또는쓰레오닌을, X는임의의아미노산을의미한다. LRR 패밀리단백질은이중반복모듈의개수를조절하고 C-말단의모양을바꾸며다른단백질과의결합면적을넓히고새로운결합부위를만들어낼수있는특징을가지고있다. LRR 패밀리단백질에속하는대표적인예로는인체의면역에관계되는톨-유사수용체단백질 (Toll-like receptor protein; TLR), 먹장어의면역에이용되는가변림프구수용체 (Variable Lymphocyte Receptor; VLR), 리보핵산분해효소저해단백질 (Ribonuclease inhibitor protein; RI) 등이있다. 이들은각각면역을연구하거나분자생물학연구를위해활용되지만곤충세포, 동물세포등에서생산되거나항원물질을주입한후장어에서 VLR을추출하거나, 태반등에서직접 RI를추출하는등의방법으로단백질을생산하여판매및연구에이용되고있다. VLR의경우에는대장균에서불용성형태 (inclusion body) 로발현되어재접힘 (refolding) 후사용한예정도가더있다. 이와같이, LRR 패밀리단백질들이대장균과같은박테리아에서수용성형태로대량생산이어려운것은 LRR 패밀리단백질반복모듈들의연속된소수성잔기들이단백질의수용성발현에어려움을더해주는것으로인한것으로예측된다. VLR 단백질은원구류어 (jawless fish) 의면역작용에쓰이는단백질로써그구성및활용이항체와같아, 대량생산시항체와같은활용을보일것으로기대되는물질이다. 또한 LRR 패밀리단백질은신호전달, 세포주기조절, 세포사멸및면역반응과같은다양한생리적과정에관여하는것으로알려져있으며, 이러한 LRR 패밀리단백질을대장균등의숙주세포에서수용성으로대량생산할기술이개발될수있다면생물및의학분야에서 LRR 패밀리단백질을다양하게이용할수있기때문에시급히필요한기술이다. [0004] 이에본발명자들은 LRR 패밀리단백질의대장균등의숙주세포에서수용성으로대량생산할수있는기술을개 발하기위해예의노력한결과, 인터날린의 N- 말단일부를 LRR 패밀리단백질과융합시킬경우대장균에서안정 적으로수용성형태로대량생산할수있음을확인하여본발명을완성하였다. 발명의내용 [0005] [0006] [0007] [0008] [0009] 해결하려는과제본발명의하나의목적은인터날린단백질의 N-말단및 LRR (Leucine rich repeat) 패밀리단백질이융합된수용성융합폴리펩타이드를제공하는것이다. 본발명의다른목적은 (a) 인터날린단백질의반복모듈과 LRR 패밀리단백질의반복모듈간의유사도가높은순으로정렬하는단계 ; (b) 상기 (a) 단계의정렬된반복모듈중유사도가높은모듈을선정하는단계 ; (c) 상기 (b) 단계에서선정된모듈중인터날린단백질의반복모듈이 N-말단에위치하고, LRR 패밀리단백질의반복모듈을 C-말단에위치하도록설계하는단계 ; (d) 상기 (c) 단계에서설계된융합폴리펩타이드의결합에너지를계산하여인터날린단백질과 LRR 패밀리단백질의결합부위가안정된최적의융합폴리펩타이드를선정하는단계 ; 및 (e) 상기 (d) 단계에서선정된융합폴리펩타이드에포함된인터날린단백질의반복모듈중표면친수성잔기들을변형시켜서에너지함수값을최소화하는최종서열조합을선정하는단계를포함하는, 제1항의융합폴리펩타이드를제조하는방법을제공하는것이다. 본발명의또다른목적은수용성융합폴리펩타이드를코딩하는핵산서열을포함하는벡터또는벡터를포함하는숙주세포를제공하는것이다. 본발명의또다른목적은 (a) 수용성융합폴리펩타이드를코딩하는핵산서열을포함하는벡터를제조하는단계 ; (b) 제조된벡터를숙주세포에도입하는단계 ; 및 (c) 숙주세포로부터융합폴리펩타이드를회수하는단계를포함하는, 수용성및접힘이향상된융합폴리펩타이드를생산하는방법을제공하는것이다. 본발명의또다른목적은 (a) 수용성융합폴리펩타이드를코딩하는핵산서열을포함하는벡터를제조하는단계 ; (b) 제조된벡터를숙주세포에도입하는단계 ; 및 (c) 숙주세포로부터융합폴리펩타이드를발현하는단계를포함하는, 융합폴리펩타이드의수용성및접힘을향상시키는방법을제공하는것이다. - 6 -
[0010] [0011] [0012] [0013] [0014] [0015] 과제의해결수단상기의목적을달성하기위한하나의양태로서, 본발명은인터날린단백질의 N-말단및 LRR (Leucine rich repeat) 패밀리단백질이융합된수용성융합폴리펩타이드에관한것이다. 본발명에서용어, " 인터날린단백질 " 이란리스테리아 (Listeria) 균주에서발현되는 LRR 패밀리단백질의일종으로다른소수성코어가전분자에걸쳐서일정하게분포되어있는다른 LRR 패밀리단백질들과는다른유형의 N-말단구조때문에미생물에서도안정적으로발현되는것으로알려져있다. 이러한인터날린단백질의 N-말단은반복모듈의접힘 (folding) 에가장중요한 N-말단부위가미생물유래일뿐아니라그형태가알파나선을포함하는더욱안정적인모양을가졌기때문에미생물에서안정적으로발현되는것으로생각되고있다. 본발명의융합에사용되는인터날린단백질은 N-말단의구조가유사하며단백질접힘에중요한역할을할것으로예상되는것은제한없이포함되나, 그예로인터날린 A, 인터날린 B, 인터날린 C, 인터날린 H 또는인터날린 J 등이있으며, 바람직하게는인터날린 B이다. 상기인터날린 A 내지 J는구조적으로매우유사하며구조정열을통한인터날린 B 단백질의 N-말단 (36 내지 115) 과의 RMSD (Root mean square deviation) 값은인터날린 A (36 내지115) 는 0.6, 인터날린 C (36 내지 115) 는 0.793, 인터날린 H (36 내지 115) 는 0.619, 인터날린 J (57 내지 131) 는 0.862로매우유사한것을알수있다. 본발명에서용어, " 인터날린단백질의 N-말단 " 은단백질의수용성발현및접힘에있어서필요한인터날린단백질의 N-말단을의미하며알파나선형캡핑모티프 (capping motif) 및인터날린단백질의반복모듈을의미한다. 인터날린단백질의 N-말단은단백질의수용성발현및접힘에있어서필요한인터날린단백질의 N-말단은제한없이포함되나, 그예로알파나선형캡핑모티프인 " ETITVSTPIKQIFPDDAFAETIKANLKKKSVTDAVTQNE" 및반복모듈을포함할수있다. 바람직하게반복모듈패턴은 "LxxLxxLxLxxN" 을포함할수있다. 상기반복모듈패턴중 L은알라닌, 글리신, 페닐알라닌, 티로신, 루이신, 이소루이신, 발린또는트립토판 ; N은아스파라진, 글루타민, 세린, 시스테인또는트레오닌, x는친수성아미노산을의미한다. 인터날린단백질의 N-말단은서열번호 13일수있으나, 융합될수있는 LRR 패밀리단백질의종류에따라높은구조유사도를갖는 N-말단이선택될수있으며결합에너지등의계산을통해가장안정적인아미노산을선택하여해당모듈의아미노산의변이가가능하다. 본발명에서용어, "LRR (Leucine rich repeat) 패밀리단백질 " 은루이신이일정한위치에반복되는모듈의조합으로이루어진단백질을의미하는것으로, (i) 하나이상의 LRR 반복모듈을갖고있고, (ii) 상기 LRR 반복모듈은 20 내지 30개의아미노산으로이루어져있고, (iii) LRR 반복모듈은보존패턴으로 "LxxLxxLxLxxN" 을갖고있으며, 여기서 L은알라닌, 글리신, 페닐알라닌, 티로신, 루이신, 이소루이신, 발린및트립토판과같은소수성아미노산을, N은아스파라진, 글루타민, 세린, 시스테인또는쓰레오닌을, x는임의의의미하며, (iv) LRR 패밀리단백질은말발굽과같은삼차원구조를갖는구조를갖고있는단백질을의미한다. 본발명의 LRR 패밀리단백질은이미그서열이알려져있거나, 생체에서새로유도된 mrna나 cdna를이용하여찾아낸것뿐아니라, 컨센서스디자인 (consensus design) 등의설계를통하여자연계에알려지지않은서열을가지면서반복모듈의골격구조가있는변이체를모두포함할수있으며, 이에제한되지는않으나, 그예로가변임파구수용체 (Variable lymphocyte receptor; VLR), 톨유사수용체 (Toll-like receptor; TLR), TV3 단백질, U2A 또는리보뉴클레아제억제제 (Ribonuclease inhibitor; RI) 일수있다. 본발명의일구현예에따르면, 인터날린 B 단백질의 N-말단및 VLR 단백질의융합단백질을제조하여인터날린 N-말단을융합하기이전보다융합이후에생산량이크게향상된것을확인하였다 ( 도 9). 이러한결과는본발명의융합폴리펩타이드가대장균내에서수용성으로과발현될수있음을시사하는결과이다. 바람직한일실시태양으로상기 LRR 패밀리단백질은반복모듈의개수를융합한수용성융합폴리펩타이드가안정적으로발현될수있는개수를제한없이포함할수있으나, 바람직하게는 1개내지 9개일수있으며, LRR 반복모듈의개수는자연계에존재하는것으로알려진것뿐만아니라인위적으로모듈을추가및제거하면서도융합폴리펩타이드의골격구조를유지할수있는것을모두포함할수있다. 본발명의일구현예에따르면인터날린-VLR 융합단백질을반복모듈의개수를증가시키더라도대장균에서수용성으로과량발현되는결과를확인하였다 ( 도 12). 바람직한일실시태양으로상기인터날린단백질의 N-말단및 LRR 패밀리단백질은링커 (linker) 를통해연결될수있으며, 상기링커는융합되는 LRR 패밀리단백질과다른유래의 LRR 패밀리단백질의반복모듈일수있으며, 이에제한되는것은아니나, VLR 반복모듈일수있다. 이는융합된 LRR 패밀리단백질과인터날린단백질의 N-말단간의반복모듈내의아미노산의개수의차이로인하여구조적인안정성이부족하여융합된폴리펩 - 7 -
타이드의대장균등의박테리아에서수용성과량발현이되지않을경우유사한개수의아미노산으로이루어진 반복모듈을갖고있는 LRR 패밀리단백질의 LRR 반복모듈을링커로사용하여안정한구조를형성하여수용성 으로과발현시키기위한것이다. [0016] 본발명에서용어 " 융합폴리펩타이드 ", " 융합단백질 " 및 " 결합단백질 " 은혼용되어사용될수있으며, 이는인터날린단백질의 N-말단및 LRR 패밀리단백질이서로반복모듈간의구조유사도가높은모듈을선정하여융합시킨것으로, 인터날린단백질과 LRR 패밀리단백질의반복모듈간의결합에너지계산을통해가장안정적인서열조합이되도록일부아미노산의변이를추가한융합된폴리펩타이드를포함한다. 융합되어안정적으로대장균에서수용성형태로과량발현될수있는융합된폴리펩타이드는제한없이포함될수있으며, 그예로서열번호 7, 서열번호 8, 서열번호 9, 서열번호 10 또는서열번호 12로기재되는아미노산서열을가지는융합된폴리펩타이드일수있다. [0017] [0018] [0019] [0020] [0021] [0022] [0023] 또하나의양태로서, 본발명은 (a) 인터날린단백질의반복모듈과 LRR 패밀리단백질의반복모듈간의유사도가높은순으로정렬하는단계 ; (b) 상기 (a) 단계의정렬된반복모듈중유사도가높은모듈을선정하는단계 ; (c) 상기 (b) 단계에서선정된모듈중인터날린단백질의반복모듈이 N-말단에위치하고, LRR 패밀리단백질의반복모듈을 C-말단에위치하도록설계하는단계 ; (d) 상기 (c) 단계에서설계된융합폴리펩타이드의결합에너지를계산하여인터날린단백질과 LRR 패밀리단백질의결합부위가안정된최적의융합폴리펩타이드를선정하는단계 ; 및 (e) 상기 (d) 단계에서선정된융합폴리펩타이드에포함된인터날린단백질의반복모듈중표면친수성잔기들을변형시켜서에너지함수값을최소화하는최종서열조합을선정하는단계를포함하는, 수용성융합폴리펩타이드를제조하는방법에관한것이다. 바람직한일실시태양으로상기에서설명한바와같이, 상기 (c) 단계는반복모듈을추가또는제거하는단계를추가로포함할수있으며, 또는인터날린단백질과 LRR 패밀리단백질을링커로연결시키는단계를추가로포함할수있다. 반복모듈및링커는상기에서설명한바와같다. (a) 단계의인터날린단백질의반복모듈과 LRR 패밀리단백질의반복모듈간의구조정렬및 (b) 단계의정렬된반복모듈중유사도가높은모듈을선정하는단계는상기단백질을반복모듈의쌍으로분리하고, 구조의유사성을계산하여 RMSD 등유사도점수가높으면서원하는성질을유지하는쌍을선호하여선택할수있다. 구조의유사도점수는단백질구조간의유사도를계산할수있는공지의프로그램또는직접제작한프로그램등을사용하여선정할수있으며, 그예로이에제한되는것은아니나, TM-align (http://zhang.bioinformatics.ku.edu/tm-align/), CE (http://cl.sdsc.edu/), Mammoth (http://ub.cbm.uam.es/mammoth/pair/index3.php) 또는 DALI (http://ekhidna.biocenter.helsinki.fi/dali_server/start) 등이있다. (c) 단계및 (d) 단계는상기에서선택된모듈의쌍을앞의모듈즉, N-말단은인터날린의서열, 뒤의모듈즉, C-말단은 LRR 패밀리단백질을위치하도록설계하며설계된융합폴리펩타이드의결합에너지를계산하여최적의융합폴리펩타이드의구조를선정하여이러한최종구조모델은모델러 (Modeller, 버전 9v4) 등공지의프로그램을이용하여분자동역학시뮬레이션및에너지안정화과정을반복적으로수행하여선정할수있다. (e) 단계의최종서열조합을선정하는단계는에너지함수값을계산할수있는공지의프로그램을이용하여에너지함수값이가장작은아미노산을선정하여이를표면친수성잔기들에치환시킴으로써최종서열후보로선정한다. 에너지함수값을계산하는프로그램은공지의프로그램을제한없이사용할수있으며, 그예로이에제한되는것은아니나, 로제타디자인 (RosettaDesign), Fold-X, GROMACS 또는 AMBER 등이있다. 또하나의양태로서, 본발명은상기융합폴리펩타이드를코딩하는핵산서열을포함하는벡터에관한것이다. 본발명의용어 " 벡터 " 란적당한숙주세포에서목적단백질을발현할수있는발현벡터로서, 유전자삽입물이발현되도록작동가능하게연결된필수적인조절요소를포함하는유전자작제물을말한다. 재조합벡터와의작동적연결은당해기술분야에서잘알려진유전자재조합기술을이용하여제조할수있으며, 부위-특이적DNA 절단및연결은당해기술분야에서일반적으로알려진효소등을사용한다. 본발명의벡터는프로모터, 오퍼레이터, 개시코돈, 종결코돈, 폴리아데닐화시그널, 인핸서같은발현조절요소외에도막표적화또는분비를위한신호서열또는리더서열을포함할수있으며목적에따라다양하게제조될수있다. 벡터의프로모터는구성적또는유도성일수있다. 또한, 발현벡터는벡터를함유하는숙주세포를선택하기위한선택성마커를포함하고, 복제가능한발현벡터인경우복제기원을포함한다. 벡터는자가복제하거나숙주 DNA에통합될수 - 8 -
있다. [0024] [0025] [0026] [0027] 바람직하게는상기벡터는단백질정제용태그서열을추가로포함할수있으며, 단백질정제용태그서열은이에한정되는것은아니나, 그예로히스티딘-태그서열 (His-tag), 인플루엔자헤마글루티딘단백질로부터유래된에피토프에상응하는 HA-태그및 FLAG-태그일수있으며, 바람직하게는히스티딘-태그서열이다. 본발명에서사용되는벡터는숙주중에서복제가능한것이면특별히한정되지않으며당업계에알려진임의의벡터를이용할수있다. 예컨대플라스미드, 바이러스벡터, 파지입자, 또는간단하게잠재적게놈삽입물일수있다. 벡터는적당한숙주내로형질전환된후, 숙주게놈과무관하게복제되거나숙주게놈내로통합될수있다. 바람직한일실시태양으로상기핵산서열은도입되는숙주세포에서잘발현되도록숙주세포에맞추어코돈최적화된것일수있다. 본발명에서용어 " 코돈최적화 " 는 DNA에의해암호화된폴리펩타이드를변화시키지않고서숙주유기체의전형적인코돈활용을반영하도록상기핵산분자의암호화영역또는유전자내의코돈을변화시키는것을지칭한다. 코돈최적화는공지의기술로수행될수있다. [0028] [0029] 또하나의양태로서, 본발명은상기융합폴리펩타이드를포함하는벡터로형질전환된숙주세포에관한것이다. 본발명에서용어 " 형질전환 " 또는 " 도입 " 은 DNA를숙주로도입하여 DNA가염색체외인자로서또는염색체통합완성에의해복제가능하게되는것을의미한다. 본발명의벡터를형질전환시키는방법은핵산을세포내로도입하는어떤방법도포함되며, 숙주세포에따라당분야에서공지된바와같이적합한표준기술을선택하여수행할수있다. 예를들어, 전기천공법 (electroporation), 인산칼슘 (CaPO 4 ) 침전, 염화칼슘 (CaCl 2 ) 침전, 미세주 입법 (microinjection), 폴리에틸렌글리콜 (PEG) 법, DEAE- 덱스트란법, 양이온리포좀법, 및초산리튬 -DMSO 법등 이있으나, 이에제한되는것은아니다. [0030] 상기숙주세포로는 DNA의도입효율이높고, 도입된 DNA의발현효율이높은숙주를사용하는것이좋은데, 원핵및진핵을포함한모든미생물을사용가능하며, 바람직하게는대장균이나이에제한되는것은아니다. 선택되는대장균은융합되는 LRR 단백질의종류에따라선택가능한데, 예를들어 LRR 단백질의 C-말단이이황화결합을가지고있는종류일경우에이의발현을도와주기위해대장균유전체의관련효소에변형이가해진균주를선정하는것이효율적이다. [0031] 또하나의양태로서, 본발명은 (a) 상기벡터를제조하는단계 ; (b) 제조된벡터를숙주세포에도입하는단계 ; 및 (c) 상기숙주세포로부터융합폴리펩타이드를회수하는단계를포함하는, 수용성및접힘이향상된융합폴리펩타이드를생산하는방법에관한것이다. 바람직한일실시태양으로 (d) 컬럼을이용하여융합폴리펩타이드를정제하는단계를추가적으로포함할수있다. [0032] 또하나의양태로서, 본발명은 (a) 상기벡터를제조하는단계 ; (b) 제조된벡터를숙주세포에도입하는단계 ; 및 (c) 상기숙주세포로부터융합폴리펩타이드를발현하는단계를포함하는, 융합폴리펩타이드의수용성및 접힘을향상시키는방법에관한것이다. [0033] 본발명의일구현예에따르면, 본발명자들은인터날린 B 단백질과 VLR 단백질의반복모듈을정의한후에연속된두개의모듈구조들을모두분리하여인터날린 B 단백질과 VLR 단백질의부분구조라이브러리를제작하였다. 두단백질간의부분구조라이브러리를통해모든구조쌍에대해구조비교를통하여유사도점수가높은쌍으로정렬한후 VLR 단백질자체의서열을더많이포함하고인터날린 B 단백질의서열을더적게포함시킬수있는모듈쌍을최종적인접합위치로선정하였다. 해당반복모듈쌍의중간을기준으로 N-말단방향은인터날린 B 단백질을 C-말단방향은 VLR 단백질의서열을갖는새로운융합단백질을설계하였다 ( 서열번호 5 및 6). 이후좀더안정적으로결합할아미노산을예측하기위해, 결합단백질의서열과원래의인터날린 B 단백질과 VLR 단백질의구조정보를이용하여최종적인융합구조모델은모델러프로그램을이용하여최종구 - 9 -
조모델을선택하였고, 로제타디자인프로그램을이용하여에너지함수값이가장작도록아미노산을변이시킨최종서열후보를정하였다 ( 서열번호 7 및 8). 최종설계된서열을바탕으로 DNA를합성하여대장균의코돈선호도에따라코돈최적화된 DNA 서열을합성하였고발현및정제를위해단백질의 C-말단부위에 6개의히스티딘을붙여서 VLR의 C-말단에포함된이황화결합의형성을돕기위해 Orgami B 대장균에형질전환하여 His-태그를이용하여정제한후생산량을분석한결과인터날린의 N-말단을융합하기이전보다융합이후에생산량이증가한것을확인하였다 ( 도 9). 또한, 인터날린-VLR 융합단백질에있어서, VLR의컨센서스모듈을한개더추가하여제작한융합단백질 ( 서열번호 9 및 10) 을바탕으로제작한 DNA를대장균에서발현시켰을때수용성으로과량발현되는것이유지되는것을확인하였으며 ( 도 12), N-말단부위는 TLR4로부터 C-말단부위는 VLR로부터추출하여융합된하이브리드형태의 TV3 단백질의경우 VLR 반복모듈을링커로사용하였을경우링커를사용하지않을때보다링커가존재할때대장균에서수용성발현이증가하는것을확인하였다 ( 도 14). 이러한결과는본발명의융합폴리펩타이드를코돈최적화로핵산서열을설계하고적합한대장균숙주세포에서발현시킬경우대량으로수용성및접힘이향상된융합폴리펩타이드를생산할수있을뿐아니라융합폴리펩타이드의수용성및접힘을향상시킬수있음을시사하는것이다. [0034] 발명의효과본발명의인터날린단백질의 N-말단및 LRR 패밀리단백질이융합된수용성융합폴리펩타이드를이용하여 LRR 패밀리단백질을수용성형태로대량생산하는방법은기존에생산하기가무척까다로웠던 LRR 패밀리단백질을, 특히대장균등박테리아에서수용성으로많은양의단백질을생산할수있도록만든다. 이와같이본발명은 LRR 패밀리단백질을다량으로확보할수있도록하여 LRR 패밀리단백질을이용한연구개발이나산업적, 의학적활용에큰기여를할수있을것이다. [0035] 도면의간단한설명도 1은장어유래의 VLR 단백질의변형체로가운데반복모듈의개수가 3개인서열번호 1의서열을나타내며, 본발명자들은이를 Eb8VLRB.59로명명하였다. 빨간색은신호서열을노란색은 N-말단을녹색은세개의반복모듈을파란색은 C-말단을검정색은줄기를나타낸다. 도 2는반복모듈을 5개로만든서열번호 2를나타내며, 본발명자들은이를 VLR5n으로명명하였다. 이는서열번호 1을기반으로 N-말단의신호서열부분과 C-말단의줄기서열을제거한것으로밑줄친곳은결합이설계된곳을나타낸다. 도 3은컨센서스설계를통해 5개의반복모듈을가진서열번호 3을나타내며, 본발명자들은이를 VLR5c로명명하였다. 밑줄친곳은컨센서스서열로일정하게반복되는서열을나타낸것으로초록색은반복모듈을나타낸다. 도 4는서열번호 5의인터날린 B 단백질의 N-말단과 VLR5n이융합된 InlB-VLR5n 결합단백질을나타낸것이다. 빨간색은인터날린부분을검정색은 VLR 부분을나타낸다. 도 5는서열번호 6의인터날린 B 단백질의 N-말단과 VLR5c가융합된 InlB-VLR5c 결합단백질을나타낸것이다. 빨간색은인터날린부분을검정색은 VLR 부분을나타낸다. 도 6은서열번호 5의 InlB-VLR5n에대해서로제타 (Rossetta) 디자인프로그램을통해재설계된서열번호 7의 InlB-VLR5n-Rosseta 결합단백질을나타낸것이다. 밑줄친부분은로제타계산을통해변형된아미노산을나타낸다. 도 7은서열번호 6의 InlB-VLR5c에대해서로제타디자인프로그램을통해재설계된서열번호 8의 InlB-VLR5c- Roseeta 결합단백질을나타낸것이다. 밑줄친부분은로제타계산을통해변형된아미노산을나타낸다. 도 8은본발명의 LRR 단백질을대장균에서생산하기위해인터날린 B 단백질을융합시키는방법을모식적으로나타낸그림이다. 도 9는본발명에의해설계된인터날린이융합된 VLR 단백질이융합되지않은 VLR 단백질에비해생산량이증가한것을보여주는폴리아크릴아미드전기영동사진이다. 벡터는 pet21a를사용하여숙주세포로 Origami B를 - 10 -
사용하여 5ml LB 배지에서키운후, IPTG ( 최종 0.5mM) 로단백질발현을유도하고 Ni-NTA 레진을이용하여정제한결과단백질을발현하여정제하기전후를비교하였을때각각확연한발현량의차이를보여준다. 1: 사이즈마커, 2: InlB-VLR5n ( 정제전 ), 3: InlB-VLR5c ( 정제전 ), 4: VLR5n ( 정제전 ), 5: VLR5c ( 정제전 ), 6: 사이즈마커, 7: VLR5n ( 정제후 ), 8: VLR5c ( 정제후 ), 9: InlB-VLR5n ( 정제후 ), 10: InlB-VLR5c ( 정제후 ), 11: 사이즈마커. 도 10은서열번호 7의 InlB-VLR5n-Rosseta를바탕으로인터날린다음부분에 VLR의컨센서스모듈을하나추가한서열번호 9의 InlB-VLR6n을나타낸것이다. 빨간색은인터날린을, 파란색은추가한모듈을, 검정색은 VLR 부분을나타낸다. 도 11은서열번호 8의 InlB-VLR5c-Rosseta를바탕으로인터날린다음부분에 VLR의컨센서스모듈을하나추가한서열번호 10의 InlB-VLR6c를나타낸것이다. 빨간색은인터날린을, 파란색은추가한모듈을, 검정색은 VLR 부분을나타낸다. 도 12는본발명에의해설계된인터날린이융합된 VLR 단백질의반복모듈을하나증가시켰을때발현량을보여주는폴리아크릴아미드전기영동사진이다. (a) 는 InlB-VLR6n을 (b) 는 InlB-VLR6c 융합단백질의발현량을나타낸다. 발현을유도하지않은세포 (1) 및발현을유도한세포 (2) 의전체단백질의비교로발현이얼마나되는지확인할수있으며, 불수용성단백질 (3) 및수용성단백질 (5) 의비교로수용성단백질이얼마나발현되는지확인할수있으며, 수용성으로과량발현되는것이유지됨을확인할수있다. 각각 1: 발현유도하지않은세포의전체단백질, 2: 발현유도한세포의전체단백질, 3: 불수용성단백질, 4: 사이즈마커, 5: 수용성단백질, 6 내지 8: 단백질정제후분획. 도 13은본발명에의해설계된인터날린이 VLR을링커로사용하여융합된융합단백질이기존단백질에비해수용성단백질발현량이증가한것을보여주는폴리아크릴아미드전기영동사진이다. (a) 1: TV3 불수용성부분-발현유도않은것, 2: TV3 불수용성부분-발현유도한것, 3: TV3 수용성부분-발현유도않은것, 4: TV3 수용성부분-발현유도한것, 5: 사이즈마커 ; (b) 1: 사이즈마커, 2: InlB_TV3 불수용성부분-발현유도않은것, 3: InlB_TV3 불수용성부분-발현유도한것, 4: InlB_TV3 수용성부분-발현유도않은것, 5: InlB_TV3 수용성부분-발현유도한것 ; (c) 1: 사이즈마커, 2: InlB_VLR_TV3 불수용성부분-발현유도않은것, 3: InlB_VLR_TV3 불수용성부분-발현유도한것, 4: InlB_VLR_TV3 수용성부분-발현유도않은것, 5: InlB_VLR_TV3 수용성부분-발현유도한것. [0036] 발명을실시하기위한구체적인내용이하실시예를통하여본발명을더욱상세하게설명하기로한다. 이들실시예는단지본발명을예시하기위한것으로, 본발명의범위가이들실시예에의해제한되는것으로해석되지는않으며다양한응용및수정이가능하다. [0037] [0038] [0039] [0040] 실시예 1: 인터날린단백질 N-말단및 VLR 단백질의융합단백질의제조및대장균에서과량발현확인 <1-1> 인터날린단백질 N-말단및 VLR 단백질의융합단백질 ( 인터날린-VLR 융합단백질 ) 의설계및제조발명의구성요소로서리스테리아 (Listeria monocytogenes) 유래의인터날린 B 단백질과장어유래의 VLR 단백질의변형체를이용하였다. VLR 단백질은가운데반복모듈의개수가 3개인 Eb8VLRB.59 ( 서열번호 1 및도 1) 를기반으로우선 N-말단중에신호서열 (signal sequence) 부분과 C-말단의줄기 (stalk) 부분을제거하고, 자연계에존재하는것으로알려진다른모듈서열을두개첨가하여반복모듈의개수를 5개 ( 서열번호 2 및도 2) 로만들었다. 이와같이, 모듈의개수를늘린것은모듈조절의가능성을확인하기위한목적이포함된다. 또다른골격으로는수많은 VLR 단백질의서열들중에서진화적으로반복모듈에유지되는아미노산을골라내는컨센서스 (consensus) 설계를통해 5개의반복모듈을가진단백질을설계하였다 ( 서열번호 3 및도 3). 이때, N-말단과 C-말단은상기에서제조한반복모듈의개수가 5개인것 ( 서열번호 2 및도 2) 을이용하였다. 서열번호 3에나타낸바와같이하나의모듈안에존재하는 24개의아미노산중에서 18개는진화적으로보존된서열로고정하였고, 나머지 6개의부분만진화적인보존도에따라다양한아미노산을배정하였다. 두골격서열은추가적으로다른단백질과결합을하도록 15 개의아미노산을변형하였다 ( 도 2의서열번호 2에서밑줄친곳과동일한부분이아미노산의변형부분을나타내는것이며, 각서열번호 3 내지 7에서도동일한위치이다 ). - 11 -
[0041] [0042] 인터날린 B 단백질의 N-말단을 VLR 단백질에결합시키기위해서우선적으로가장적합한결합자리를찾았다. 두단백질이모두루이신풍부단백질이지만각모듈의길이가다르고그에따른구조를안정화시키는반복모듈패턴의차이가있기때문에, 이를최소화할수있는방향으로결합자리를찾는방법을개발하였다. 일단, 각단백질들의반복모듈을정의한후에연속된두개의모듈구조들을모두분리하여루이신풍부단백질의부분구조라이브러리를만들었다. N-말단과 C-말단을제외한내부의반복모듈만을고려했을때인터날린 B 단백질의경우 7개의반복모듈에서 6개의모듈쌍이, VLR 단백질의경우 5개의반복모듈과 1개의 VLRe 모듈까지총 6개의모듈에서 5개의모듈쌍의부분구조를만들었다. VLRe 모듈은엄밀히말하면 C-말단의구성요소이지만, 앞의반복모듈과같은 24개의아미노산을가진반복서열을어느정도유지하고있어융합후보로함께계산하였다. 각모듈쌍들은 N-말단에서부터의순서에따라각각 Inl1 ~ Inl6, VLRn1 ~ VLRn5 및 VLRc1 ~ VLRc5 로구분하였다. 이렇게구성된두단백질의부분구조라이브러리를통해모든부분구조쌍에대해구조비교 ( 총 30 쌍 ) 를통하여가장유사도가높은것을찾았고이쌍을기준으로결합을진행하였다. 예를들어, 하기표 1과같이후보로선택된모듈쌍으로는 Inl4와 VLRn5 쌍이유사도점수 (Alignment score) 20으로가장높은값을가졌다. 이때부분구조사이의유사도는단백질의안정성을유지하는소수성잔기들을먼저구조정렬하고나머지서열들을맞춘뒤, 짝지어진아미노산들의진화적인연관성 (BLOSUM62) 을점수로환산하여정의하였다. 이와같이, 유사도에의해정렬된모듈쌍들중에서 VLR 단백질자체의서열을더많이포함하고인터날린단백질의서열을더적게포함시킬수있는인터날린 2와 VLR 1 모듈쌍을최종적인접합위치로정하였다. 이는융합의목적이기존 LRR의성질을최대한유지하면서발현량을늘리는것이기때문이다. 표 1 [0043] < 인터날린단백질과 VLR 단백질모듈간의유사도분석 > InlB VLRn 유사도점수 InlB VLRc 유사도점수 4 5 20 2 2 23 5 3 18 2 1 18 6 3 15 4 5 12 6 4 14 5 3 11 2 1 13 6 4 11 2 2 12 1 1 10 5 1 12 6 3 9 [0044] 이렇게찾은부분구조쌍은인터날린 B 단백질과 VLR 단백질사이의가장유사한연속반복모듈쌍으로판단할수있기때문에이모듈쌍을기준으로두개의단백질을구조정렬하여맞춘뒤, 해당반복모듈쌍의중간을기준으로왼쪽 (N-말단방향 ) 은인터날린 B 단백질의, 오른쪽 (C-말단방향 ) 은 VLR 단백질의서열을갖는새로운결합단백질을설계하였다 ( 서열번호 5 및 6, 및도 4 및 5). [0045] 좀더안정적으로결합할아미노산을예측하기위해, 결합단백질의서열과원래의인터날린 B 및 VLR 단백질의구조정보를이용하여최종적인융합구조모델을모델러 (Modeller, 버전 9v4) 프로그램을이용하여보다정확하게만들었다. 이과정에서는우선모델러프로그램의자동모델 (automodel) 함수를이용하여초기구조모델을만들었다. 그리고이초기구조를최적화하기위해분자동역학시뮬레이션과에너지안정화과정을반복적으로수행했다 ( 모델러에서제공하는 slow_large 최적화프로토콜이용 ). 이과정을통해인터날린 B 단백질과 VLR 단백질사이의결합부위를안정하게연결시켜주는최종구조모델을찾았다. 또한서로다른단백질의접합부위에위치하는인터날린 B 단백질의모듈은바로옆에위치하는 VLR 단백질모듈과의상호작용을고려하여서열을재설계하였다. 재설계과정은 12개의적합한아미노산위치를선정하여로제타디자인 (Rosetta Design) 프로그램을통하여진행을하였다. 12개의아미노산위치는단백질의안정성에기여하는소수성잔기들과진화적보존성이높은잔기들은고정시키고나머지단백질표면쪽의친수성잔기들에대해서만변이를수행을하였다. 변이된위치는인터날린 B 단백질의모듈패턴 (LPxLxxLxLxxNxIxDIxxLxx) 중 x 부분에해당된다. 로제타디자인프로그램의서열설계과정에서는단백질의백본 (backbone) 은고정시키고 (fixed backbone model) 각측쇄 (side chain) 의로타머 (rotamer) 검색을최적화 (MC minimization for each rotamer search) 시키면서적절한서열조합을찾게된다. 이과정에서 100번의독립적인시행을통해서 100개의서열후보를 - 12 -
찾았고, 이중에서가장에너지함수값이작은것을최종서열후보로정하였다 ( 서열번호 7 및서열번호 8, 도 6 및 7). 이와같은인터날린 N- 말단과 VLR 의최종융합모델을설계하는방법에대한대략적인모식도를 도 8 에나타냈다. [0046] [0047] <1-2> 대장균에서수용성융합단백질의대량발현확인상기실시예 <1-1> 에서최종설계된아미노산서열 ( 서열번호 7 및서열번호 8, 도 6 및 7) 을바탕으로 DNA를합성하였다. DNA 서열은기존의리스테리아나장어의 DNA 서열을따르지않고, 대장균의코돈선호도에따라새롭게 DNA 서열을설계하여합성하였다. 합성된 DNA는발현과정제를쉽게하기위해단백질의 C-말단부위에 6개의히스티딘을붙이는 pet21a 벡터 (Qiagen) 로옮겨서클로닝하였다. 클로닝된벡터는 VLR의 C-말단에포함된이황결합의형성을돕기위해 Origami B (Novagen) 대장균에형질전환하였다. 상기벡터가형질전환된대장균을흡광도 (OD 600 ) 0.5가될때까지키운후, IPTG (Isopropyl β-d-1-thiogalactopyranoside) 를최종 0.5mM 농도가되도록넣고, 18 에서 20시간동안배양하여인터날린-VLR 융합단백질을생산하도록하였다. 20시간후에세포를깨고세포안에서생산된인터날린-VLR 융합단백질의양을비교확인하였다. 생산량이적은원래의단백질은단백질끝에붙은 His-tag를이용하여 Ni-NTA 레진을통해정제하여농축후생산량을분석하였다. [0048] 그결과, 도 9에나타낸것처럼인터날린의 N-말단을융합하기이전보다융합이후에생산량이크게증가한것을알수있었다. 인터날린융합후생산량은 100ml 배양시 10mg 정도였다. 이러한결과는본발명의방법에의해인터날린을융합시킨 LRR 단백질의경우수용성단백질을과량으로발현시킬수있다는것을시사하는점이다. [0049] [0050] [0051] [0052] 실시예2: 인터날린-VLR 융합단백질에반복모듈을추가한단백질의설계및발현확인 <2-1> 인터날린-VRL 융합단백질에반복모듈을추가한단백질의설계인터날린-VLR 융합단백질을다양한종류및크기의질병타깃단백질에대한결합단백질로이용하려면결합면적을조절하기위해반복모듈의개수를증감하는것이필요하다. 이에반복모듈을추가하여결합면적을넓게하는변이를단백질에가했을때도인터날린 N-말단이 VLR 단백질을안정하게발현시키는지확인하기위한반복모듈을하나추가한단백질을설계하는실험을수행하였다. 상기실시예 <1-1> 에서제조한인터날린이융합된골격구조인서열번호 7과서열번호 8을바탕으로인터날린다음부분에 VLR의컨센서스모듈을하나씩추가하여서열번호 9와서열번호 10을설계하였다 ( 도 10 및 11). [0053] [0054] [0055] <2-2> 대장균에서반복모듈을추가한융합단백질의수용성대량발현확인상기실시예 <1-1> 에서제조한서열번호 9 및 10을바탕으로 DNA를합성하여실시예 <1-2> 과동일한방법으로대장균에서발현시켰다. 그결과, 수용성으로과량발현되는것이유지되는것을확인하였다 ( 도 12). 생산량은 1L 배양시 20mg 정도였다. 이와같은결과는본발명의융합단백질에 VLR의반복모듈을증가시켜도과량발현에영향이없음을시사하는결과이며, 이는본발명의융합단백질및그생산방법으로다양한질병의타겟단백질에결합하는다양한치료제의개발이가능하다는것을나타낸다. [0056] [0057] [0058] 실시예3: TV3 단백질에인터날린의 N-말단을융합한융합단백질의설계및대장균에서수용성발현확인 <3-1> 인터날린 N-말단및 TV3 단백질의융합단백질의설계인터날린의 N-말단이다른 LRR 패밀리단백질에공통적으로적용가능한지를확인하기위해 TV3 단백질에인터날린 N-말단을융합시킨융합단백질을설계하였다. TV3 단백질은 LRR 단백질의일종인톨유사수용체-4 (TLR 4) 의단백질구조를밝히기위해융합되어만들어진단백질로서, N-말단부위는 TLR4로부터 C-말단부위는 VLR 로부터추출하여융합된구조로이루어진단백질이다. 이단백질은곤충세포에서발현되어단백질의 3차구조를 - 13 -
얻는데이용되었으나, 생산량이적어응용하기에어려움이있으며, 대장균등에서는불용성인상태로만얻어지 고있는단백질이다. [0059] [0060] [0061] 본발명자들은인터날린단백질의 N-말단과 TV3 연결부위를더욱잘이어주기위해링커모듈을사용하는방법을개발하기위한실험을수행하였다. TV3 단백질의반복모듈은 24개또는그이상의아미노산으로이루어져있는데반해인터날린단백질의반복모듈은 22개의아미노산으로이루어져있다. 따라서두개의반복모듈은단백질안정성을유지하는소수성아미노산들의위치에차이가있고이차이는안정된단백질생산에방해가될수있다. 이문제를극복하기위해상기실시예 <1-1> 의방법으로설계한인터날린과 VLR 융합단백질을이용하였다. VLR 단백질의경우 TV3 단백질과비슷하게반복모듈의개수가 24개이며인터날린단백질과결합하여발현이잘되었으므로이결합의경우구조적안정성이높다고판단하였다. 따라서 VLR 단백질모듈을하나더포함한인터날린 N-말단서열을 TV3 N-말단부분의반복모듈 (24개) 에결합하는설계를시도하였다. 이와같은방법을통해, 서로크기가다른반복모듈들을결합시키는데있어서구조적인안정성을유지하고융합단백질의발현량을증가시키는효과를기대하였다. 이를위해상기실시예 <1-1> 의방법으로설계한인터날린단백질과 VLR 융합단백질서열 ( 서열번호 8, 도 7) 로부터인터날린의 N-말단서열과바로옆에연결되어있는 VLR 단백질의반복모듈서열 (24개아미노산 ) 까지와 TV3 단백질의원래의서열을최대한유지하면서 VLR 단백질의반복모듈과같은크기 (24개아미노산 ) 를갖는부분이결합하도록결정하였다. 즉 TV3 단백질의 53-100 부분을상기실시예 <1-1> 에서와같은연속된두개의부분구조로정하였고이를인터날린과 VLR 융합구조의정해진결합위치에구조정렬을하여결합구조초기모델을만들었다. 이렇게정렬된위치로부터왼쪽 (N-말단) 은인터날린-VLR ( 모듈 1개 ) 을오른쪽 (C-말단) 은 TV3 (76-끝) 의서열을이용하여새로운서열을설계하였고, 상기실시예 <1-1> 과같은과정을통해안정된구조모델을모델러프로그램을통해얻었다. 또한서열최적화과정으로결합부위의서열중컨센서스정보와일치하지않는부분의아미노산은컨센서스서열로치환하였다. 즉, 컨센서스정보는진화적으로유사한서열검색을통해해당위치에진화적으로보존되어가장많이나타나는아미노산정보를담고있고, 이를근거로단백질안정성에관여하는소수성아미노산들을컨센서스서열로치환하여주었다 ( 서열번호 12, 도 13, 밑줄부분은치환된부분을나타냄 ). 이과정에서는상기실시예 <1-1> 과같이로제타디자인프로그램을이용하여친수성잔기들에대한최적화는수행하지않았고컨센서스정보만을이용하였다. 이와같이융합단백질중간에들어간하나의 VLR 단백질의반복모듈은링커 (linker) 로작용하며, 이는인터날린단백질의 N-말단과 TV3 단백질사이를구조의흐트러짐없이이어주는역할을한다. 이로써, 링커단백질로연결된인터날린 N-말단과융합된 LRR 단백질을설계하였다. [0062] [0063] [0064] <3-2> 인터날린 N-말단및 TV3 단백질간의링커모듈을이용한융합단백질의대장균에서의수용성발현확인 TV3의 DNA 서열은대장균에부족한 t-rna에대한코돈을가지고있으므로, 이에해당하는 trna 등을보충해줄 Rosetta gami B (Novagen) 대장균을이용하여단백질을발현시켰다. 발현을위한방법은상기실시예 <1-2> 와동일하며대장균만이 Rosetta gami B (Novagen) 로상이하다. 그결과, 인터날린을융합하기이전과는달리수용성부분에단백질이생산되는것을확인하였다 ( 도 14). 기존에수용성단백질이전혀발현되지않던것에비해많은개선이있었으며, 1L 배양액에서 6mg 정도의순수한단백질을얻어낼수있었다. 중간에들어간하나의 VLR 단백질의반복모듈은링커로작용하여인터날린단백질의 N-말단과 TV3 단백질사이를구조의흐트러짐없이이어주는데중요한역할을하며, 이러한링커가없을경우에는인터날린-TV3 융합단백질은수용성으로발현되지않는다는것도도 4를통해알수있었다. 이러한결과는링커를연결하는방법을사용한융합단백질의설계에의해수용성단백질을대량생산할수있는가능성이있음을시사하는것이다. - 14 -
도면 도면 1 도면 2 도면 3-15 -
도면 4 도면 5-16 -
도면 6 도면 7-17 -
도면 8-18 -
도면 9 도면 10-19 -
도면 11 도면 12-20 -
도면 13 도면 14 서열목록 <110> Korea Advanced Institute of Science and Technology <120> Internalin-fused soluble Leucin-Rich Repeat (LRR) family proteins and method for preparing the same <130> PA090519/KR <160> 13 <170> KopatentIn 1.71 <210> 1 <211> 305 <212> PRT <213> Artificial Sequence <220><223> EB8VLRB.59 <400> 1 Met Lys Phe Ala Leu Arg Gly Thr Cys Val Leu Leu Ala Leu Leu Leu - 21 -
1 5 10 15 Cys Cys Arg Asn Gly Lys Ala Cys Pro Ser Arg Cys Ser Cys Ser Gly 20 25 30 Thr Thr Val Glu Cys Tyr Ser Gln Gly Arg Thr Ser Val Pro Thr Gly 35 40 45 Ile Pro Ala Gln Thr Thr Tyr Leu Asp Leu Glu Thr Asn Ser Leu Lys 50 55 60 Ser Leu Pro Asn Gly Val Phe Asp Glu Leu Thr Ser Leu Thr Gln Leu 65 70 75 80 Tyr Leu Gly Gly Asn Lys Leu Gln Ser Leu Pro Asn Gly Val Phe Asn 85 90 95 Lys Leu Thr Ser Leu Thr Tyr Leu Asn Leu Ser Thr Asn Gln Leu Gln 100 105 110 Ser Leu Pro Asn Gly Val Phe Asp Lys Leu Thr Gln Leu Lys Glu Leu 115 120 125 Ala Leu Asn Thr Asn Gln Leu Gln Ser Leu Pro Asp Gly Val Phe Asp 130 135 140 Lys Leu Thr Gln Leu Lys Asp Leu Arg Leu Tyr Gln Asn Gln Leu Lys 145 150 155 160 Ser Val Pro Asp Gly Val Phe Asp Arg Leu Thr Ser Leu Gln Tyr Ile 165 170 175 Trp Leu His Asp Asn Pro Trp Asp Cys Thr Cys Pro Gly Ile Arg Tyr 180 185 190 Leu Ser Glu Trp Ile Asn Lys His Ser Gly Val Val Arg Asn Ser Ala 195 200 205 Gly Ser Val Ala Pro Asp Ser Ala Lys Cys Ser Gly Ser Gly Lys Pro 210 215 220 Val Arg Ser Ile Ile Cys Pro Thr Thr Thr Thr Thr Thr Thr Thr Thr 225 230 235 240 Thr Met Pro Thr Thr Thr Thr Leu Pro Thr Thr Thr Lys Met Ser Met 245 250 255-22 -
Val Lys Val Pro Leu Val Pro Pro Glu Ala Phe Gly Arg Val Met Asn 260 265 270 Ala Cys Ala Tyr Phe Pro Ser Tyr Ile Phe Leu His Leu Val His Gly 275 280 285 Leu Ala Ala Val Pro Leu Val Tyr Leu Ile Cys His Ala Ser Gln Leu 290 295 300 Leu 305 <210> 2 <211> 259 <212> PRT <213> Artificial Sequence <220><223> VLR5n <400> 2 Lys Ala Cys Pro Ser Arg Cys Ser Cys Ser Gly Thr Thr Val Glu Cys 1 5 10 15 Tyr Ser Gln Gly Arg Thr Ser Val Pro Thr Gly Ile Pro Ala Gln Thr 20 25 30 Thr Tyr Leu Asp Leu Glu Thr Asn Ser Leu Lys Ser Leu Pro Asn Gly 35 40 45 Val Phe Asp Glu Leu Thr Ser Leu Thr Gln Leu Asp Leu Ser Arg Asn 50 55 60 Lys Leu Gln Ser Leu Pro Asn Gly Val Phe Asn Lys Leu Thr Ser Leu 65 70 75 80 Thr Tyr Leu Ile Leu Thr Gly Asn Gln Leu Gln Ser Leu Pro Asn Gly 85 90 95 Val Phe Asp Lys Leu Thr Gln Leu Lys Glu Leu Val Leu Val Glu Asn 100 105 110 Gln Leu Gln Ser Leu Pro Asp Gly Val Phe Asp Lys Leu Thr Lys Leu 115 120 125 Thr Tyr Leu Asn Leu Ala His Asn Glu Leu Gln Ser Leu Pro Lys Gly 130 135 140-23 -
Val Phe Asp Lys Leu Thr Ser Leu Lys Glu Leu Asp Leu Ser Tyr Asn 145 150 155 160 Gln Leu Lys Arg Val Pro Glu Gly Ala Phe Asp Lys Leu Thr Gln Leu 165 170 175 Lys Asp Leu Arg Leu Tyr Gln Asn Gln Leu Lys Ser Val Pro Asp Gly 180 185 190 Val Phe Asp Arg Leu Thr Ser Leu Gln Tyr Ile Trp Leu His Asp Asn 195 200 205 Pro Trp Asp Cys Thr Cys Pro Gly Ile Arg Tyr Leu Ser Glu Trp Ile 210 215 220 Asn Lys His Ser Gly Val Val Arg Asn Ser Ala Gly Ser Val Ala Pro 225 230 235 240 Asp Ser Ala Lys Cys Ser Gly Ser Gly Lys Pro Val Arg Ser Ile Ile 245 250 255 Cys Pro Thr <210> 3 <211> 266 <212> PRT <213> Artificial Sequence <220><223> VLR5c <400> 3 Thr Thr Asp Pro Lys Ala Cys Pro Ser Arg Cys Ser Cys Ser Gly Thr 1 5 10 15 Thr Val Glu Cys Tyr Ser Gln Gly Arg Thr Ser Val Pro Thr Gly Ile 20 25 30 Pro Ala Gln Thr Thr Tyr Leu Asp Leu Glu Thr Asn Ser Leu Lys Ser 35 40 45 Leu Pro Asn Gly Val Phe Asp Glu Leu Thr Asn Leu Thr Gln Leu Asp 50 55 60 Leu Ser Arg Asn Gln Leu Gln Ser Leu Pro Asn Gly Val Phe Asp Lys 65 70 75 80-24 -
Leu Thr Asn Leu Thr Tyr Leu Ile Leu Thr Gly Asn Gln Leu Gln Ser 85 90 95 Leu Pro Asn Gly Val Phe Asp Lys Leu Thr Asn Leu Lys Glu Leu Val 100 105 110 Leu Val Glu Asn Gln Leu Gln Ser Leu Pro Asp Gly Val Phe Asp Lys 115 120 125 Leu Thr Asn Leu Thr Tyr Leu Asn Leu Ala His Asn Gln Leu Gln Ser 130 135 140 Leu Pro Lys Gly Val Phe Asp Lys Leu Thr Asn Leu Thr Glu Leu Asp 145 150 155 160 Leu Ser Tyr Asn Gln Leu Gln Ser Leu Pro Glu Gly Val Phe Asp Lys 165 170 175 Leu Thr Gln Leu Lys Asp Leu Arg Leu Tyr Gln Asn Gln Leu Lys Ser 180 185 190 Val Pro Asp Gly Val Phe Asp Arg Leu Thr Ser Leu Gln Tyr Ile Trp 195 200 205 Leu His Asp Asn Pro Trp Asp Cys Thr Cys Pro Gly Ile Arg Tyr Leu 210 215 220 Ser Glu Trp Ile Asn Lys His Ser Gly Val Val Arg Asn Ser Ala Gly 225 230 235 240 Ser Val Ala Pro Asp Ser Ala Lys Cys Ser Gly Ser Gly Lys Pro Val 245 250 255 Arg Ser Ile Ile Cys Pro Thr Leu Glu Val 260 265 <210> 4 <211> 207 <212> PRT <213> Internalin B (InlB) derived from Listeria monocytogenes <400> 4 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15 Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr - 25 -
20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Asn 50 55 60 Val Thr Lys Leu Phe Leu Asn Gly Asn Lys Leu Thr Asp Ile Lys Pro 65 70 75 80 Leu Thr Asn Leu Lys Asn Leu Gly Trp Leu Phe Leu Asp Glu Asn Lys 85 90 95 Ile Lys Asp Leu Ser Ser Leu Lys Asp Leu Lys Lys Leu Lys Ser Leu 100 105 110 Ser Leu Glu His Asn Gly Ile Ser Asp Ile Asn Gly Leu Val His Leu 115 120 125 Pro Gln Leu Glu Ser Leu Tyr Leu Gly Asn Asn Lys Ile Thr Asp Ile 130 135 140 Thr Val Leu Ser Arg Leu Thr Lys Leu Asp Thr Leu Ser Leu Glu Asp 145 150 155 160 Asn Gln Ile Ser Asp Ile Val Pro Leu Ala Gly Leu Thr Lys Leu Gln 165 170 175 Asn Leu Tyr Leu Ser Lys Asn His Ile Ser Asp Leu Arg Ala Leu Ala 180 185 190 Gly Leu Lys Asn Leu Asp Val Leu Glu Leu Phe Ser Gln Glu Cys 195 200 205 <210> 5 <211> 269 <212> PRT <213> Artificial Sequence <220><223> Fused polypeptide for InlB-VLR5n <400> 5 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15 Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr - 26 -
20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Asn 50 55 60 Val Thr Lys Leu Phe Leu Asn Gly Asn Lys Leu Thr Asp Ile Lys Pro 65 70 75 80 Leu Thr Asn Leu Thr Ser Leu Thr Tyr Leu Ile Leu Thr Gly Asn Gln 85 90 95 Leu Gln Ser Leu Pro Asn Gly Val Phe Asp Lys Leu Thr Gln Leu Lys 100 105 110 Glu Leu Val Leu Val Glu Asn Gln Leu Gln Ser Leu Pro Asp Gly Val 115 120 125 Phe Asp Lys Leu Thr Lys Leu Thr Tyr Leu Asn Leu Ala His Asn Glu 130 135 140 Leu Gln Ser Leu Pro Lys Gly Val Phe Asp Lys Leu Thr Ser Leu Lys 145 150 155 160 Glu Leu Asp Leu Ser Tyr Asn Gln Leu Lys Arg Val Pro Glu Gly Ala 165 170 175 Phe Asp Lys Leu Thr Gln Leu Lys Asp Leu Arg Leu Tyr Gln Asn Gln 180 185 190 Leu Lys Ser Val Pro Asp Gly Val Phe Asp Arg Leu Thr Ser Leu Gln 195 200 205 Tyr Ile Trp Leu His Asp Asn Pro Trp Asp Cys Thr Cys Pro Gly Ile 210 215 220 Arg Tyr Leu Ser Glu Trp Ile Asn Lys His Ser Gly Val Val Arg Asn 225 230 235 240 Ser Ala Gly Ser Val Ala Pro Asp Ser Ala Lys Cys Ser Gly Ser Gly 245 250 255 Lys Pro Val Arg Ser Ile Ile Cys Pro Thr Leu Glu Val 260 265-27 -
<210> 6 <211> 269 <212> PRT <213> Artificial Sequence <220><223> Fused polypeptide for InlB-VLR5c <400> 6 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15 Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr 20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Asn 50 55 60 Val Thr Lys Leu Phe Leu Asn Gly Asn Lys Leu Thr Asp Ile Lys Pro 65 70 75 80 Leu Thr Asn Leu Thr Asn Leu Thr Tyr Leu Ile Leu Thr Gly Asn Gln 85 90 95 Leu Gln Ser Leu Pro Asn Gly Val Phe Asp Lys Leu Thr Asn Leu Lys 100 105 110 Glu Leu Val Leu Val Glu Asn Gln Leu Gln Ser Leu Pro Asp Gly Val 115 120 125 Phe Asp Lys Leu Thr Asn Leu Thr Tyr Leu Asn Leu Ala His Asn Gln 130 135 140 Leu Gln Ser Leu Pro Lys Gly Val Phe Asp Lys Leu Thr Asn Leu Thr 145 150 155 160 Glu Leu Asp Leu Ser Tyr Asn Gln Leu Gln Ser Leu Pro Glu Gly Val 165 170 175 Phe Asp Lys Leu Thr Gln Leu Lys Asp Leu Arg Leu Tyr Gln Asn Gln 180 185 190 Leu Lys Ser Val Pro Asp Gly Val Phe Asp Arg Leu Thr Ser Leu Gln 195 200 205-28 -
Tyr Ile Trp Leu His Asp Asn Pro Trp Asp Cys Thr Cys Pro Gly Ile 210 215 220 Arg Tyr Leu Ser Glu Trp Ile Asn Lys His Ser Gly Val Val Arg Asn 225 230 235 240 Ser Ala Gly Ser Val Ala Pro Asp Ser Ala Lys Cys Ser Gly Ser Gly 245 250 255 Lys Pro Val Arg Ser Ile Ile Cys Pro Thr Leu Glu Val 260 265 <210> 7 <211> 269 <212> PRT <213> Artificial Sequence <220><223> fused polypeptide for InlB-VLR5n-Rosetta <400> 7 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15 Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr 20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Asn 50 55 60 Val Lys Tyr Leu Arg Leu Gly Gly Asn Asn Leu Arg Asp Ile Ser Ala 65 70 75 80 Leu Glu Lys Leu Thr Ser Leu Thr Tyr Leu Ile Leu Thr Gly Asn Gln 85 90 95 Leu Gln Ser Leu Pro Asn Gly Val Phe Asp Lys Leu Thr Gln Leu Lys 100 105 110 Glu Leu Val Leu Val Glu Asn Gln Leu Gln Ser Leu Pro Asp Gly Val 115 120 125 Phe Asp Lys Leu Thr Lys Leu Thr Tyr Leu Asn Leu Ala His Asn Glu 130 135 140-29 -
Leu Gln Ser Leu Pro Lys Gly Val Phe Asp Lys Leu Thr Ser Leu Lys 145 150 155 160 Glu Leu Asp Leu Ser Tyr Asn Gln Leu Lys Arg Val Pro Glu Gly Ala 165 170 175 Phe Asp Lys Leu Thr Gln Leu Lys Asp Leu Arg Leu Tyr Gln Asn Gln 180 185 190 Leu Lys Ser Val Pro Asp Gly Val Phe Asp Arg Leu Thr Ser Leu Gln 195 200 205 Tyr Ile Trp Leu His Asp Asn Pro Trp Asp Cys Thr Cys Pro Gly Ile 210 215 220 Arg Tyr Leu Ser Glu Trp Ile Asn Lys His Ser Gly Val Val Arg Asn 225 230 235 240 Ser Ala Gly Ser Val Ala Pro Asp Ser Ala Lys Cys Ser Gly Ser Gly 245 250 255 Lys Pro Val Arg Ser Ile Ile Cys Pro Thr Leu Glu Val 260 265 <210> 8 <211> 269 <212> PRT <213> Artificial Sequence <220><223> Fused polypeptide for InlB-VLR5c-Rosetta <400> 8 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15 Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr 20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Asn 50 55 60 Val Arg Tyr Leu Ala Leu Gly Gly Asn Lys Leu His Asp Ile Ser Ala 65 70 75 80-30 -
Leu Lys Glu Leu Thr Asn Leu Thr Tyr Leu Ile Leu Thr Gly Asn Gln 85 90 95 Leu Gln Ser Leu Pro Asn Gly Val Phe Asp Lys Leu Thr Asn Leu Lys 100 105 110 Glu Leu Val Leu Val Glu Asn Gln Leu Gln Ser Leu Pro Asp Gly Val 115 120 125 Phe Asp Lys Leu Thr Asn Leu Thr Tyr Leu Asn Leu Ala His Asn Gln 130 135 140 Leu Gln Ser Leu Pro Lys Gly Val Phe Asp Lys Leu Thr Asn Leu Thr 145 150 155 160 Glu Leu Asp Leu Ser Tyr Asn Gln Leu Gln Ser Leu Pro Glu Gly Val 165 170 175 Phe Asp Lys Leu Thr Gln Leu Lys Asp Leu Arg Leu Tyr Gln Asn Gln 180 185 190 Leu Lys Ser Val Pro Asp Gly Val Phe Asp Arg Leu Thr Ser Leu Gln 195 200 205 Tyr Ile Trp Leu His Asp Asn Pro Trp Asp Cys Thr Cys Pro Gly Ile 210 215 220 Arg Tyr Leu Ser Glu Trp Ile Asn Lys His Ser Gly Val Val Arg Asn 225 230 235 240 Ser Ala Gly Ser Val Ala Pro Asp Ser Ala Lys Cys Ser Gly Ser Gly 245 250 255 Lys Pro Val Arg Ser Ile Ile Cys Pro Thr Leu Glu Val 260 265 <210> 9 <211> 290 <212> PRT <213> Artificial Sequence <220><223> Fused polypedide for InlB-VLR6n <400> 9 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15-31 -
Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr 20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Asn 50 55 60 Val Lys Tyr Leu Arg Leu Gly Gly Asn Asn Leu Arg Asp Ile Ser Ala 65 70 75 80 Leu Glu Lys Leu Thr Asn Leu Thr Val Leu Asp Leu Ser Arg Asn Gln 85 90 95 Leu Gln Ser Leu Pro Asn Gly Val Phe Asp Lys Leu Thr Ser Leu Thr 100 105 110 Tyr Leu Ile Leu Thr Gly Asn Gln Leu Gln Ser Leu Pro Asn Gly Val 115 120 125 Phe Asp Lys Leu Thr Gln Leu Lys Glu Leu Val Leu Val Glu Asn Gln 130 135 140 Leu Gln Ser Leu Pro Asp Gly Val Phe Asp Lys Leu Thr Lys Leu Thr 145 150 155 160 Tyr Leu Asn Leu Ala His Asn Glu Leu Gln Ser Leu Pro Lys Gly Val 165 170 175 Phe Asp Lys Leu Thr Ser Leu Lys Glu Leu Asp Leu Ser Tyr Asn Gln 180 185 190 Leu Lys Arg Val Pro Glu Gly Ala Phe Asp Lys Leu Thr Gln Leu Lys 195 200 205 Asp Leu Arg Leu Tyr Gln Asn Gln Leu Lys Ser Val Pro Asp Gly Val 210 215 220 Phe Asp Arg Leu Thr Ser Leu Gln Tyr Ile Trp Leu His Asp Asn Pro 225 230 235 240 Trp Asp Cys Thr Cys Pro Gly Ile Arg Tyr Leu Ser Glu Trp Ile Asn 245 250 255 Lys His Ser Gly Val Val Arg Asn Ser Ala Gly Ser Val Ala Pro Asp - 32 -
260 265 270 Ser Ala Lys Cys Ser Gly Ser Gly Lys Pro Val Arg Ser Ile Ile Cys 275 280 285 Pro Thr 290 <210> 10 <211> 290 <212> PRT <213> Artificial Sequence <220><223> Fused polypeptide for InlB-VLR6c <400> 10 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15 Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr 20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Asn 50 55 60 Val Arg Tyr Leu Ala Leu Gly Gly Asn Lys Leu His Asp Ile Ser Ala 65 70 75 80 Leu Lys Glu Leu Thr Asn Leu Thr Val Leu Asp Leu Ser Arg Asn Gln 85 90 95 Leu Gln Ser Leu Pro Asn Gly Val Phe Asp Lys Leu Thr Asn Leu Thr 100 105 110 Tyr Leu Ile Leu Thr Gly Asn Gln Leu Gln Ser Leu Pro Asn Gly Val 115 120 125 Phe Asp Lys Leu Thr Asn Leu Lys Glu Leu Val Leu Val Glu Asn Gln 130 135 140 Leu Gln Ser Leu Pro Asp Gly Val Phe Asp Lys Leu Thr Asn Leu Thr 145 150 155 160 Tyr Leu Asn Leu Ala His Asn Gln Leu Gln Ser Leu Pro Lys Gly Val - 33 -
165 170 175 Phe Asp Lys Leu Thr Asn Leu Thr Glu Leu Asp Leu Ser Tyr Asn Gln 180 185 190 Leu Gln Ser Leu Pro Glu Gly Val Phe Asp Lys Leu Thr Gln Leu Lys 195 200 205 Asp Leu Arg Leu Tyr Gln Asn Gln Leu Lys Ser Val Pro Asp Gly Val 210 215 220 Phe Asp Arg Leu Thr Ser Leu Gln Tyr Ile Trp Leu His Asp Asn Pro 225 230 235 240 Trp Asp Cys Thr Cys Pro Gly Ile Arg Tyr Leu Ser Glu Trp Ile Asn 245 250 255 Lys His Ser Gly Val Val Arg Asn Ser Ala Gly Ser Val Ala Pro Asp 260 265 270 Ser Ala Lys Cys Ser Gly Ser Gly Lys Pro Val Arg Ser Ile Ile Cys 275 280 285 Pro Thr 290 <210> 11 <211> 276 <212> PRT <213> Artificial Sequence <220><223> TV3 <400> 11 Glu Pro Cys Val Glu Val Val Pro Asn Ile Thr Tyr Gln Cys Met Glu 1 5 10 15 Leu Asn Phe Tyr Lys Ile Pro Asp Asn Leu Pro Phe Ser Thr Lys Asn 20 25 30 Leu Asp Leu Ser Phe Asn Pro Leu Arg His Leu Gly Ser Tyr Ser Phe 35 40 45 Phe Ser Phe Pro Glu Leu Gln Val Leu Asp Leu Ser Arg Cys Glu Ile 50 55 60 Gln Thr Ile Glu Asp Gly Ala Tyr Gln Ser Leu Ser His Leu Ser Thr - 34 -
65 70 75 80 Leu Ile Leu Thr Gly Asn Pro Ile Gln Ser Leu Ala Leu Gly Ala Phe 85 90 95 Ser Gly Leu Ser Ser Leu Gln Lys Leu Val Ala Val Glu Thr Asn Leu 100 105 110 Ala Ser Leu Glu Asn Phe Pro Ile Gly His Leu Lys Thr Leu Lys Glu 115 120 125 Leu Asn Val Ala His Asn Leu Ile Gln Ser Phe Lys Leu Pro Glu Tyr 130 135 140 Phe Ser Asn Leu Thr Asn Leu Glu His Leu Asp Leu Ser Ser Asn Lys 145 150 155 160 Ile Gln Ser Ile Tyr Cys Thr Asp Leu Arg Val Leu His Gln Met Pro 165 170 175 Leu Leu Asn Leu Ser Leu Asp Leu Ser Leu Asn Pro Met Asn Phe Ile 180 185 190 Gln Pro Gly Ala Phe Lys Glu Ile Arg Leu Lys Glu Leu Ala Leu Asp 195 200 205 Thr Asn Gln Leu Lys Ser Val Pro Asp Gly Ile Phe Asp Arg Leu Thr 210 215 220 Ser Leu Gln Lys Ile Trp Leu His Thr Asn Pro Trp Asp Cys Ser Cys 225 230 235 240 Pro Arg Ile Asp Tyr Leu Ser Arg Trp Leu Asn Lys Asn Ser Gln Lys 245 250 255 Glu Gln Gly Ser Ala Lys Cys Ser Gly Ser Gly Lys Pro Val Arg Ser 260 265 270 Ile Ile Cys Pro 275 <210> 12 <211> 333 <212> PRT <213> Artificial Sequence <220><223> Fused polypeptide for InlB-VLR-TV3-35 -
<400> 12 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15 Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr 20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Asn 50 55 60 Val Arg Tyr Leu Ala Leu Gly Gly Asn Lys Leu His Asp Ile Ser Ala 65 70 75 80 Leu Lys Glu Leu Thr Asn Leu Thr Tyr Leu Asp Leu Thr Gly Asn Gln 85 90 95 Leu Gln Ser Leu Pro Asn Gly Val Phe Asp Lys Leu Pro Glu Leu Gln 100 105 110 Val Leu Asp Leu Ser Arg Asn Glu Ile Gln Thr Ile Glu Asp Gly Ala 115 120 125 Phe Gln Ser Leu Ser His Leu Ser Thr Leu Ile Leu Thr Gly Asn Pro 130 135 140 Ile Gln Ser Leu Ala Leu Gly Ala Phe Ser Gly Leu Ser Ser Leu Gln 145 150 155 160 Lys Leu Val Ala Val Glu Thr Asn Leu Ala Ser Leu Glu Asn Phe Pro 165 170 175 Ile Gly His Leu Lys Thr Leu Lys Glu Leu Asn Val Ala His Asn Leu 180 185 190 Ile Gln Ser Phe Lys Leu Pro Glu Tyr Phe Ser Asn Leu Thr Asn Leu 195 200 205 Glu His Leu Asp Leu Ser Ser Asn Lys Ile Gln Ser Ile Tyr Cys Thr 210 215 220 Asp Leu Arg Val Leu His Gln Met Pro Leu Leu Asn Leu Ser Leu Asp 225 230 235 240 Leu Ser Leu Asn Pro Met Asn Phe Ile Gln Pro Gly Ala Phe Lys Glu - 36 -
245 250 255 Ile Arg Leu Lys Glu Leu Ala Leu Asp Thr Asn Gln Leu Lys Ser Val 260 265 270 Pro Asp Gly Ile Phe Asp Arg Leu Thr Ser Leu Gln Lys Ile Trp Leu 275 280 285 His Thr Asn Pro Trp Asp Cys Ser Cys Pro Arg Ile Asp Tyr Leu Ser 290 295 300 Arg Trp Leu Asn Lys Asn Ser Gln Lys Glu Gln Gly Ser Ala Lys Cys 305 310 315 320 Ser Gly Ser Gly Lys Pro Val Arg Ser Ile Ile Cys Pro 325 330 <210> 13 <211> 83 <212> PRT <213> Artificial Sequence <220><223> N-terminal of Internalin B <220><221> VARIANT <222> (64)..(83) <223> x is hydrophilic amino acid <400> 13 Glu Thr Ile Thr Val Ser Thr Pro Ile Lys Gln Ile Phe Pro Asp Asp 1 5 10 15 Ala Phe Ala Glu Thr Ile Lys Ala Asn Leu Lys Lys Lys Ser Val Thr 20 25 30 Asp Ala Val Thr Gln Asn Glu Leu Asn Ser Ile Asp Gln Ile Ile Ala 35 40 45 Asn Asn Ser Asp Ile Lys Ser Val Gln Gly Ile Gln Tyr Leu Pro Xaa 50 55 60 Leu Xaa Xaa Leu Xaa Leu Xaa Xaa Asn Xaa Ile Xaa Asp Ile Xaa Xaa 65 70 75 80 Leu Xaa Xaa - 37 -