摘要:天然次級(jí)代謝產(chǎn)物是重要的藥物來(lái)源,非核糖體肽(non-ribosomal peptide,NRP)是自然界中廣泛存在的次級(jí)代謝產(chǎn)物,其多樣的化學(xué)結(jié)構(gòu)使其具有多種生物活性,如抗炎、抗腫瘤、抗病毒等;诜呛颂求w多肽合成酶(nonribosomal peptide synthetases,NRPS)模塊化線性合成多肽的原理對(duì)其催化模塊進(jìn)行改造、重組,定向設(shè)計(jì)多肽的生物合成途徑以獲得目的多肽已成為一個(gè)研究熱點(diǎn)。然而雜合NRPS存在催化模塊無(wú)法加載目標(biāo)氨基酸或多肽合成效率顯著降低等諸多問(wèn)題,限制了其應(yīng)用。近年來(lái),NRPS腺苷;(adenylation domain,A域)及縮合結(jié)構(gòu)域(condensation domain,C域)的底物選擇性、NRPS亞基間對(duì)接域(docking domain,DD)和模塊間連接區(qū)(linker)的研究已取得較大突破。從C域?qū)Φ孜锏倪x擇性及以不同融合邊界進(jìn)行催化單元替換兩方面進(jìn)行綜述,介紹NRPS催化模塊重構(gòu)的研究進(jìn)展,并概述了各替換方案的優(yōu)點(diǎn)與局限性。
基于NRPS線性合成機(jī)制和模塊化原理,人們一直嘗試采用組合生物合成的方法對(duì)編碼非核糖體肽合成酶的催化單元進(jìn)行操作[15],以亞基交換[16]或模塊/結(jié)構(gòu)域交換[17]/增加[18]/減少[19]等方式改變?cè)蟹呛颂求w肽的生物合成途徑,獲得新的非核糖體肽類(lèi)化合物或其衍生物。但是前期的研究數(shù)據(jù)表明隨機(jī)尋找NRPS結(jié)構(gòu)域邊界間的蛋白質(zhì)同源區(qū)域進(jìn)行模塊交換的成功率并不高:一方面,按一般規(guī)律進(jìn)行模塊交換和雜合,往往導(dǎo)致目標(biāo)產(chǎn)物產(chǎn)量的急劇下降;另一方面,合適的交換邊界僅在蛋白質(zhì)序列同源性較高的NRPS之間較易尋找,具有一定局限性[17]。近年來(lái),NRPS催化模塊重構(gòu)研究取得了較大的突破,我們?cè)谙挛闹袑?duì)相關(guān)進(jìn)展進(jìn)行了重點(diǎn)論述。
1 模塊替換
對(duì)NRPS進(jìn)行改造主要有兩個(gè)難點(diǎn):其一是酶對(duì)底物變化的容忍度;其二是在功能域之間重組拼裝過(guò)程中,融合邊界對(duì)蛋白質(zhì)整體結(jié)構(gòu)產(chǎn)生了影響從而降低了酶活。因此要使雜合NRPS可識(shí)別加載底物合成目的多肽及提高雜合NRPS的催化效率,關(guān)鍵在于提高雜合模塊對(duì)底物的選擇性以及將嵌入蛋白對(duì)整體蛋白質(zhì)空間結(jié)構(gòu)的影響減至最小。我們認(rèn)為至少需要考慮三方面的問(wèn)題:一是雜合模塊來(lái)源的選擇。對(duì)應(yīng)同一氨基酸殘基融合不同NRPS來(lái)源的功能模塊催化效率是否有差異。二是雜合邊界的選擇。可以根據(jù)蛋白質(zhì)序列的保守性判斷每一個(gè)結(jié)構(gòu)域的邊界,通過(guò)原始模塊與替換模塊間蛋白質(zhì)序列的比對(duì)在結(jié)構(gòu)域連接區(qū)域?qū)ふ彝葱暂^高的序列作為邊界節(jié)點(diǎn)進(jìn)行替換。三是考慮縮合域的底物特異性。雖然腺苷酰化A域是底物氨基酸選擇的第一道門(mén)檻,但是催化模塊中的縮合結(jié)構(gòu)域C域?qū)Φ孜镆灿羞x擇特異性。往往在對(duì)NRPS的A結(jié)構(gòu)進(jìn)行替換后,腺苷;陌被岵荒茉贑域進(jìn)行縮合反應(yīng)而使肽鏈無(wú)法延伸,且C域?qū)ζ湎噜徬掠蜛域的底物選擇性產(chǎn)生影響。
在非核糖體肽裝配過(guò)程中,首先由腺苷;驈目衫玫陌被岬孜锍刂羞x擇相對(duì)應(yīng)的特異氨基酸合成相應(yīng)的氨酰-AMP[9]。許多研究表明,NRPS每一催化模塊延伸氨基酸的特異性主要取決于A域和C域,其中A域是底物氨基酸選擇的第一道門(mén)檻。A域腺苷酰化氨基酸底物的特異性導(dǎo)致催化模塊延伸氨基酸殘基的差異。因此,最早的模塊替換集中在A域。Stachelhaus等[20]于1995年在枯草芽孢桿菌(Bacillus subtilis)中用異源A域替換脂肽抗生素Surfactin合成酶SrfA-C中Leu7特異性A域(SrfA-A7),成功得到了Phe7、Orn7、Cys7、Val7取代的系列Surfactin類(lèi)似物 (圖3a)。隨后,該團(tuán)隊(duì)繼續(xù)用異源AT域替換合成酶SrfA-A中Leu2特異性A域(SrfA-A2),得到了Orn2取代的Surfactin類(lèi)似物[21]。雖然上述A域及AT域替換均得到了目的產(chǎn)物,但該實(shí)驗(yàn)中Surfactin類(lèi)似物的產(chǎn)量均明顯下降。此外,并不是所有的A域替換均能獲得預(yù)期產(chǎn)物。例如,Ackerley和Lamont[22]分別采用異源的腺苷;疞-Thr、Cys、Val和Ser的A域替換銅綠假單胞菌(Pseudomonas aeruginosa PAO1)非核糖體肽合成酶第4個(gè)亞基PvdD模塊一的A域(L-Thr),僅腺苷酰化L-Thr的A域替換有少量產(chǎn)物pyoverdine產(chǎn)生,其余雜合的NRPS均無(wú)功能 (圖3b)。此實(shí)驗(yàn)中非Thr特異性腺苷;蛱鎿Q后無(wú)多肽產(chǎn)物合成可能是由于C域的底物特異性。1999年Belshaw等[23]在對(duì)C域研究后提出假想,C域的C端部分為受體位點(diǎn),結(jié)合氨酰-S-PCP;N端部分為供體位點(diǎn),結(jié)合上游的肽基-S-PCP,受體位點(diǎn)對(duì)受體底物氨酰-S-PCP有強(qiáng)選擇性,供體位點(diǎn)對(duì)供體底物側(cè)鏈氨基酸僅有弱選擇性。因此雜合A域識(shí)別的Cys、Val和Ser無(wú)法進(jìn)入上游C域結(jié)構(gòu),進(jìn)而無(wú)法與上游肽鏈縮合,導(dǎo)致肽鏈延伸中斷[22]。然而B(niǎo)elshaw等研究的不足之處在于僅以一個(gè)氨基酸即氨酰-S-PCP作供體底物,無(wú)法證明C域供體位點(diǎn)對(duì)多肽的選擇性,當(dāng)供體底物為肽-S-PCP時(shí),供體位點(diǎn)選擇性并非如此[24]。
如前述,A域從氨基酸底物池中選擇相對(duì)應(yīng)的特異氨基酸合成相應(yīng)的氨酰-AMP。有報(bào)道顯示,A結(jié)構(gòu)域中有10個(gè)非連續(xù)編碼的關(guān)鍵氨基酸殘基決定了其底物識(shí)別的特異性[25]。因此,除完整的A域替換外,近年來(lái)有研究嘗試替換A域內(nèi)包含關(guān)鍵活性氨基酸殘基的高度保守的一個(gè)黃素氧還蛋白樣亞域(flavodoxin-like sub domain,FSD)[26-27]。交換FSD能最小地破壞A域的整體結(jié)構(gòu),維持和其它結(jié)構(gòu)域間的關(guān)鍵相互作用,使雜合的NRPS保持原有催化效率[26]。例如,Kries等[27]用9個(gè)不同底物特異性的FSD替換對(duì)苯丙氨酸特異性識(shí)別的gramicidin S合成酶起始模塊GrsA的FSD。其中,替換纈氨酸特異性FSD的GrsA腺苷;钚詮(qiáng)。并且在添加脯氨酸特異性GrsB1模塊后,GrsA- GrsB1作為一個(gè)Val-Pro二酮哌嗪合成酶發(fā)揮作用,合成了D-Val-L-Pro二酮哌嗪 (圖3c)。Thong等[28]用CRISPR-Cas9基因編輯技術(shù),替換enduracidin合成酶的FSD,得到了一系列新的脂肽,有的產(chǎn)量接近野生型菌株。
在NRPS中采用模塊整體替換能夠保證催化單元模塊結(jié)構(gòu)和功能的完整性。例如,用脂肽lichenysin生物合成基因簇中的Gln識(shí)別模塊CAT交換surfactin合成基因簇中的Glu模塊,得到了高產(chǎn)、高活性的新型脂肽[29](圖4a)。用達(dá)托霉素NRPS中模塊11CASerT交換模塊8 CAAlaT,得到8號(hào)位D-Ser取代的達(dá)托霉素類(lèi)似物;用模塊8 CAAlaT替換模塊11 CASerT,得到11號(hào)位D-Ala取代的達(dá)托霉素類(lèi)似物[17]。這兩種新化合物均對(duì)金黃色葡萄球菌具有藥理活性,但產(chǎn)量?jī)H為野生型菌株的15%和45%左右。有研究以T-C域間的LGG(H/D)S(I/L)保守序列為融合位點(diǎn),將一個(gè)鈣離子依賴的脂肽抗生素(calcium dependent antibiotic,CDA)合成酶模塊13 CATrpT和A54145 NRPS模塊13 CAIleT替換達(dá)托霉素NRPS模塊13CAKynT,分別獲得了13位Trp和Ile取代的達(dá)托霉素類(lèi)似物,且對(duì)雜合NRPS催化效率影響較小,新化合物產(chǎn)量最高接近原產(chǎn)量的67%[30]。
在1.1所述異源A域替換PvdD模塊一L-Thr A域的同時(shí), Ackerley和Lamont[22]用異源CA域(包括L-蘇氨酸特異的CA域)替換PvdD模塊一CA域,但意外的是所有雜合酶均無(wú)活性。CA域交換失敗的原因有:(1)雜合的異源CA域無(wú)法與PvdD模塊一的天然T域有效互作,導(dǎo)致雜合酶無(wú)活性;(2)現(xiàn)有理論顯示,亞基間的對(duì)接域可指導(dǎo)非核糖體肽合成酶正確的線性排列,并介導(dǎo)亞基間的互作,該實(shí)驗(yàn)中PvdD模塊一的CA域替換后無(wú)法與上游亞基PvdJ正確對(duì)接[31⇓-33](圖3b)。
Tanovic等[34]在對(duì)枯草芽孢桿菌中的脂肽抗生素合成酶最末端模塊SrfA-C的結(jié)構(gòu)研究后發(fā)現(xiàn),其縮合域(C域)和腺苷酰化域(A域)之間有一段含32個(gè)氨基酸的連接區(qū),在SrfA-C晶體結(jié)構(gòu)中,該連接區(qū)與C域、A域均緊密相連。因此,人們認(rèn)為在模塊替換時(shí)需保持CA域結(jié)構(gòu)完整,C域與A域應(yīng)作為不可分割的整體才能避免破壞雜合酶的結(jié)構(gòu)和活性;诖爽F(xiàn)象,Calcott等[35]繼續(xù)用異源CA域替換PvdD亞基第二個(gè)模塊CA域。與該團(tuán)隊(duì)早期替換PvdD亞基第一個(gè)模塊CA域不同,替換PvdD亞基第二個(gè)模塊CA域可避免破壞PvdD與上游亞基PvdJ間的相互作用(圖3b)。結(jié)果顯示,有兩個(gè)雜合NRPS具有較好的催化活性,并獲得了兩種Thr11和Lys11取代的pyoverdine類(lèi)似物,產(chǎn)量分別是野生型的83% 和76%,其余6個(gè)雜合酶均無(wú)活性[35]。
2 融合邊界
在初期研究中,從保證模塊功能完整性的角度考慮,研究者通常以A結(jié)構(gòu)域或一個(gè)完整的CAT(E)模塊單元對(duì)NRPS進(jìn)行替換等改造[27-28,36]。例如,以T-C域間連接區(qū)為融合邊界替換達(dá)托霉素非核糖體肽合成酶的完整CAT模塊[30]。然而完整CAT(E)模塊交換存在產(chǎn)量急劇下降的問(wèn)題,且要求蛋白質(zhì)序列具有高同源性,有一定的局限性。理解結(jié)構(gòu)域間的連接區(qū)在非核糖體肽合成酶催化底物活化、加載、縮合過(guò)程中的作用,對(duì)于通過(guò)模塊替換獲取較好催化活性的雜合NRPS有重要作用。
Miller等[37]通過(guò)生物信息學(xué)分析了不同NRPS的A-T域間連接區(qū)后,在A-T域的連接區(qū)發(fā)現(xiàn)了一段保守的LPxP序列,該LPxP序列與A域C端的亞域相互作用以穩(wěn)定A10基序中的保守賴氨酸;此外,該基序與A域C端的亞域相互作用可能會(huì)協(xié)調(diào)PCP域的運(yùn)動(dòng)與A域的構(gòu)象變化。將LPxP序列中的Pro961突變后導(dǎo)致產(chǎn)物合成速率下降近一半[37]。同時(shí)有研究將發(fā)光桿菌(Photorhabdus luminescens)中單模塊靛藍(lán)合成酶IndC的T域用來(lái)自鏈霉菌的BpsA酶的T域替換后,破壞了靛藍(lán)合成;令人驚奇的是,將BpsA酶的T域與A-T域間的連接區(qū)一起交換時(shí)恢復(fù)了靛藍(lán)合成[38]。上述實(shí)驗(yàn)表明選擇并保留合適的結(jié)構(gòu)域間連接區(qū)對(duì)某些模塊替換獲得有活性的雜合NRPS至關(guān)重要。Calcott等[39]曾用CA域替換PvdD第二個(gè)模塊(1.3),然而僅少數(shù)雜合NRPS具有較好催化活性,大多數(shù)雜合NRPS無(wú)功能[35]。隨后,該團(tuán)隊(duì)以A-T間連接區(qū)為融合邊界替換合成酶PvdD中T-C-AThr11催化單元(圖3b)。雖然成功獲得了兩種Ser11和fhOrn11取代的pyoverdine衍生物,但是這兩個(gè)衍生物的產(chǎn)量都較低。
近年來(lái)德國(guó)法蘭克福大學(xué)Bode團(tuán)隊(duì)發(fā)現(xiàn)CA結(jié)構(gòu)域之間的連接區(qū)含一段保守序列LLLxxWNxT。利用此邊界節(jié)點(diǎn),在NRPS兩個(gè)模塊(CAT-CAT)之間選擇AT-C區(qū)域?yàn)樘鎿Q單元(exchange unit,XU)進(jìn)行模塊替換能獲得活性較高的雜合NRPS蛋白,某些替換組合非核糖體肽的產(chǎn)量甚至比野生型提高了48%[40](圖4b)。以A-T-C結(jié)構(gòu)域作為交換單元進(jìn)行模塊替換和組合雖然取得了重大突破,而且可以進(jìn)行多模塊同時(shí)替換和組裝,但這個(gè)方法局限性明顯:首先,CA結(jié)構(gòu)域之間的保守序列LLLxxWNxT在很多NRPS蛋白序列中并不存在。其次,現(xiàn)有理論顯示C域?qū)M(jìn)入該結(jié)構(gòu)域的氨酰-S-PCP受體具有很高的底物選擇性,當(dāng)雜合的A域識(shí)別的氨基酸與上游的C域不匹配時(shí),肽鏈無(wú)法延伸導(dǎo)致無(wú)目標(biāo)產(chǎn)物產(chǎn)生。因此,在對(duì)NRPS進(jìn)行改造時(shí),不僅需要考慮雜合NRPS的催化效率,還需要考慮C域?qū)Φ孜锏倪x擇性,避免雜合的A域識(shí)別的氨基酸與上游C域不匹配時(shí)肽鏈無(wú)法延伸導(dǎo)致無(wú)目標(biāo)產(chǎn)物產(chǎn)生。
通過(guò)對(duì)C域的蛋白質(zhì)結(jié)構(gòu)分析,研究人員發(fā)現(xiàn)C域的N端是提供肽鏈的供體域(CDsub),C端是受體域(CAsub),它們分別接受肽基-S-PCP和氨酰-S-PCP。其中受體域(CAsub)對(duì)氨酰-S-PCP有特異識(shí)別作用[41]。例如,Kaniusaite等[42⇓-44]對(duì)糖肽類(lèi)抗生素(glycopeptide antibiotics,GPAs)NRPS的改造實(shí)驗(yàn)也表明,C域?qū)κ荏w底物氨酰-S-PCP有強(qiáng)選擇性。也有研究顯示,C域不僅對(duì)受體底物氨酰-S-PCP有選擇性,對(duì)供體底物肽基-S-PCP的大小和組成也有選擇性[24,45⇓ -47]。對(duì)C域的結(jié)構(gòu)解析也發(fā)現(xiàn)其具有立體和側(cè)鏈選擇性[48]。基于此理論Bozhüyük等[49]于2019年進(jìn)一步開(kāi)發(fā)了第二代的替換方案:用CAsub-A-T-CDsub作為基本的替換單元(exchange unit condensation domain,XUC)進(jìn)行整體替換。該方案避免了雜合A域和C域之間氨基酸底物識(shí)別不匹配的問(wèn)題,明顯具有更廣的適用范圍,且該催化單元避免了破壞最主要的結(jié)構(gòu)域-結(jié)構(gòu)域相互作用[50],有的多肽產(chǎn)量比野生型提高了63.4%[49](圖4c)。利用該方法可以構(gòu)建多種隨機(jī)組合的類(lèi)似天然的非核糖體肽庫(kù)。然而CAsub-A-T-CDsub作為交換單元的局限性在于:來(lái)源于同屬的模塊間易融合,而來(lái)源于不同屬的模塊間缺乏兼容性;TE結(jié)構(gòu)域?qū)Π被嵛恢、肽鏈長(zhǎng)度或環(huán)肽大小的特異性限制了全新的非天然、非核糖體肽以及環(huán)肽、縮肽形成[51]。
此方法避免了克隆和非核糖體肽合成酶大小的限制,可隨機(jī)組合任意的NRPS模塊,為快速實(shí)現(xiàn)新高通量生物組合方法、開(kāi)發(fā)多肽類(lèi)藥物鋪平了道路。
3 C域與A域的相互作用
3.1 C域改變A域的活性和選擇性
從上述經(jīng)典的NRPS生物合成理論可知,A域特異性識(shí)別氨基酸底物進(jìn)行腺苷酰基化,C域在氨基酸縮合過(guò)程對(duì)受體氨酰-S-PCP的種類(lèi)進(jìn)一步校對(duì)驗(yàn)證(proofreading),A域和C域在底物選擇過(guò)程中各自獨(dú)立發(fā)揮作用,共同確保所合成非核糖體肽結(jié)構(gòu)專一。但近年的研究報(bào)道顯示C域?qū)ζ湎噜徬掠蜛域的底物選擇性產(chǎn)生影響。Mayer等[57]將A域進(jìn)行單獨(dú)表達(dá)后,它可以腺苷;喾N氨基酸底物,但和C域聯(lián)合表達(dá)后,A域只對(duì)精氨酸具有腺苷;钚;單獨(dú)表達(dá)A域時(shí)對(duì)天然底物酪氨酸和色氨酸均無(wú)活性,與C域聯(lián)合表達(dá)后對(duì)這兩種氨基酸具有腺苷酰基化活性。表明C域與A域的相互作用改變了A域的底物特異性,且某些A域只有在C域存在的條件下才具有活性。
此外,很多非脂肽類(lèi)NRPS的起始模塊并不含有C域,起始模塊的A域腺苷;被岷笸ㄟ^(guò)T域直接轉(zhuǎn)移到下一模塊的C域進(jìn)行氨基酸縮合。但是若采用NRPS延伸模塊A域直接替代起始單元A域,目前尚未見(jiàn)肽鏈延伸成功的報(bào)道。近期Bozhüyük等[49]將C域(或C域C端的受體域CAsub)和延伸模塊A域共表達(dá)時(shí),成功地將延伸單元的A域轉(zhuǎn)變?yōu)槠鹗紗卧狝域,產(chǎn)生了目標(biāo)非核糖體肽化合物。
有研究在交換AT域時(shí)把C域C端作為雜合位點(diǎn),雜合蛋白具有較高產(chǎn)量[58]。與最早的AT域替換通常導(dǎo)致產(chǎn)量下降[21,59 -60]相反,該實(shí)驗(yàn)中AT域的成功交換表明C-A間的相互作用界面對(duì)A域發(fā)揮活性功能很重要,當(dāng)雜合的異源A域或AT域或AT-C域不包含此相互作用界面時(shí),異源A域無(wú)法與上游C域正確互作,因此A域活性喪失,雜合NRPS無(wú)法發(fā)揮功能。上述實(shí)驗(yàn)表明在NRPS中每一組催化模塊的C域和A域并非各自獨(dú)立發(fā)揮作用完成一輪氨基酸延伸,C域與A域發(fā)生交互作用完善了A域腺苷;墓δ堋
據(jù)此,結(jié)合生物信息學(xué)分析,研究者認(rèn)為C結(jié)構(gòu)域受體底物的特異性不是阻礙對(duì)NRPS工程化改造的因素。Calcott等[63]將PheATE- ProCAT模型中ProCAT模塊A域以上述重組邊界交換為L(zhǎng)-Leu的A域后,成功合成了D-Phe- L-Leu,反駁了C域受體底物特異性這一假說(shuō),證明在交換NRPS催化模塊時(shí),通過(guò)選擇有效的重組邊界即可交換A域,實(shí)現(xiàn)對(duì)非核糖體肽生物合成途徑改造,獲取新的非核糖體肽。Calcott的實(shí)驗(yàn)對(duì)普遍公認(rèn)的C域受體底物特異性這一理論提出了巨大挑戰(zhàn)。然而其二肽合成中僅以識(shí)別L-Leu的A域交換ProCAT,因此存在偶然性,缺少對(duì)其他氨基酸特異的A域交換結(jié)果。
4 總結(jié)與展望
設(shè)計(jì)非核糖體肽的生物合成途徑,以產(chǎn)生具有新結(jié)構(gòu)或更好藥理活性的新型化合物,一直是天然產(chǎn)物合成生物學(xué)的目標(biāo)。基于非核糖體肽合成酶的線性催化機(jī)制,理論上定向重組催化模塊可以獲得任意氨基酸序列組合的多肽。然而雜合NRPS的催化效率限制了其可行性和實(shí)用性。隨著對(duì)NRPS各功能域的結(jié)構(gòu)研究日益深入,選擇合適的催化單元和理想的重組邊界使雜合NRPS可識(shí)別加載目的底物和提高其催化效率成為可能。因此,合理設(shè)計(jì)構(gòu)建策略,允許催化單元任意重組,從而高效合成自然界尚未存在的化合物,對(duì)增加非核糖體肽家族化合物多樣性、開(kāi)發(fā)新藥具有重大意義。
免責(zé)聲明:本文為行業(yè)交流學(xué)習(xí),版權(quán)歸原作者及原雜志所有,如有侵權(quán),可聯(lián)系刪除。文章標(biāo)注有作者及文章出處,如需閱讀原文及參考文獻(xiàn),可閱讀原雜志