摘 要 綜述了多肽定量構(gòu)效關系和計算機輔助多肽分子設計方法的最新進展 ,重點介紹了多肽定量構(gòu)效關系研究中的化學結(jié)構(gòu)定量描述符和建立數(shù)學模型的統(tǒng)計方法 ,并對模擬肽學和虛擬組合多肽庫在多肽分子設計中的應用進行了簡要的論述。
多肽是維持生命過程中必不可少的物質(zhì) ,由于它們具有高活性、高選擇性以及副作用小等特點 ,現(xiàn)已逐漸成為藥物研究的熱點之一。對肽類藥物的研究開發(fā)及先導化合物的發(fā)現(xiàn) ,至今仍是一件耗資巨大但效率很低的工作。造成這種狀況的一個主要原因就是缺乏深入的理論指導和先進的分子設計方法 ,因此迫切需要新的理論方法和多肽分子設計技術的出現(xiàn)。近年來 ,以各種理論計算方法和分子模擬技術為基礎的計算機輔助分子設計 ,在各種肽類化合物的研究開發(fā)中得到了廣泛的應用。利用計算機分子圖形學、分子動力學和量子化學等進行構(gòu)象分析 ,尋找多肽及類似物的藥效團 ,進行二維和三維的定量構(gòu)效關系(QSAR) 研究 ,及應用各種分子設計方法 ,設計有較高活性的肽類和非肽模擬物 ,已成為國際上十分活躍的研究領域。
一、多肽的定量構(gòu)效關系研究
在多肽類似物的研究和開發(fā)中 ,定量構(gòu)效關系是一個重要的理論計算方法和常用手段。所謂多肽的QSAR ,就是用數(shù)學模式來表達多肽類似物的化學結(jié)構(gòu)信息與特定的生物活性強度間的相互關系。多肽的 QSAR 研究方法同其它藥物的 QSAR 研究方法一樣 ,基本上可分為以下 5 個步驟[1 ]: (1) 選擇和設計一系列多肽類似物 ; (2) 類似物的化學結(jié)構(gòu)的定量描述 ; (3) 合成設計化合物并進行生物活性的測定 ; (4) 建立數(shù)學模型 ,確定化學結(jié)構(gòu)與生物活性之間的函數(shù)關系 ; (5) 新類似物的活性預測以及新的高活性類似物的設計。近年來 ,多肽的 QSAR 研究主要集中在如下兩個方面 :多肽的化學結(jié)構(gòu)定量描述符的研究和建立 QSAR 數(shù)學模型的統(tǒng)計方法。
在多肽的定量構(gòu)效關系研究中 ,因為肽的復雜性和高柔性 ,使其以整個多肽分子為基礎的參數(shù)很難確定。因此在多肽的各種 QSAR 模型中 ,普遍采用氨基酸的結(jié)構(gòu)描述參數(shù)去定量描述多肽的化學結(jié)構(gòu)和氨基酸殘基 ,這是多肽 QSAR 分析中的一個關鍵問題。其基本思路是以多肽的最基本的結(jié)構(gòu)信息———氨基酸序列為基礎 ,對一系列多肽類似物中變化的氨基酸殘基進行定量描述 ,并把氨基酸序列轉(zhuǎn)換成結(jié)構(gòu)描述符矩陣的一個向量。
最初應用此方法的是 Kidera 等人[2 ],他們對文獻報道的描述氨基酸性質(zhì)的 188 個參數(shù)進行主成分分析 ,得出 10 個正交因子 ,對天然氨基酸的結(jié)構(gòu)進行了定量描述。隨后 ,Hellerg 等人[1 ]提出了 20 個天然氨基酸的描述符 Z2scales ,兩年后 ,他們又提出了擴展的 Z2scales[3 ],成功地實現(xiàn)了對 35 個非天然氨基酸的定量描述。此外 ,Cocchi 等人[4 ] 用主成分分析法對用理論計算得到的內(nèi)部能量進行分析 ,也獲得了類似的結(jié)果 ,得到氨基酸結(jié)構(gòu)描述符 t2scales。隨后不久 ,Collantes 等人[5 ] 計算出了 2 個 3D 氨基酸側(cè)鏈描述符 ISA (isotropic surface area) 、ECI(electroniccharge index) ;Zaliani 等人[6 ]提出的天然氨基酸的 3D結(jié)構(gòu)描述符 MS2WHIM scores ,它們均來自于天然和非天然氨基酸的優(yōu)化的三維結(jié)構(gòu)。最近 ,又出現(xiàn)一種通過理論計算得出的疏水參數(shù) SFED(solvation freeenergy density) 模型作為氨基酸的結(jié)構(gòu)描述參數(shù) ,來定量描述多肽的化學結(jié)構(gòu)[7 ] 。在多肽的 QSAR 研究中 ,應用較多的氨基酸結(jié)構(gòu)描述符為 Z2scales、ISA2ECI 和 MS2WHIM scores。
對一系列多肽類化合物 ,每個變化的氨基酸殘基分別用 3 個 Z 值進行定量描述 ,從而實現(xiàn)氨基酸殘基的多位置多變量的定量結(jié)構(gòu)描述。但是 , Z2scales 氨基酸結(jié)構(gòu)描述符并沒有明確考慮到多肽類似物的構(gòu)象信息 ,因此用 Z2scales 描述符來建立多肽的 QSAR 模型時 ,多肽類似物應是如下三種情況之一 : (1) 在多肽類似物中構(gòu)象變化不是很大 ; (2)在用 Z2scales 進行定量結(jié)構(gòu)描述時 ,已包含了一部分多肽分子的構(gòu)象信息 ; (3) 建立 QSAR 模型的多肽類似物都采用了低能構(gòu)象。
Collantes 等人[5 ]應用分子模擬軟件搭建氨基酸的初始結(jié)構(gòu) ,而后進行構(gòu)象分析、能量優(yōu)化和量子化學計算等得出氨基酸的 ISA、ECI 值 ,20 種天然氨基酸的 ISA、ECI 值見表 1。ISA 近似地表示側(cè)鏈基團的疏水性 ,從表 1 中的 ISA 值可見 ,它又與氨基酸分子的體積有關。ECI 表示的是氨基酸側(cè)鏈基團的極性 ,即氨基酸側(cè)鏈每個原子 i 的電荷數(shù) q 的絕對值之和 ,ECI =Σ| qi| ,ECI 值能顯示出側(cè)鏈和受體之間的偶極作用。在一系列多肽類似物中 ,每一個氨基酸的結(jié)構(gòu)信息都能根據(jù)氨基酸的序列用 ISA 和 ECI值進行定量描述。
氨基酸結(jié)構(gòu)描述符 ISA2ECI 的優(yōu)點是描述符個數(shù)少、來源簡單 ,且它們的計算值均是來自氨基酸的三維結(jié)構(gòu) ,這樣易于對多肽的 QSAR 模型進行解釋分析。ISA2ECI 與 Z2scales 結(jié)構(gòu)描述符相比 ,有更大的自由度 ,更易于擴展到非天然的氨基酸和肽的擬似物。如 Elizabeth 等人已成功地應用 ISA2ECI 描述符 ,對含有非天然氨基酸的多肽催產(chǎn)素拮抗劑進行了 QSAR 的分析。
Zaliani 等人[6 ] 在計算機上模建 20 種天然氨基酸分子 ,并進行能量優(yōu)化和量化計算等 ,得出各分子的 AM1 電荷和 Connolly 表面的分子靜電勢 ,計算出36 個氨基酸結(jié)構(gòu)描述參數(shù)。再對 20 種天然氨基酸形成的 20 行、36 列的 MS2WHIS 描述符矩陣進行主成分分析 ,從中提取出前 3 個主要成分 ,得到了 MS2WHIM scores 氨基酸結(jié)構(gòu)描述符(見表 1) 。第一個指數(shù)與靜電勢有關 ,能體現(xiàn)出氨基酸殘基電荷的正負性和側(cè)鏈的芳香族P脂肪族的結(jié)構(gòu)信息 ;第二個指數(shù)受負靜電勢的影響 ,并能把酸性氨基酸 Asp 和 Glu同其它氨基酸區(qū)分開 ;第三個指數(shù)多數(shù)是負值 ,但Arg 和 Lys 為正值 ,主要是和它們的正電性和線性的側(cè)鏈有關。
近來 ,在多肽的 QSAR 分析中 ,也出現(xiàn)了不用氨基酸殘基描述符來定量描述多肽化學結(jié)構(gòu)的例子。如MHDV[11 ] (molecular holographic distance vector) 描述符 ,它只依靠 2D 拓撲距離矩陣和分子中的非氫原子類型 ,不需要相關的 3D 結(jié)構(gòu)信息、物化性質(zhì)和分子重疊 ,使用起來簡單快速。但是由于缺乏一些非氫原子的原子類型 ,計算的 MHDV 描述符最多只能有 91 個 ,因此目前只能成功地進行二肽的 QSAR 的分析研究。
隨著實驗技術水平的提高和計算機輔助分子設計在藥物分子設計中的應用 ,多肽的結(jié)構(gòu)定量描述符也越來越多樣化。如以上描述的由實驗測定的氨基酸結(jié)構(gòu)描述符 Z2scales ,及通過理論計算的指數(shù)ISA2ECI、MS2WHIM 和 MHDV , 還有其他的參數(shù)如MEDV[12 ] (molecular electronegativity2distance vector) 和指示 變 量 I[13 ], 及 多 肽 的 兩 面 角 Ψ、Φ、χ1 χ2χ3[14 ,15 ]等都已成功地定量描述了多肽類似物的結(jié)構(gòu)。但是 ,由于多肽分子的復雜性及較大的柔性 ,怎樣進一步校正這些參數(shù)使它們更適應多肽分子的特點 ,以及怎樣準確全面地定量描述多肽的三維結(jié)構(gòu)信息和其它含非標準氨基酸的多肽類似物 ,仍是一個任重道遠的過程。
在定量構(gòu)效關系模型中 ,常用線性回歸、偏最小二乘法 (PLS) 、遺傳算法 ( GA) 和人工神經(jīng)網(wǎng)絡(ANN) 等統(tǒng)計方法 ,建立化合物的定量結(jié)構(gòu)參數(shù)與生物活性之間的函數(shù)關系。通常線性回歸數(shù)據(jù)分析法要求樣品的數(shù)目至少 3 倍于變量的數(shù)目 ,結(jié)果才相對可靠 ,因此它不適合多肽類似物的化合物數(shù)目少、定量結(jié)構(gòu)描述參數(shù)多的特點。目前 ,常用 PLS、GA 和 ANN 統(tǒng)計方法建立多肽的 QSAR 模型。
PLS 是在主成分分析的基礎上發(fā)展起來的一種統(tǒng)計方法。它與主成分分析的不同在于 ,主成分分析僅僅考慮了自變量的相互作用 ,而 PLS 在考慮自變量的同時也考慮了因變量的作用 ,通過折衷各自空間內(nèi)的因子 ,使模型較好地同時描述自變量和因變量。因此它能很好地克服當多肽的結(jié)構(gòu)描述參數(shù)遠遠超過化合物的數(shù)目時 ,一般多元線性回歸統(tǒng)計方法不能使用的缺陷。但是當結(jié)構(gòu)描述符的信息比較分散時 ,用 PLS 統(tǒng)計方法將可能產(chǎn)生權(quán)重分散的問題 ,即在線性組合過程中 ,很容易將那些原始參數(shù)中占很少比例 ,但它們的累計信息對建立 QSAR 模型卻很重要的一些參數(shù)忽略掉 ,以至于在以后分析QSAR 模型和分子設計中沒有考慮到這些重要信息。
近年來 ,人們把遺傳算法用于數(shù)據(jù)分析[16 —21 ],發(fā)現(xiàn)它在定量構(gòu)效關系研究中是一種很有潛力的計算工具 ,尤其在尋找最佳構(gòu)效關系模型時[21 ] 。遺傳算法是一類借鑒生物界自然選擇和遺傳機制 ,高度并行、隨機、自適應的搜尋算法 ,于 20 世紀 60 年代由 Holland[22 ]創(chuàng)建。應用遺傳算法建立多肽的 QSAR模型的優(yōu)點是 : (1) 它能建立多個 QSAR 模型 ,且每個模型均能在不同側(cè)面反映結(jié)構(gòu)與活性之間的關系 ;(2) 在多數(shù)情況下 ,共線性的參數(shù)不能同時出現(xiàn)在一個模型中 ,因此它還能有效地避免權(quán)重分散的問題 ,而且進一步使得所建立的 QSAR 模型易于解釋分析 ; (3) 遺傳算法可以采用線性多項式、高次多項式和其他非線性函數(shù)等形式建立 QSAR 模型 ,因此使得多肽的 QSAR 方程更加靈活多樣。目前 ,遺傳算法越來越廣泛地應用到各種化合物的 QSAR 分析中。遺傳算法雖然比較簡單 ,但很靈活 ,在不同的應用中可以存在不同的實現(xiàn)方法。為了發(fā)揚遺傳算法的優(yōu)點 ,避免它的缺點 ,遺傳算法還常和其它統(tǒng)計方法如 GA2PLS[23 —25 ] 、GARGS[26 ]等結(jié)合去解決問題。
人工神經(jīng)網(wǎng)絡是對生物神經(jīng)網(wǎng)絡的模擬和抽象 ,是一種由大量基本信息處理單元通過復雜的連接而成的非線性動力學系統(tǒng) ,具有并行性、容錯性、非線性和自學習性等特點。人工神經(jīng)網(wǎng)絡作為一種新的統(tǒng)計分析方法 ,現(xiàn)已被廣泛地應用于 QSAR 的研究中[27 —32 ] 。為了加強人工神經(jīng)網(wǎng)絡的統(tǒng)計分析功能 ,最近又出現(xiàn)了一些新的神經(jīng)網(wǎng)絡統(tǒng)計方法 ,如模糊人工神經(jīng)網(wǎng)絡[33 ] 、概然論神經(jīng)網(wǎng)絡(probabilisticneural networks ,PNN) 和無顯著衰變神經(jīng)網(wǎng)絡 (gener2alized regression neural networks ,GRNN)[34 ]等。它們不但具有強大的學習功能 ,而且能夠為 QSAR 模型提供易于解釋的規(guī)則。從人工神經(jīng)網(wǎng)絡算法強大的應用潛力中可以看出 ,它是多肽的 QSAR 研究中很有前途的統(tǒng)計方法 ,還有待我們進一步去發(fā)掘、探索。
二、計算機輔助多肽藥物分子設計方法
近 20 年來 ,科學家們發(fā)現(xiàn)了許多天然存在的內(nèi)源性的生物活性肽 ,這些生物活性肽和受體分子的相互作用控制著特定的生理學事件 ,使得生物活性肽有可能作為治療藥物 ,且顯示出了很大的優(yōu)勢。但肽類化合物本身作為藥物有許多缺點 ,如不穩(wěn)定性、生物利用度低、不易得到等。為了克服上述種種不利的因素 ,對多肽從結(jié)構(gòu)上進行改造或結(jié)構(gòu)替換 ,這樣就形成了模擬肽學[35 ,36 ] 。模擬肽學已成為多肽藥物分子設計的主要途徑。目前 ,隨著計算機輔助藥物設計及組合化學的發(fā)展 ,虛擬組合化學庫在多肽類似物的分子設計中也得到了蓬勃的發(fā)展。以下就簡要的介紹模擬肽學和虛擬組合多肽庫在多肽分子設計中的應用。
1. 分子設計中的模擬肽學
模擬肽學就是通過多種途徑對肽從結(jié)構(gòu)上進行改造或結(jié)構(gòu)替換。目前改變肽結(jié)構(gòu)的基本方法主要有兩大類 :一類是在原有肽骨架 (主鏈) 基礎上進行改造 ,主要的途徑有環(huán)肽的分子設計方法及受約束的氨基酸替換的方法 ;另一類是非肽結(jié)構(gòu)模擬。用這兩類結(jié)構(gòu)改造的分子都避免了母體肽分子的高柔性 ,且分子構(gòu)象采取所需的構(gòu)象 ,這樣設計出來的藥物候選物可以把代謝穩(wěn)定性和口服生物有效性結(jié)合起來。
受約束(或化學修飾) 氨基酸替換的方法是 ,在原有肽骨架的基礎上 ,把約束氨基酸引入生物活性肽的氨基酸序列 ,限制兩面角 Φ、Ψ 和ω的旋轉(zhuǎn) ,形成局部的約束 ,并約束由共價或非共價立體相互作用所決定的側(cè)鏈構(gòu)象 ,進而改變生物活性肽的穩(wěn)定性和活性。這些約束氨基酸可作為構(gòu)象探針 ,用來探求和解釋是何種局部構(gòu)象決定一種特定肽的生物活性。經(jīng)典的構(gòu)象探針是丙氨酸 ,用丙氨酸來逐個替換肽鏈中的每個氨基酸 ,在盡可能保持構(gòu)象不變的情況下 ,決定每個氨基酸對活性的影響。在其他氨基酸模型中 ,D 型氨基酸是最常用的殘基 ,而且常常起關鍵作用 ,如在肽鏈的酶解點引入 D 型氨基酸 ,可以提高肽鏈的抗酶解能力和活性。近年來 ,關于約 束 氨 基 酸 的 例 子 很 多 , 如 α2甲 基 化 氨 基酸[38 ,39 ] 、Nα2Cα 環(huán)化氨基酸[40 ,41 ] 和 α2烷基環(huán)烷羧酸[42 ,43 ]等。可見 ,用天然的或非天然的氨基酸進行取代分子設計 ,對側(cè)鏈進行優(yōu)化 ,可以提高化合物的活性及其與受體的選擇性 ,進而設計出高活性的化合物。
非肽結(jié)構(gòu)模擬就是替換肽骨架 ,同時保留其藥效團及其所需的三維排布 ,設計新的非肽小分子。進行非肽結(jié)構(gòu)模擬的前提是確定生物活性肽的三維藥效團 ,所謂三維藥效團就是生物活性肽與受體結(jié)合(或作用) 時 ,起重要作用的原子或基團的空間距離限制及它們的空間三維結(jié)構(gòu)排布。一個成功的三維藥效團模型 ,包含了藥物與受體結(jié)合部位的一些結(jié)構(gòu)信息 ,此信息可用來指導分子設計。因此 ,如果設計的非肽小分子符合三維藥效團模型的要求 ,它就可能有活性。構(gòu)建生物活性肽的三維藥效團的一般步驟為[37 ]: (1) 選擇一系列與受體親和性高的肽類似物組成一個分子集合 ,從這些分子中選出藥效基團元素 ,在所有的肽類似物分子中 ,藥效基團元素的數(shù)目必須相同 ,分子剛性要大 ,而且所測定的生物活性數(shù)據(jù)應有很好的同源性 ; (2) 對多肽類似物集合中的每一個活性化合物進行構(gòu)象分析 ,得到它們的低能構(gòu)象 ; (3) 用分子疊合方法選擇高活性肽類似物的活性構(gòu)象 ,分子疊合時用藥效基團元素作為分子間原子疊合對 ,以此建立化合物的三維藥效團。生物活性肽的三維藥效團模型確定后 ,保持其三維藥效團 ,通過替換肽骨架來進行非肽小分子設計。通常設計的小分子化合物能克服肽類似物普遍存在的生物利用率低、代謝速度快、不適于口服等限制 ,可見非肽結(jié)構(gòu)模擬是鑒定和優(yōu)化潛在肽類藥物的可行的途徑之一。
在模擬肽學的分子設計中應該注意以下幾個關鍵問題[35 ,36 ]:在第一代的模擬肽中保持一定的構(gòu)象柔性 ;保持肽側(cè)鏈的藥效團 ;用盡量多的非肽結(jié)構(gòu)置換肽骨架 ;肽類藥物的靶標應有現(xiàn)成的假定藥效基團模型。
2. 虛擬組合多肽庫
近年來 ,組合化學和高通量篩選技術的迅速發(fā)展 ,對傳統(tǒng)的先導化合物的發(fā)現(xiàn)和優(yōu)化產(chǎn)生了巨大的影響。特別是隨著計算化學與分子模擬技術的發(fā)展 ,計算機構(gòu)建虛擬樣品庫的方法已用于藥物設計 ,并在先導化合物的研究和開發(fā)中起了重要的作用[44 —46 ] 。與此同時 ,虛擬組合多肽庫也在肽類藥物的設計中得到了應用[47 ] 。以下舉例說明虛擬組合多肽庫的構(gòu)建及應用。
利用虛擬組合多肽庫的最終目的是為了發(fā)現(xiàn)先導化合物 ,而且要求合成出的這些化合物能夠為先導化合物的發(fā)現(xiàn)和優(yōu)化提供盡可能多的構(gòu)效關系信息。也就是說在保證多肽庫體積的前提下 ,根據(jù)實驗目的設計出滿足一定分子多樣性的組合多肽庫?梢 ,隨著計算機輔助分子設計和基于結(jié)構(gòu)的藥物設計方法在虛擬組合多肽庫中的應用 ,虛擬組合多肽庫的質(zhì)量和篩選效率會得到更大地提高 ,而且虛擬組合多肽庫在多肽藥物的分子設計中 ,將會提供更多的理論依據(jù)和指導思想。
三、結(jié) 語
可以預見 ,隨著計算機輔助分子設計的發(fā)展 ,多肽的定量構(gòu)效關系、模擬肽學和虛擬組合多肽庫會更多地用于指導先導化合物的研究和開發(fā) ,而且多肽類藥物分子設計方法會更加完善和豐富 ,相信在不久的將來此研究領域會有更大的突破。
免責聲明:本文為行業(yè)交流學習,版權(quán)歸原作者及原雜志所有,如有侵權(quán),可聯(lián)系刪除。文章標注有作者及文章出處,如需閱讀原文及參考文獻,可閱讀原雜志。