以碼抗?。河嬎銠C如何輔助抗病毒藥物研發

原創:學CADD的蛋(中國科學院上海藥物研究所在讀博士)

首發:“科學大院”公眾號 

 

  我原以為,這依然會是一個尋常的寒假。

  直到疫情的形勢愈發嚴峻。

  對病毒各類蛋白的調研任務分配到遠在五湖四海的每個實驗室成員頭上。沒有瓶瓶罐罐,沒有五花八門的試劑,沒有昂貴精致的儀器。一臺能遠程連上服務器的電腦,這便是我所擁有的全部。

  圖1. 藥物研發有時只需要一臺能連上服務器的筆記本(圖片來源:veer圖庫)

 

  很多人以為,藥物的研發只有在穿著白大褂的實驗室里可以做。然而,隨著近十余年,各類理論方法、計算機硬件、及工業和學術專業軟件的發展與成熟,計算機輔助藥物設計(Computer-Aided Drug Design, CADD)的方法已日趨成熟,其應用極大地加快了新藥研發的速度與效率,已成為現代藥物研發的常規方法之一[1]。

  依賴于這樣的技術,即便我足不出戶,在家遠程工作,也能為尋找治療此次病毒感染的潛在藥物貢獻自己的力量。

 

 尋找關鍵蛋白質

  蛋白質是生命的物質基礎,是組成細菌、病毒及動植物的一切細胞、組織的重要成分。各類功能性蛋白質在機體中各司其職,維系著整個機體的正常運轉。

  以病毒為例,病毒是由核酸(DNA或RNA)與蛋白質構成的非細胞形態,介于生命體與非生命體之間,無法自我復制與繁殖,需要寄生在活的宿主細胞內,依賴于宿主細胞的原料、能量供給與場所,完成自我的復制與釋放[2]。這一過程就好比一個A國的賣假鈔的罪犯(病毒),本身沒有印制A國貨幣的能力;但當他侵入B國的印鈔廠(宿主細胞)后,他就能調用B國工廠的所有資源,來印制A國的貨幣(病毒的核酸與蛋白)。

  病毒的生命周期需要經歷吸附、侵入、脫殼、生物合成、組裝和釋放等六大步驟[2],病毒的各類功能性蛋白在這些步驟中分工明確、高度協作,從而才能完成從感染宿主細胞到復制病毒的整個周期。目前,研究人員已從新型冠狀病毒(2019-nCov)中分離出orf1ab, S, E, M, N等10條基因組序列,各自編碼相應的病毒蛋白。

  通過與同為冠狀病毒的SARS病毒類比,我們可以合理地推測出新型冠狀病毒基因編碼的各類蛋白質的功能。舉例來講,如,orf1ab基因編碼orf1ab多聚蛋白,參與病毒RNA的轉錄與復制,并具有蛋白酶、甲基轉移酶等多個功能;S基因編碼冠狀病毒的表面糖蛋白,也稱為棘突蛋白(Spike Protein),通過與人體內的ACE2蛋白質結合,直接介導病毒對宿主細胞的感染及融合,這類蛋白如同日冕般分布在病毒的包膜上,“冠狀病毒”由此得名。這些功能性蛋白質對病毒的感染與復制發揮著重要的作用,單獨或同時干擾其中的一個或多個蛋白質的功能,抑制其活性,便能阻斷病毒感染宿主細胞或在宿主細胞內自我復制的進程,從而起到治療的效果。

  因此,一旦獲取了病毒蛋白質的晶體結構,基于前期對其功能的了解,我們便能利用計算機輔助藥物設計的技術,針對性地尋找潛在的有效藥物。那么,這一過程是如何進行的呢?

 

 魚與刀,鎖與鑰匙

  若是“以貌取物”的話,在以“光滑彈嫩”為美的今天,蛋白質表面坑坑洼洼,“長得”可實在不算漂亮??汕∈沁@些坑坑洼洼的空腔,才是真正暗藏玄機的地方。

  以SARS病毒orf1ab多聚蛋白中的一段,3C-like蛋白酶,也稱Mpro蛋白為例。這一蛋白主要負責將多聚蛋白水解為功能性的多肽,以發揮其各自的功能;就好比做魚的時候,用一把鋒利的刀把整條魚除鱗去臟,并分為魚頭、魚身、魚尾,分別預備燉湯、紅燒、清蒸一樣。這一蛋白酶的活性位點,就好比是這把菜刀的刀刃,就藏身于蛋白質表面的空腔(口袋)中(圖2)。

  圖2. 坑坑洼洼的SARS Mpro蛋白表面(白色)及其蛋白酶活性位點口袋(紅色圓圈),PDB編號2GX4[3](圖片來源:PyMol作圖)

  篩選或合成得到的具有生物活性的小分子可以很好地結合在這一活性位點的口袋中(圖3),從而抑制蛋白酶的活性,阻止其將多聚蛋白切割為功能性多肽,從而阻止這些多肽在后續病毒的復制和感染中發揮功能。就好比沒收了這把切魚的刀,或者在刀刃上套了一層使其鈍化的保護套,使其無法處理這條魚,從而無法進行后續的烹飪。

  圖3. SARS Mpro蛋白表面(白色)及文獻報導的抑制劑(綠色棍裝),PDB編號2GX4[3](圖片來源:PyMol作圖)

  對每一個蛋白質,尋找具有令人滿意的生物活性的分子的過程,就好比是面對一把精美絕倫的鎖,需要找到一把同樣精美絕倫的鑰匙,來與之緊密契合。而計算機輔助藥物設計所需要做的,就是以高效和低成本的方式,去找到這樣一把合理的鑰匙;即,基于對蛋白質功能的前期了解,及對蛋白質結構的系統分析,通過計算的方式,評估各類分子在蛋白質口袋中的結合強度和作用模式,從而篩選或設計出最有可能成為蛋白功能抑制劑(或激動劑)的分子。

 

  計算機輔助藥物發現

  不幸的是,盡管近年來相關技術飛速發展,但找到這樣一把精美絕倫的鑰匙絕非易事。一個新藥從研發到上市往往需要消耗數十年的時間和數以十億計的美金[4]。但好消息是,總有這樣幾把鎖長得有點像,其鑰匙可以通用,就像艾滋病蛋白酶的抑制劑可能可以作用于冠狀病毒的蛋白酶(如奈菲那韋和洛匹那韋),負責埃博拉或流感病毒RNA復制的RNA聚合酶(RNA-dependent RNA polymerase,RdRp)抑制劑可能可以作用于冠狀病毒的RdRp一樣(如法匹拉韋和瑞德西韋)[5]。

  面對急性爆發的疫情,從已上市或已在臨床上的“老藥物”中尋找合適的分子顯然是相比從頭研發新的分子更具時間優勢的策略。運用計算機輔助藥物設計,基于一種叫做分子對接(molecular docking)的技術進行虛擬篩選(virtual screening),我們可以模擬出每個“老藥”分子在病毒蛋白質口袋中的結合構象,通過打分函數、自由能計算等方式評估其理論上的結合強度,從而分析該分子成為潛在抑制劑的可能性。就好比當我們已知“鎖”的構造時,運用這樣的技術,可以不必親自把每把鑰匙都在鎖孔里插一遍來尋找能開鎖的那把;通過計算機模擬分析的方式,篩選出最可能打開鎖的幾把鑰匙,而后只對這幾把鑰匙進行測試就可以了。

  甚至于,利用同源模建(homology modeling)的技術,我們甚至可以不用知道當前病毒蛋白這把“鎖”的構造,在僅有蛋白質氨基酸序列的情況下,構建出病毒蛋白質結構可能的模型,從而提交虛擬篩選作業。盡管據早期的新聞報導,2019-nCov病毒和SARS病毒在基因組水平的相似度只有70%,但事實上,通過對病毒蛋白的序列比對可以發現,此次新型冠狀病毒的某些關鍵蛋白和SRAS病毒的氨基酸同源性能達到95%以上(例,圖4)。因此,依賴于蛋白質晶體結構數據庫(Protein Data Bank)中,早年研究SRAS病毒時獲得的SARS病毒蛋白的晶體結構,我們便可以構建出合理的2019-nCov的相應蛋白質的結構。

  圖4. SARS與2019-nCov的Mpro蛋白氨基酸序列比對(圖片來源:BoxShade作圖)

  因此,對急性爆發的疫情,當結構生物學等基礎研究來不及跟上;當病毒毒性太大,實驗室條件受限、滿足生物安全要求的實驗室較少;或者當待測試分子過多,人員不足,成本過高時,計算機輔助的方式都不失為一種高效的策略,為活性分子的發現與機制探索提供寶貴的建議,從而為特效藥物的研發贏得寶貴的時間。

 

  寫在最后的話

  我自寒假的第三天開始在家參與此次新型冠狀病毒的相關工作,至今已過去約兩周的時間。無疑,在博士求學生涯即將結束的階段,這是我度過的最充實、也是最緊張的一個假期。

  但正如前文所述,藥物研發,絕非易事。就像早先一些學者所說的“不管疾病有多嚴重,不管我們期待新藥和新疫苗的愿望是多么迫切,新藥和新疫苗開發的規律無法被逾越?!盵6]藥物研發有其固有的規律,絕非人的意志可以轉移。盡管如前所述,現今已有多個藥物在進行臨床或臨床前研究[5],但保護好自己不受感染依然是每個人的當務之急。

  所幸相比17年前,我們現在有了天河,有了神威,用于蛋白體系模擬的算力早與當年不可同日而語,一個又一個課題組及科研工作者,毫不猶豫地犧牲了自己的休息時間參與此次攻關。

  也許就像高中政治課本里所說的那樣吧:“道路是曲折的,前途是光明的!

  2020年2月寫于等服務器計算結果的間隙

 

  參考資料:

  1.Jorgensen, W. L., The many roles of computation in drug discovery. Science 2004, 303, 1813.

  2.中科院微生物所, 科學大院, 入侵&反擊!病原體和人體的攻防戰.

  3.Yang, S.; Chen, S. J.; Hsu, M. F.; et, al., Synthesis, crystal structure, structure-activity relationships, and antiviral activity of a potent SARS coronavirus 3CL protease inhibitor. J. Med. Chem. 2006, 49, 4971.

  4. 管麗,科學大院,新藥是如何從實驗室走向市場的?

  5.醫藥魔方, 醫藥魔方Info, 重磅!Remdesivir新型肺炎臨床試驗2月3日啟動!海正法匹拉韋緊急申報上市.

  6.王立銘, 賽先生, 新藥新疫苗,我們什么時候能等到?

  版權說明:未經授權嚴禁任何形式的媒體轉載和摘編!