藥物研發的流程通常漫長且成本高昂,人工智能技術通過對藥物數據的快速分析建模,成為了加速藥物研發過程的重要技術手段。然而,現有的深度學習模型決策過程不透明,可解釋性不足,無法可靠地應用在藥物研發中。此外,模型還依賴于大量的有標簽數據,但在藥物研發的過程中,數據獲取通常伴隨著高昂的成本和漫長的時間等待,這導致藥物標簽數據極為稀缺。常見模型在這種場景下存在預測準確性低、數據需求量大、可解釋能力弱的局限。為了應對這一問題,清華大學電子工程系姚權銘助理教授課題組以小樣本學習技術作為突破口,研究提升模型樣本利用效率的算法,使深度學習模型能快速泛化到只有少量有標簽樣本的藥物研發相關任務上。
圖1.(a)人工智能助力藥物研發的重要挑戰:可解釋性不足和樣本數量稀缺(b)現有的藥物研發相關任務研究方法存在的局限
藥物研發相關的典型任務——藥物互作用(Drug-Drug Interaction,DDI)預測是臨床研究的重要部分。目前大約有6.7%的住院患者面臨藥物副反應的困擾,大約有0.32%的住院患者面臨藥物副反應帶來的生命危險。挖掘潛在的藥物間相互作用對于加速藥物研發過程和加強人民健康保障都有重要意義。該任務可以建模為藥物-藥物互作用網絡上的鏈路預測問題。然而,由稀缺的藥物標簽數據構建的藥物-藥物互作用網絡非常稀疏,傳統數據驅動方法在這種場景下表現不佳。
圖2.(a)小樣本學習技術啟發的基于流的圖神經網絡(EmerGNN)的框架(b)基于流的圖神經網絡(EmerGNN)在預測準確性、數據需求量、可解釋能力方面與基線方法的比較
針對藥物標簽數據稀缺的問題,課題組采用了小樣本學習的方法,在醫藥領域首次提出了有效的深度學習方法——“藥物相互作用的知識子圖學習方法(Knowledge Subgraph Learning for Drug-drug Interaction Prediction,KnowDDI)”和“基于流的圖神經網絡與生物醫學網絡的新興藥物相互作用預測(Emerging Drug Interaction Prediction by Flow-based Graph Neural Network,EmerGNN)”,這兩種方法分別高效地實現了現有藥物潛在互作用的發掘和新藥物間反應的預測。
課題組在原始藥物間反應圖譜的基礎上引入了生物醫藥網絡(Biomedical Network),利用其中豐富的醫藥學信息,構建了新的醫藥圖譜,有效解決了監督數據不足的問題。醫藥圖譜信息豐富,但同時也伴隨著眾多的噪聲,準確預測藥物互作用需要排除噪聲干擾,挖掘有效信息。因此,課題組從醫藥圖譜中提取目標藥物之間的關系路徑作為子圖,并為路徑設置注意力權重,基于注意力機制建立基于流的圖神經網絡EmerGNN,以此完成關鍵知識的提取與知識傳遞,建立了藥物互作用預測的完整框架(圖2.a)。
在公共數據集上的大量實驗表明,提出的EmerGNN在預測準確性和可解釋能力上顯著優于基線方法,數據需求量顯著降低(圖2.b)。這些成果為藥物研發中的藥物互作用預測提供了有效的算法和工具,增強了算法的可解釋性,展現了人工智能在醫藥領域的重要輔助作用。這些研究成果有望應用于候選藥物篩選和臨床試驗,對于加速藥物研發和促進人類健康具有重大意義。
相關研究成果以“藥物相互作用的知識子圖學習方法”(Accurate and Interpretable Drug-Drug Interaction Prediction Enabled by Knowledge Subgraph Learning)為題,近期發表于《自然·通訊(醫藥)》(Nature Communication Medicine)。百度研究員王雅晴博士為論文第一作者,姚權銘為論文通訊作者。以“基于流的圖神經網絡與生物醫學網絡的新興藥物相互作用預測”(Emerging Drug Interaction Prediction by Flow-based Graph Neural Network)為題,近期發表于《自然·計算科學》(Nature Computational Science),第四范式(北京)技術有限公司研究員張永祺博士為論文第一作者,姚權銘為論文通訊作者。研究得到國家自然科學基金項目的支持。
論文鏈接:
https://www.nature.com/articles/s43856-024-00486-y.pdf
https://www.nature.com/articles/s43588-023-00558-4
版權聲明:本文內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 舉報,一經查實,本站將立刻刪除。