2024年8月26日至30日,備受矚目的數據庫理論和系統領域國際頂級學術會議VLDB 在廣州召開,深圳計算科學研究院樊文飛院士科研團隊攜“去病”生物創新藥研發AI系統(Graph Association Analyses for Early Drug Discovery)參會,獲大會唯一最佳系統演示獎(BEST DEMO AWARD)。
藥物研發領域一直面臨著“10億、10年、10%”的挑戰,即從藥物發現到最終上市,需要10年時間、耗費10億美金,卻只有不到10%的成功率。隨著人工智能的快速發展,業界正在努力尋求利用AI技術提高研發效率,加速藥物發現和開發過程。
深圳計算科學研究院開發的“去病”系統,旨在解決傳統藥物研發過程中的一些關鍵問題,如依賴專家經驗、需要大量的實驗以及數據質量參差不齊等。該系統采用自主研發的內嵌機器學習的邏輯規則“AI+”體系,具備自動化、高精度、可解釋性和低成本優勢,顯著提升了藥物早期研發的效率,從而大幅縮短了藥物發現的周期。以下是“去病”系統的幾個核心特點:整合大規模生物醫學數據構建識圖譜,揭示藥物與疾病的復雜關聯關系;通過邏輯推理與深度學習相結合的方式,增強模型的預測能力;提供AI模型預測結果的可解釋性,為研發人員提供論據并滿足醫藥領域的監管要求;利用高效的崖山數據庫系統,實現強大的數據管理功能;配置數據質量控制和增強模塊,為藥物早期發現提供了前所未有的智能支持。
與通用的大模型相比,“去病”系統在靶點識別、藥物-疾病關聯分析以及藥物相互作用等領域表現出更高的效率、準確性和專業性,并具備更深層次的行業融合能力。
例如,在靶點識別方面,“去病”系統通過對PPI(蛋白質相互作用)網絡的自動發現,能夠預測目標蛋白的相互作用。在一個具體案例中,系統只用了三天時間便發現了SYT2蛋白質的自相互作用,并且這種蛋白質后來被《Nature》雜志的一篇論文證實與一種呼吸道疾病相關聯。在蛋白質相互作用的初步識別中,相比于黑盒模型,“去病”系統的預測準確率提升了43%。
在藥物-疾病關聯關系方面,“去病”系統持續匯聚、融合、清洗10多個生物醫藥數據庫的數據,構建了一個統一的知識圖譜。基于此圖譜,“去病”系統自動發現圖關聯規則,并運用機器學習內嵌于規則體系的GAR技術深入分析藥物、生物通路、基因以及疾病之間的復雜拓撲結構,從而預測現有藥物與疾病之間的潛在關聯。在實際應用中,“去病”系統僅用4小時便識別出5個與帕金森病相關的藥物候選,這極大地縮短了先導化合物的發現時間,降低了研發成本,并加速了藥物研發的整個流程。
VLDB(International Conference on Very Large Databases) 是數據庫領域頂級的國際會議,在全球學術界和工業界享有極高的聲譽。它與SIGMOD、PODS以及ICDE并稱為數據庫四大頂級會議,是展示和分享數據庫管理系統和數據管理領域前沿研究理論和技術成果的年度重磅國際學術盛會。
相關稿件