AI浪潮席卷而至,藥物研發(fā)如何破解成本與效率的“雙重滯礙”?
投入巨量資源,但新藥研發(fā)的成功率、回報率卻非常低——藥物研發(fā)早已走入“倒摩爾定律”的“怪圈”。AI如何助力產業(yè)破局?
藥物研發(fā)走入“倒摩爾怪圈”,
AI成為產業(yè)破局關鍵
一款全新靶點、全新機制的新藥,其研發(fā)需要經過靶點發(fā)現(xiàn)、靶點驗證、先導物發(fā)現(xiàn),以及先導物優(yōu)化等階段,這個過程可能需要驗證、篩選數(shù)十萬個化合物。此前在藥物研發(fā)行業(yè)一直有一個著名的“雙十定律”,即至少需要10年時間與10億美元,才可能研發(fā)出一款新藥。而按照Nature的統(tǒng)計,“雙十定律”其實已經是一種理想業(yè)態(tài),據(jù)國外某行業(yè)報告提供的數(shù)據(jù)顯示,一款新藥的平均研發(fā)周期達10年以上,投入資金則在20億美元左右;即使候選藥物通過I期臨床試驗,其進入市場的可能性也僅約5%左右。投入巨量資源,但新藥研發(fā)的成功率、回報率卻非常低——藥物研發(fā)早已走入“倒摩爾定律”的“怪圈”(即自1950年起,批準投資10億美元研發(fā)的新藥數(shù)量每9年就會減半)。
面對制藥發(fā)展過程中面臨的諸多痛點,產業(yè)正在積極尋找破題方法。從初期計算機輔助藥物設計(CADD),發(fā)展到如今的AI輔助藥物研發(fā)(AIDD),在不斷嘗試和探索后,通過AI技術來破解藥物發(fā)展難題,已經逐漸成為行業(yè)共識。來自TechEmergence的報告顯示,AI可以將新藥研發(fā)的成功率提高到16.7%,AI輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費用,并在研發(fā)的主要環(huán)節(jié)節(jié)約40%至60%的時間成本。
AI在這個領域的成功要旨,要歸功于它強大的數(shù)據(jù)分析和深度學習能力,使它能夠快速處理和解析大量的生物化學信息,幫助科學家篩選出合適的化合物,設計、優(yōu)化藥物分子結構,從而大幅縮短藥物研發(fā)時間、降低研發(fā)成本并提高成功率。也就是說,AI已經按下新藥研發(fā)的“加速鍵”,并為推動產業(yè)發(fā)展乃至人類社會進步描摹著更加廣闊的前景。
英特爾:助力AlphaFold2性能提升,
加速開啟藥物研發(fā)新里程
由DeepMind在2021年發(fā)布的AlphaFold2,當屬目前AI制藥領域的最重要的算法。它自身在蛋白質結構預測上具有極高的可信度,能夠對有機體構成、運行和變化的規(guī)律開展更深層次的詮釋和探究,進而可為生物學、醫(yī)學、藥學等領域的未來研究與發(fā)展提供高質量的生物學假設。2021年,AlphaFold2成功預測出了超過100萬個物種的2.14億個蛋白質結構,幾乎涵蓋了地球上所有已知的蛋白質。這項成果的誕生,讓科學已知蛋白質3D形狀的查詢工作,從原來的不可能,變得像使用搜索引擎一樣簡單。毫不夸張地說,AlphaFold2憑借自身在蛋白質結構預測上的高可信度,以及遠優(yōu)于傳統(tǒng)實驗方法的高效率、低成本,樹起了一座“AI for Science”的全新里程碑。它不僅在生命科學領域掀起了顛覆式的革新,也成為了AI在生物學、醫(yī)學和藥學等領域落地的核心發(fā)力點。
違反常識!CPU速刷AlphaFold2竟能更順暢
隨著越來越多的科研機構、實驗室和企業(yè)開始借助或計劃采用AlphaFold2進行蛋白質結構預測,它亟須更廣泛IT基礎設施的支持,來推進實實在在的部署和落地。于是,英特爾開始在有海量用戶安裝和使用的基礎服務器用至強CPU平臺上對AlphaFold2進行端到端的高通量優(yōu)化嘗試,這一試,一切都隨之改變。2022年,英特爾先是報出第一波優(yōu)化成績——它以第三代至強? 可擴展平臺為硬件基座,通過優(yōu)化讓AlphaFold2通量提升達到了優(yōu)化前的23.11倍。2023年,針對不斷攀升的算力需求,英特爾又出動了第四代至強? 可擴展處理器,其新增了全新的內置AI加速技術——英特爾? AMX,可為對于深度學習工作負載來說至關重要的矩陣乘法提供更優(yōu)的算力支持。這項技術可助每個核心存儲更大的數(shù)據(jù)塊,并在單個指令操作中完成更多的矩陣運算。而且除了算力上的倍增,矩陣運算的完全硬件化,還減少對系統(tǒng)緩存和內部寄存器等資源占用,保證CPU AI加速流水線運行得更加流暢。結果不負眾望,第四代至強? 可擴展處理器的引入,使得AlphaFold2的通量在第三代至強? 平臺優(yōu)化的基礎上再獲高達3.02倍的提升。在英特爾開展相關探索的同時,國內已有云服務廠商也通過與英特爾的合作,在參考英特爾優(yōu)化經驗的基礎上提出了創(chuàng)新的、基于公有云應用和交付方式的方案,并通過一系列測試,得出了基于第四代英特爾? 至強? 可擴展處理器的加速方案相比于某主流GPU,在通量上更優(yōu)、在性價比上更為出色的結果,該團隊還發(fā)現(xiàn),當運行的任務序列長度超過300或400個氨基酸的情況時,幾乎只有CPU能夠成功算完,而GPU的失敗率會很高。要知道,AlphaFold2在AI for Science領域一直被認為是最吃AI專用加速芯片、如GPU紅利的前沿技術。上面這些成果的釋出,就意味著CPU也能在AI for Science領域占有一席之地,并發(fā)揮巨大、而且是出乎大家意料的威力。
五大步驟、四大“強芯針”,至強? 可擴展平臺助力AlphaFold2推理性能顯著提升
說完成績,我們再來瞧瞧至強CPU是如何實現(xiàn)這一奇跡的,開篇一句話,即AlphaFold2結構預測各環(huán)節(jié)面臨著龐大的計算量,使用者需要更加充分地挖掘硬件的計算潛力來提升執(zhí)行效率。
因此,針對AlphaFold2的設計特點,英特爾提供的AlphaFold2端到端全面優(yōu)化方案聚焦在預處理和模型推理兩個層面,在第三代和第四代英特爾? 至強? 可擴展處理器上具體分為:
第一步,預處理階段:借助第三代或第四代英特爾? 至強? 可擴展處理器的多核優(yōu)勢及其內置的英特爾? AVX-512技術的高通量優(yōu)化。
第二步到第五步,模型推理階段:要將深度學習模型遷移至面向英特爾? 架構優(yōu)化的PyTorch;然后對遷移后的代碼進行一系列的API改造,在不改變網(wǎng)絡拓撲的前提下,引入PyTorch Just-In-Time(JIT)圖編譯技術,將網(wǎng)絡最終轉化為靜態(tài)圖;再切分 Attention 模塊和算子融合;最后借助英特爾? 至強? 可擴展平臺提供的高效且更為均衡的計算和存儲優(yōu)勢破解多實例運算過程中的計算和內存瓶頸。
在基于第四代英特爾? 至強? 可擴展處理器的優(yōu)化工作中,英特爾基于:(1)借助TPP技術,降低推理過程中的內存消耗、(2)支持DDR5內存與大容量緩存帶來張量吞吐提升、(3)英特爾? AMX_BF16在保證精度的前提下加速推理過程、(4)高帶寬內存HBM2e增加訪存通量這四劑“強芯針”,讓AlphaFold2的推理性能獲得了更進一步的提升。
強強聯(lián)合,英特爾持續(xù)為蛋白質結構預測降本增效
事實上,除了有內置了AI加速技術的CPU產品用來加速推理,英特爾同樣也有自己的異構平臺布局,其專用的AI加速芯片,一樣可以對整個蛋白質結構預測平臺上的各種任務提供有力的支持,而且性能更好,而這些加速芯片與CPU的組合,就讓英特爾架構能夠更好地適合差異化的應用場景,顧全推理和訓練的需求并更靈活的兼顧在成本和性能上的目標。Github上知名的AI+科學計算的開源項目——Colossal-AI的團隊就與英特爾Habana技術團隊合作,充分利用Colossal-AI大模型優(yōu)化能力,推出了使用至強? 可擴展處理器進行數(shù)據(jù)預處理,并采用Habana? Gaudi? AI加速器優(yōu)化AlphaFold2模型推理的方案。據(jù)該團隊透露,相比他們此前使用的方案,AlphaFold2端到端推理速度最高提升3.86倍,相較GPU方案,應用成本最多降低39%!Colossal-AI團隊上述嘗試中使用的還是Gaudi?芯片,Gaudi?2芯片也已于7月11日正式與用戶們見面。在6月27日剛剛發(fā)布的MLPerf新一期測試報告中,它已經有了先聲奪人的表現(xiàn)——不論是大家已經非常熟悉的BERT、ResNet、Unet模型,還是最近半年異軍突起的大語言模型GPT-3、Gaudi?2都有非常靚眼的表現(xiàn)。除了Gaudi?2
這樣的AI專用加速芯片,英特爾更偏向通用加速場景的數(shù)據(jù)中心GPU
Max系列,也于近期完成了在美國阿貢實驗室Aurora系統(tǒng)中的安裝工作,它未來可能更適用于AI+科學計算的融合式應用場景。
不難看出,英特爾未來在AI或整個企業(yè)計算領域的異構多芯布局,已經在腳踏實地地走向現(xiàn)實,就更別提它還會為這些硬件產品搭配可以進行統(tǒng)一編程、輕松遷移并能跨異構調度算力資源的oneAPI軟件工具包。業(yè)界有理由期待,它將為我們提供更多也更好的新產品、新技術,對蛋白質結構預測的推理和訓練等各種任務,乃至生命科學和制藥領域的更多科研方向,輸出更有力的支持。有一個方向值得一提,即隨著大模型時代的到來,一直致力于將先進AI技術與前沿生物技術相結合的百圖生科,也開始深耕生命科學大模型驅動的AIGP(AI Generated Protein)平臺,旨在利用AI從預測蛋白質結構到直接生成和設計蛋白質。未來,是否還會有更多AI輔助的生命科學研究和制藥領域的創(chuàng)新?是否還有更多算法可以在生命科學和醫(yī)藥創(chuàng)新領域里找到機遇和探索的空間?讓我們拭目以待。(企業(yè)供稿)
如果您對本文涉及的基于Habana? Gaudi? 與英特爾? 至強? 可擴展處理器對AlphaFold2進行端到端優(yōu)化的技術細節(jié)感興趣,如果您也想了解百圖生科在AIGP領域的最新進展,英特爾《至強實戰(zhàn)課》之《AI驅動的生命科學與醫(yī)藥創(chuàng)新》將為您帶來更加全面且詳細的真人講解,歡迎大家注冊收看~
了解更多第四代至強? 可擴展平臺對AlphaFold2的優(yōu)化方案,請點擊「此處」