永久免费观看国产裸体美女_亚洲不卡av不卡一区二区_亚洲国产精品国语在线_99精品偷拍视频一区二区三区_色播在线播放_亚洲不卡免费视频

請輸入關鍵字
搜索

太初資訊

跨越技術壁壘,打破固有模式,用智慧重新鏈接關系。

太初元碁×百度螺旋槳×神威數智 | 國內首個成功復現AlphaFold3

近年來,大模型技術在生物信息學領域取得了眾多突破性進展,引起全球的廣泛關注,特別是在蛋白質結構預測方面的革命性成就,贏得了科學和產業界的高度認可。其中,AlphaFold系列模型擁有預測蛋白質單鏈、復合體以及復雜生物分子結構的能力,其準確性堪比真實實驗,極大地促進了生命科學的發展。特別是AlphaFold3能夠預測生物分子間的相互作用,極大助力于藥物研發合成,但由于算法未開源,限制了其在更廣泛的科研領域中的應用和發展。盡管有團隊嘗試根據AlphaFold3的論文進行復現,但目前也僅完成了代碼部分,尚未實現實際訓練,因此尚未能應用于實際科研中。


太初元碁與百度螺旋槳團隊以及神威數智組成的聯合研發團隊成功完成AlphaFold3模型的全復現工作,突破DeepMind在該領域的技術高地。此次AlphaFold3的國產化復現,不僅是一次技術革新,更是我國科技生態建設的重要里程碑,提升了國產大模型研發技術在全球AI大模型領域的競爭力。


本次成功復現AlphaFold3模型,基于百度螺旋槳團隊在HelixFold、HelixFold-Single、HelixFold2(HelixFold-Multimer)以及HelixDock等一系列工作中積累的豐富模型訓練和數據處理經驗;結合太初元碁與神威數智在異構眾核體系架構和大規模并行計算領域的專業優勢,及在生命科學領域和新藥研發方向的深厚積淀;依托國家超級計算無錫中心“太湖之光A+”智能超算系統提供的強大計算資源支持。聯合研發團隊優勢互補、協同合作,為業界首個AlphaFold3的全復現大模型奠定了基礎。


試用申請


AlphaFold3模型最新試用版本已于8月28日上線,

歡迎對AlphaFold3或聯合研發團隊相關工作感興趣的科研機構和商業公司

通過郵箱:husl@tecorigin.com 與我們聯系。

也可點擊底部“閱讀原文”,獲取試用鏈接,

或復制下方鏈接:http://223.108.218.41:8067/ 在瀏覽器中打開,

即可搶先試用!



具體技術性能

聯合研發團隊克服了一系列挑戰,如:模型結構復雜、數據高度復雜,訓練和運行所需的計算資源龐大等。在模型層面,AlphaFold3相較于AlphaFold2,增加了原子級建模,使得整體結構更加復雜,計算量也顯著增加。同時,AlphaFold3采用了擴散模型進行所有原子坐標的端到端推理。在數據處理方面,AlphaFold3不僅需要建模蛋白質,還必須處理小分子配體、核酸和離子等多種生物分子,復雜的數據預處理和大規模自蒸餾數據生成對模型性能的提升至關重要。

目前,復現工作在常規的小分子配體、核酸分子(包括 DNA 和 RNA)以及蛋白質的結構預測精度上已與 DeepMind發布的AlphaFold3相媲美,并在模型置信度上達標。


小分子配體

    

為了評估在蛋白質-配體結構預測中的效果,聯合研發團隊將復現工作與其他主流方法在PoseBusters數據集上的表現進行了對比。其中:
  • 數據集PoseBusters:一個用于評估配體對接算法的基準數據集, PoseBusters V1包含428個結構,PoseBusters V2是排除了與多個生物分子單元內距離小于5.0?的配體數據后,精簡的308個結構。
  • 對比的基線方法分為三類:不指定真實蛋白質結構的方法、指定已知蛋白質結構的方法,以及指定活性位點殘基的方法。
結果顯示在這兩個版本的數據集上,復現工作即便在沒有指定蛋白質結構的情況下,仍然展示出卓越的表現,成功率甚至超過了依賴已知蛋白質結構的方法,其預測精度與目前頂尖的AlphaFold3相當,這表明復現工作在蛋白質-配體相互作用預測領域的出色潛力。

模型預測的配體結構在立體化學和物理合理性是大家所關注的,使用PoseBusters測試套件可以評估分子內部和分子之間的各種合理性指標。無論是復現工作還是DeepMind 發布的AlphaFold3,在幾乎所有指標上都達到了90%以上的通過率。

▲ 圖1  PoseBusters V1數據集上AlphaFold3復現工作與同類模型的精度表現


圖2 PoseBusters V2數據集上AlphaFold3復現工作與同類模型的精度表現


圖3 Alphafold3復現工作與同類模型的PoseBusters V2 quality check精度對比



核酸分子

    

由于核酸分子的結晶結構數量很少,完全無人為干預地自動化地準確預測其結構一直是一個巨大的挑戰。

對于核酸分子效果的評估,復現工作在CASP15(蛋白質結構預測領域的重要國際競賽)中有結晶結構的RNA樣本及從Protein Data Bank(PDB)中最新收集的41個RNA分子和41個DNA分子進行評測。


結果顯示:復現工作在CASP15的RNA樣本的精度雖然還不及有人工干預的方法AIchemy_RNA2,但在能夠完全自動化推理的RNA模型當中,已經達到了與AlphaFold3相當的水平。在從PDB最新收集的RNA和DNA的結構預測上,復現工作的精度亦是極具競爭力,遠超專門為核酸分子結構預測所設計模型RoseTTAFold2NA和另一個全原子生物分子結構預測模型RoseTTAFold-AllAtom。


圖4 Alphafold3復現工作與同類模型在CASP15上的精度對比


圖5 Alphafold3復現工作與同類模型在PDB RNA-only與PDB DNA-only數據集上的LDDT評估值對比


蛋白質


在蛋白質-蛋白質復合體結構預測領域,盡管AlphaFold-Multimer在先前模型的基礎上實現了顯著的進步,但其成功率和準確性仍有進一步提升的空間。聯合研發團隊的復現工作在此基礎上進一步優化了預測能力,展現出更為優異的性能。


結果顯示:復現工作在蛋白質-蛋白質復合體結構預測方面已經略微超越了AlphaFold-Multimer的表現,展示出更強的預測能力。然而,與AlphaFold3相比,復現工作仍存在一定的性能差距。因此,未來的研究工作將繼續致力于優化和迭代,以縮小這一差距,力求在復現工作的預測精度和成功率上進一步提升。


▲ 圖6 Alphafold3復現工作與同類模型在蛋白質結構預測任務上的Docka分值對比


▲ 圖7 Alphafold3復現工作與同類模型在蛋白質結構預測任務上的Docka>0.23分值對比



模型置信度


復現工作結構預測模型的置信度評分,可用于評估模型預測的結構準確性。復現工作分別對小分子配體-蛋白質數據集PoseBusters和從PDB中收集的蛋白質-蛋白質復合體,RNA分子和DNA分子輸出的置信度評分,都可以觀測到置信度評分與結構的準確性間具有很強的相關性。


▲ 圖8 Alphafold3復現工作在小分子配體-蛋白質數據集上的預測置信度分布


▲ 圖9 Alphafold3復現工作在蛋白質-蛋白質復合體數據集上的預測置信度分布


圖10 Alphafold3復現工作在RNA分子數據集上的預測置信度分布 


聯合研發團隊后續會對模型進行持續地更新迭代,使之在更豐富的數據集和應用場景上發揮價值。同時太初元碁將繼續致力于技術創新和生態建設,推動更多前沿科技的國產化進程,打造更加完善的國產技術生態體系。


主站蜘蛛池模板: 噜噜噜噜噜久久久久久91 | 99国产精品久久久久久久 | 91久久婷婷国产一区二区三区 | 综合综合综合综合综合网 | 九一视频在线看 | 亚洲日本乱码一区二区三区 | 全网最黄网站 | 特级毛片片A片AAAAAA | 亚洲毛片免费在线观看 | 奇米在线免费视频 | 亚洲成a人片在线观 | 婷婷激情综合色五月久久图片 | 免费无码久久成人网站 | 亚洲色无码中文字幕在线 | 免费观看AV在线网站网址 | 免费观看18禁无遮挡真人网站 | 亚洲多毛妓女毛茸茸的 | 91视频免费污 | 日本熟妇xxxx乱 | 国产精品乱码一区二区三区软件 | 国产日韩久久免费福利网站 | 精品人妻无码一区二区三区三十路 | 亚洲成av人在线看 | 久亚洲一线产区二线产区三线区 | 精品国自产拍天天拍 | 香蕉视频日本 | 国产日韩欧美高清 | 曰本无码人妻丰满熟妇啪啪 | 色在线免费| 人妻换人妻A片爽麻豆 | 成人国产亚?欧美成人?合网 | 欧美精品短视频 | 男女在一起拔萝卜免费视频大全 | 亚洲国产福利在线 | 国产精品v欧美精品 | 亚洲精品综合网 | 成人夜间福利 | 亚洲日本一区二区 | 综合久久五十路二区 | 国产精品人妻熟女毛片av久久 | 日本午夜在线亚洲.国产 |