AlphaFoldを“ドッキングモデル”に変える:Flow Matchingで進化したAF2Dockとは

論文タイトル

Adapting Co-Folding Models for Structure-Based Protein-Protein Docking Through Flow Matching

出典

Adapting Co-Folding Models for Structure-Based Protein-Protein Docking Through Flow Matching
Co-folding models like AlphaFold have revolutionized protein complex structure prediction, yet their reliance on multiple sequence alignments (MSAs) limits thei...

要旨

AlphaFold-Multimerを構造ベースのタンパク質ドッキングモデルへと適応させる「AF2Dock」を提案しています。

解説など

AlphaFoldのようなco-foldingモデルは、複合体構造予測において大きな成功を収めています。

しかし、その多くはMSA(multiple sequence alignment:進化的に類似した配列の多重アラインメント)に強く依存しています。

特に以下のケースではMSAが弱点になります。

  • 抗体–抗原複合体
  • ナノボディ複合体
  • 特異な進化経路を持つ相互作用系

そこで本研究では、

AlphaFold-Multimer(AF-M)を、MSAに依存しない構造ベースドッキングモデルへと変換する

というアプローチを提案しています。この新しいモデルは AF2Dock と名付けられています。

① テンプレートモジュールを「ドッキングモジュール」に置き換える

AF2Dockの最大の構造的変更点は、

  • AF-Mのテンプレートモジュールを
  • 新しいドッキングモジュールに置き換えたこと

です。AF-Mのテンプレートモジュールを、入力構造を特徴として埋め込むだけですが、ドッキングモジュールは、さらにノイズ除去を行いペア表現を更新する機構が備わっています。これによりMSAに依存せずAFが学習したエネルギーランドスケープに従って適切な表現を探索することができます。

② Flow Matchingによる学習

本研究では、拡散モデルに近い考え方であるFlow Matchingを採用しています。

③ 学習データ

訓練には PINDERデータセット(約230万複合体) を使用しています。

結果としては、AF-MやAF3に依然として劣る部分はあるものの、AF-Mが失敗するケースでAF2Dockが成功するという直交的な予測を示しています。

コードはこちら。

GitHub - Graylab/AF2Dock
Contribute to Graylab/AF2Dock development by creating an account on GitHub.