AlphaFoldを“ドッキングモデル”に変える：Flow Matchingで進化したAF2Dockとは

Adapting Co-Folding Models for Structure-Based Protein-Protein Docking Through Flow Matching

AlphaFold-Multimerを構造ベースのタンパク質ドッキングモデルへと適応させる「AF2Dock」を提案しています。

AlphaFoldのようなco-foldingモデルは、複合体構造予測において大きな成功を収めています。

しかし、その多くはMSA（multiple sequence alignment：進化的に類似した配列の多重アラインメント）に強く依存しています。

特に以下のケースではMSAが弱点になります。

そこで本研究では、

AlphaFold-Multimer（AF-M）を、MSAに依存しない構造ベースドッキングモデルへと変換する

というアプローチを提案しています。この新しいモデルは AF2Dock と名付けられています。

① テンプレートモジュールを「ドッキングモジュール」に置き換える

AF2Dockの最大の構造的変更点は、

です。AF-Mのテンプレートモジュールを、入力構造を特徴として埋め込むだけですが、ドッキングモジュールは、さらにノイズ除去を行いペア表現を更新する機構が備わっています。これによりMSAに依存せずAFが学習したエネルギーランドスケープに従って適切な表現を探索することができます。

② Flow Matchingによる学習

本研究では、拡散モデルに近い考え方であるFlow Matchingを採用しています。

③ 学習データ

訓練には PINDERデータセット（約230万複合体）を使用しています。

結果としては、AF-MやAF3に依然として劣る部分はあるものの、AF-Mが失敗するケースでAF2Dockが成功するという直交的な予測を示しています。

コードはこちら。