【抗体構造予測】AlphaFold3 の抗体・抗原複合体構造予測精度を詳細に評価

論文タイトル

What does AlphaFold3 learn about antigen and nanobody docking, and what remains unsolved?

出典

https://www.biorxiv.org/content/10.1101/2024.09.21.614257v2

要旨

AlphaFold3 の抗体・抗原複合体構造予測精度を評価した論文です。

解説など

Johns Hopkins 大学の Jeffrey J. Gray ラボからの報告です。AlphaFold3 (AF3) の抗体・抗原複合体予測成績は DeepMind が先んじて報告していますが、筆者らは公開された AlphaFold3 サーバーを用いてさらに詳細な解析を行っています。

トピックとしては次のとおりです。

  • H3ループ単独のAF3構造予測成績
  • H3ループの構造予測精度 (H3 RMSD) とドッキング予測精度 (DockQ) との相関解析
  • 抗原の有無によるH3ループの構造予測精度への影響評価
  • ドッキングモデルの信頼性を評価するための metrics 探索

まず前提として、既報で知られるAF3の抗体・抗原複合体ドッキング予測精度 60% というのは 1,000 seeds から構造を予測した場合の成績です。ローカル環境でAF3を扱えない場合は少ないシードから構造を予測する必要があり、得られるモデルの精度も下がります。1シードからの予測成績では high-accuracy を示すドッキング予測精度で11%、acceptable 以上 (DockQ > 0.23) で38.1%ほどです。

以下に示す既存のベンチマークモデルと比較すると抗体単独でのH3予測精度はAF3で改善しています。

  • IgFold
  • AF2-Multimer
  • AF2.3-Multimer

AF3では、H3 RMSD が 2.15 Å です。抗原結合による H3 の構造変化量は 1 Å 以下であることが知られているので、まだ精度改善の余地はあるとのことです。

このH3 RMSD が DockQ スコアと相関することを筆者らは示しています。

p(CDR H3 RMSD ≤ 1.5 Å | DockQ ≥ 0.8) (DockQ ≥ 0.8であるモデルのCDR H3 RMSDが ≤ 1.5 Åである確率)は、96%を超えるとのことで、high accuracy の予測モデルを生成するためには、H3 RMSD ≤ 1.5 Å がほぼ必須とのことです。逆にH3 RMSD ≤ 1.5 Å であったとしても低い DockQ のモデルが存在するとのことで、上記の逆は成立しません。

H3の構造予測に抗原のコンテキストを入力すると global H3 RMSD は改善します。ループの形状は変わらず Fv スキャフォールドにおける H3 の位置関係の精度に影響を及ぼすとのことです。特にループが長いほど効果は顕著にみられます。

最後に筆者らは、AF3 モデルの信頼性を評価する confidence metrics の探索を試みました。具体的には、ipTM-HA、Rosetta Energy Units (ΔGB)、H3-pLDDTの3つの指標に着目し、DockQ > 0.23 のモデルを最も正答率高く分類できる基準として以下の定量的なクライテリアを見出しています。

  • ipTM-HA > 0.5
  • Rosetta Energy Units ΔGB < -40
  • H3-pLDDT > 85

さらにこれらのメトリクスの組み合わせ条件も探索し、

  • I-pLDDT ≥ 85 →ΔGB ≤ 65 REU

によって、 n-AUC = 0.985 を達成しています。