【AlphaFold】CASP16 での AF3 成績報告

論文タイトル

AlphaFold3 at CASP16

出典

Just a moment...

要旨

ストックホルム大学からのCASP16の参加実績を紹介した論文です。

解説など

CASP16は2024年に開催され、AlphaFold3の予測成績が初めて評価されたコンペになります。筆者は AlphaFold3 を活用した CASP16 の課題標的に対して構造予測を試みました。当時はローカルで解析できなかったので、Webサーバーを通じて解析を実施しています。

筆者は以下のような独自の工夫を施しています。

1. AlphaFold3サーバーを用いた複数モデル生成

複数のランダムシード(異なる初期化)を使ってAF3予測を繰り返し、構造的に多様なモデル群を得る。

2. モデル選別のためのマニュアル評価

得られたモデルから、以下のような観点で最良モデルを人手で選択:

  • pTMスコア(予測された構造信頼度)
  • PAEマップ(予測された領域間誤差)
  • has_clashフラグ(分子内での原子衝突)
  • 立体的な整合性(目視によるチェック)
3. 異なる構成のモデル提出

サーバーはトップ5スコアのモデルを自動提出しますが、Elofsson法では、

  • 多様な構造を意図的に選び、
  • 構造変動の幅を含んだモデル5種を提出しています

また5,000残基を超えるターゲットには、MolPC法という追加操作を行っています。これはオーバーラップ領域を含む断片に分割し、各領域を予測した後で重ね合わせる方法です。

予測の結果、この手動法はAF3サーバーで自動で提案されるモデルとほぼ同等の成績で、手動介入の利点はほぼなかったとのことです。

前モデルの AF2 との比較もおこなっており、基本的にAF3の方が成績が良いですが、MassiveFold により大規模に構造をサンプリングするとAF3と同等の成績が得られています。つまり AF3 の優位性はサンプリング数を増やすことで少なくなります。

興味深いのは、以下の2種類のモデルを比較した結果です。

  • Top1モデル:AlphaFold3などのサーバーが自動的に1番と判断したモデル(ranking_confidenceが最も高い)
  • Best of 5モデル:提出された5つの中で実際に最も正確なモデル(評価指標ベースで後から判定)

Top1では AF3-server が同等かそれ以上の精度であったのに対し、Best of 5では、他グループの成績が優れているケースが複数ありました。他グループ(特にKiharaLabやYangServer)は、多様な構造を提出しつつ、ベストモデルを拾う戦略(選定アルゴリズム)をうまく活用しています。したがってAF3サーバーは、モデルの選定アルゴリズムにまだ改良の余地があるといえます。