【AlphaFold】CASP16 での AF3 成績報告

論文タイトル

AlphaFold3 at CASP16

出典

要旨

ストックホルム大学からのCASP16の参加実績を紹介した論文です。

解説など

CASP16は2024年に開催され、AlphaFold3の予測成績が初めて評価されたコンペになります。筆者は AlphaFold3 を活用した CASP16 の課題標的に対して構造予測を試みました。当時はローカルで解析できなかったので、Webサーバーを通じて解析を実施しています。

筆者は以下のような独自の工夫を施しています。

1. AlphaFold3サーバーを用いた複数モデル生成

複数のランダムシード（異なる初期化）を使ってAF3予測を繰り返し、構造的に多様なモデル群を得る。

2. モデル選別のためのマニュアル評価

得られたモデルから、以下のような観点で最良モデルを人手で選択：

pTMスコア（予測された構造信頼度）
PAEマップ（予測された領域間誤差）
has_clashフラグ（分子内での原子衝突）
立体的な整合性（目視によるチェック）

3. 異なる構成のモデル提出

サーバーはトップ5スコアのモデルを自動提出しますが、Elofsson法では、

多様な構造を意図的に選び、
構造変動の幅を含んだモデル5種を提出しています

また5,000残基を超えるターゲットには、MolPC法という追加操作を行っています。これはオーバーラップ領域を含む断片に分割し、各領域を予測した後で重ね合わせる方法です。

予測の結果、この手動法はAF3サーバーで自動で提案されるモデルとほぼ同等の成績で、手動介入の利点はほぼなかったとのことです。

前モデルの AF2 との比較もおこなっており、基本的にAF3の方が成績が良いですが、MassiveFold により大規模に構造をサンプリングするとAF3と同等の成績が得られています。つまり AF3 の優位性はサンプリング数を増やすことで少なくなります。

興味深いのは、以下の２種類のモデルを比較した結果です。

Top1モデル：AlphaFold3などのサーバーが自動的に1番と判断したモデル（ranking_confidenceが最も高い）
Best of 5モデル：提出された5つの中で実際に最も正確なモデル（評価指標ベースで後から判定）

Top1では AF3-server が同等かそれ以上の精度であったのに対し、Best of 5では、他グループの成績が優れているケースが複数ありました。他グループ（特にKiharaLabやYangServer）は、多様な構造を提出しつつ、ベストモデルを拾う戦略（選定アルゴリズム）をうまく活用しています。したがってAF3サーバーは、モデルの選定アルゴリズムにまだ改良の余地があるといえます。