論文タイトル
AlphaFold3 at CASP16
出典
要旨
ストックホルム大学からのCASP16の参加実績を紹介した論文です。
解説など
CASP16は2024年に開催され、AlphaFold3の予測成績が初めて評価されたコンペになります。筆者は AlphaFold3 を活用した CASP16 の課題標的に対して構造予測を試みました。当時はローカルで解析できなかったので、Webサーバーを通じて解析を実施しています。
筆者は以下のような独自の工夫を施しています。
1. AlphaFold3サーバーを用いた複数モデル生成
複数のランダムシード(異なる初期化)を使ってAF3予測を繰り返し、構造的に多様なモデル群を得る。
2. モデル選別のためのマニュアル評価
得られたモデルから、以下のような観点で最良モデルを人手で選択:
- pTMスコア(予測された構造信頼度)
- PAEマップ(予測された領域間誤差)
- has_clashフラグ(分子内での原子衝突)
- 立体的な整合性(目視によるチェック)
3. 異なる構成のモデル提出
サーバーはトップ5スコアのモデルを自動提出しますが、Elofsson法では、
- 多様な構造を意図的に選び、
- 構造変動の幅を含んだモデル5種を提出しています
また5,000残基を超えるターゲットには、MolPC法という追加操作を行っています。これはオーバーラップ領域を含む断片に分割し、各領域を予測した後で重ね合わせる方法です。
予測の結果、この手動法はAF3サーバーで自動で提案されるモデルとほぼ同等の成績で、手動介入の利点はほぼなかったとのことです。
前モデルの AF2 との比較もおこなっており、基本的にAF3の方が成績が良いですが、MassiveFold により大規模に構造をサンプリングするとAF3と同等の成績が得られています。つまり AF3 の優位性はサンプリング数を増やすことで少なくなります。
興味深いのは、以下の2種類のモデルを比較した結果です。
- Top1モデル:AlphaFold3などのサーバーが自動的に1番と判断したモデル(ranking_confidenceが最も高い)
- Best of 5モデル:提出された5つの中で実際に最も正確なモデル(評価指標ベースで後から判定)
Top1では AF3-server が同等かそれ以上の精度であったのに対し、Best of 5では、他グループの成績が優れているケースが複数ありました。他グループ(特にKiharaLabやYangServer)は、多様な構造を提出しつつ、ベストモデルを拾う戦略(選定アルゴリズム)をうまく活用しています。したがってAF3サーバーは、モデルの選定アルゴリズムにまだ改良の余地があるといえます。