【抗体構造予測】MassiveFoldを用いた複合体モデルの大規模サンプリングで構造予測性能が向上

論文タイトル

Massive sampling strategy for antibody-antigen targets in CAPRI Round 55 with MassiveFold

出典

Just a moment...

要旨

MassiveFold を用いた抗体・抗原複合体構造予測の成績や予測条件の最適化について言及した論文です。

解説など

筆者らは、MassiveFold という独自の構造予測モデルを開発者です。これは AFmassive と呼ぶ予測構造を大規模に生成するサンプリング手法を採用しその中から優れたモデルを選抜することで、高い構造予測精度を実現することを目指した構造予測手法です。筆者らはこの MassiveFold を CAPRI Round 55 の標的を利用して評価した結果を本論文で紹介しています。

本論文における解析結果とその考察で特にフォーカスされているのは、抗原・抗体複合体予測に対する MassiveFold の成績です。MassiveFold から生成された構造から AF2 の confidence scoreにもとづいて選抜されたトップ5のモデルの予測成績では、通常の AF2 と比較して高い予測精度を示しませんでした。筆者らはこれがモデルのサンプリングの問題なのか、そのあとのフィルタリングステップの問題なのかを確かめるために、生成されたモデル構造すべてに対して DockQ スコアを評価しました。すると、あらかじめ選抜されたトップ5モデルよりも高い DockQ スコアを示すモデルが存在することが明らかとなりました。つまり、抗体・抗原複合体予測において、フィルタリングステップが精度のネックとなっており、AF2 の confidence score はモデルのスクリーニング指標としては機能しないということです。ちなみに抗体以外の標的については、AF2 の confidence score が適切に機能しているとのことでした。

筆者らは、ここから MassiveFold の生成条件を様々に変更し比較試験を行うことで、最適条件を探索することを試みています。具体的には以下のような最適化項目が挙げられます。

  • number of predictions
  • NN versions used
  • number of recycling steps
  • use of templates
  • activation of the dropout

評価結果からわかったことを一部抜粋すると、次のとおりです。

  • 基本的には、AF2 のデフォルトパラメータを用いて予測モデル数を増やすことが良い結果につながる
  • interface pLDDT を用いると DockQ スコアと多少良い相関。ペプチド抗原の方が良い成績。
  • AF3 では NN model の最適なパラメータは異なるとので、今後の評価が必要。

CASP16-CAPRI でさらに詳細な評価を計画中とのことです。MassiveFold を活用されている方は期待しましょう。