【抗体構造予測】MassiveFoldを用いた複合体モデルの大規模サンプリングで構造予測性能が向上

論文タイトル

Massive sampling strategy for antibody-antigen targets in CAPRI Round 55 with MassiveFold

出典

要旨

MassiveFold を用いた抗体・抗原複合体構造予測の成績や予測条件の最適化について言及した論文です。

解説など

筆者らは、MassiveFold という独自の構造予測モデルを開発者です。これは AFmassive と呼ぶ予測構造を大規模に生成するサンプリング手法を採用しその中から優れたモデルを選抜することで、高い構造予測精度を実現することを目指した構造予測手法です。筆者らはこの MassiveFold を CAPRI Round 55 の標的を利用して評価した結果を本論文で紹介しています。

本論文における解析結果とその考察で特にフォーカスされているのは、抗原・抗体複合体予測に対する MassiveFold の成績です。MassiveFold から生成された構造から AF2 の confidence scoreにもとづいて選抜されたトップ５のモデルの予測成績では、通常の AF2 と比較して高い予測精度を示しませんでした。筆者らはこれがモデルのサンプリングの問題なのか、そのあとのフィルタリングステップの問題なのかを確かめるために、生成されたモデル構造すべてに対して DockQ スコアを評価しました。すると、あらかじめ選抜されたトップ５モデルよりも高い DockQ スコアを示すモデルが存在することが明らかとなりました。つまり、抗体・抗原複合体予測において、フィルタリングステップが精度のネックとなっており、AF2 の confidence score はモデルのスクリーニング指標としては機能しないということです。ちなみに抗体以外の標的については、AF2 の confidence score が適切に機能しているとのことでした。

筆者らは、ここから MassiveFold の生成条件を様々に変更し比較試験を行うことで、最適条件を探索することを試みています。具体的には以下のような最適化項目が挙げられます。