論文タイトル
AFM-RL: Large Protein Complex Docking Using AlphaFold-Multimer and Reinforcement Learning
出典
要旨
6つ以上のタンパク質鎖複合体の構造を高効率に予測できる、AFM-RL を紹介した論文です。
解説など
本論文で紹介される AFM-RL の特徴は、6-20 鎖の複合体の構造を予測できることです。
精度高く複合体構造を予測するためのデファクトスタンダード的手法は AlphaFold-Multimer ですが、鎖の数が増えると予測精度が低下すること、そして長鎖の配列は GPU メモリの制約が大きいことが課題です。
このような課題から、複合体構造を高効率に予測できるように MoLPC と呼ばれる手法が開発された歴史があります。こちらは、最初にタンパク質複合体をさらに小さなサブコンポーネントに分解して構造を予測し、それらを組み合わせることで完全な構造をモデリングする手法です。この方法も、サプコンポーネント内で結合界面が欠落したり、サブコーポーネント間でタンパク質鎖の衝突と重複が起こるなどの問題があります。
筆者らが新たに開発した、AFM-RL では、次の2ステップで構造予測が行われます。
- まず、AlphaFold-Multimer を利用して、2本鎖間のペアワイズドッキング構造(デコイ)を複数予測します。
- 次に、各デコイを選択して組み合わせて、完全な複合体構造を予測します。
このように、AlphaFold-Multimer の強制的なサンプリングを導入することで、重要なインターフェースの欠失が起こらないように工夫されています。また、このように構造を小さな部分構造セットに分解して、それらを段階的に組み立てるアプローチにより、GPU メモリの制限が回避できます。
AFM-RL は、6 ~ 20 (6-20) 鎖を持つ 57 のタンパク質複合体のデータセットでベンチマークされました。すべてのターゲットにおける、平均二乗平均平方根偏差 (RMSD) と TM-SCORE は、それぞれ 10.09 Å と 0.81 です。AFM-RL は MoLPC と比較して優れた性能を示していたとのことです。