【AlphaFold】深層学習と物理化学アプローチを組み合わせたタンパク質複合体予測手法 AlphaREDとは

論文タイトル

Reliable protein-protein docking with AlphaFold, Rosetta, and replica-exchange

出典

Reliable protein-protein docking with AlphaFold, Rosetta, and replica-exchange

要旨

タンパク質複合体の構造予測手法である AlphaRED の開発を報告した論文です。

解説など

タンパク質複合体の構造予測の精度を上げる試みについての論文です。本手法では、深層学習ベースの手法と物理化学ベースの手法を構造予測のワークフロー上で組み合わせることで、その予測精度を向上させることに成功しています。具体的には、深層学習ベースの手法として AlphaFold-Multimer、物理化学ベースの手法として ReplicaDock を活用しています。

ReplicaDock は筆者らが開発した手法です。

Induced fit with replica exchange improves protein complex structure prediction
Author summary Proteins bind each other in a highly specific and regulated manner, and these associated dynamics of binding are intimately linked to their funct...

この手法は、結合時に大きな構造変化を示す複合体の構造予測精度を改善するために、幅広い骨格構造から適切な構造をサンプリングできるように意識して作られています。この目的を達成するために、Rosetta のドッキングプロトコル内に、温度レプリカ交換モンテカルロ (T-REMC) と構造サンプリング手法を組み込んでいます。

一方で既存の ReplicaDock の課題として挙げられるのは、

  • 構造柔軟性の高い残基をあらかじめ特定する必要があること
  • 計算コストの高さ

です。これらの課題を補完するために、筆者らは AlphaFold-Multimer を活用しました。

具体的な解析手順は次の通りです。

  • タンパク質の複合体構造モデルを AlphaFold2-Multimer で作成
  • Interface pLDDT を計算
  • (もし Interface pLDDT < 85だった場合)Rigid Global docking
  • Flexible Local docking

Interface pLDDT とは、結合界面における pLDDT です。もしこの値が低い場合は、AF モデルの結合様式自体が誤っている可能性がありますので、剛体モデルに基づくグローバルドッキングシミュレーションを実行します。実際に Interface pLDDT は DockQ スコアとよく相関することが示されており、このようなスクリーニングが有効に機能することの裏付けになっています。

その後、抗原結合によるバインダーの構造変化を正確に予測するため、骨格構造を適度に摂動させて

最適な構造を探索します。

本ワークフローを筆者らは、AlphaRED と命名して Github にコードを公開しています。

GitHub - Graylab/AlphaRED: AlphaFold-initiated replica exchange protein docking
AlphaFold-initiated replica exchange protein docking - Graylab/AlphaRED

論文中では、性能を評価しており、通常の AlphaFold-multimer 解析と比較し、成功率がおおよそ10%増しに向上していることが示されています。特に抗体・抗原複合体の構造予測は20%から50%に跳ね上がり大きな改善効果を示したとのことです。