論文タイトル
End-to-End Full-Atom Antibody Design
出典
確認したいこと
深層学習を用いたタンパク質のデザイン手法について調査をしています。
要旨
end-to-endで抗原に結合する抗体のH3をデザインする手法、dyMEANを開発を報告しています。
解説など
抗原結合抗体をデザインする生成モデルとして、MEANを紹介しました。
この手法では、抗原・抗体の複合体構造の情報をもとに、エピトープに相補的なH3をデザインすることができました。しかし実際のユースケースを考えると、複合体の構造が明らかであるものに対して抗体のH3欠損を補いたい、というニーズはそこまで多くありません。特にデノボデザインを志向する場合は、抗体の配列・構造情報や複合体における結合様式は未知であることが通常だと思います。
本手法では、MEANのアルゴリズムを中核に、抗体構造の予測や抗原とのドッキングシミュレーションも兼ね備えたend-to-endなデザインスキームを構築することを試みています。筆者らはこの手法をdynamic Multi-channel Equivariant grAph Network (dyMEAN) と呼んでいます。従来のMEANは、主鎖構造の生成までにとどまりましたが、本手法は側鎖原子を含む全原子の座標を生成することができます。これらの解析は、既存のスタンドアローンで解析できるツール(抗体構造予測におけるIgFold、ドッキングシミュレーションにおけるHDock、側鎖のパッキングにおけるRosettaなど)に頼ることなく、シームレスにデザインしていることが特徴です。
大まかな流れは、原著論文のFig.3に記載されています。ステップを順に並べると下記のとおりになります。
- Structural initialization:抗体の初期構造を生成
- Attaching shadow paratope:標的エピトープに相補的なパラトープ構造を生成
- Adaptive multi-channel encoding:shadow paratopeを初期構造に適合するようにエンベディングを更新
- Docking:抗原と抗体の複合体構造を予測
- Prediction:側鎖のアミノ酸配列を生成
アーキテクチャの性能評価では、以下のデザイン手法をベンチマークにおいて比較試験を行っています。
- RosettaAb https://www.biospace.info/blog/2022/05/11/29702641/
- DiffAb
- MEAN https://www.biospace.info/blog/2022/12/30/mean/
- HERN https://www.biospace.info/blog/2022/11/16/06616/
生成した抗体配列の妥当性評価には、以下の指標が用いられています。
- AAR:アミノ酸配列の回収率。天然の配列レパトアとの類似性
- TM score:Template modeling score。構造のトポロジー的な類似度を評価
- lDDT:local Distance Difference Test。参照構造との局所距離における差分を評価(重ね合わせなし)
Dockingの精度には、以下の指標が用いられていました。
- CAAR:パラトープ周辺のAAR
- RMSD:参照構造と重ね合わせたときの原子座標の差分を評価
- DockQ:ドッキング精度の包括的な評価指標
いずれも、dyMEANが相対的に高い性能を示していました。実装コードの公開を期待しています。
コメント