論文タイトル
Antigen-Specific Antibody Design and Optimization with Diffusion-Based Generative Models for Protein Structures
出典
確認したいこと
深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。
要旨
拡散モデルを用いた抗体のデザイン手法を提案している論文です。
解説など
本論文において、ベンチマークとなっている技術は、Jinらが開発したGNNを活用した抗体デザインモデルです。ひとつ前の記事で本手法について紹介しました。
今回の記事で紹介する論文では、上記手法と比較して、以下の課題を新たに解決できる手法を提案しています。
- 抗原構造のモデリングにより新規抗原にも適用可能
- 主鎖原子だけでなく、側鎖原子を考慮にいれた相互作用解析
- 既存の抗体・抗原複合体の構造情報をデザインに活用
デザインモデル
SAbDabとPDBに登録された抗体・抗原複合体構造を、訓練・テストデータに利用しています。各構造のCDRは、AbRSAというナンバリングアルゴリズムを元に特定しています。
本論文では、拡散モデルを活用してモデルの学習を進めています。
検証結果
性能評価に、以下の既往のデザインアルゴリズムと比較しています。
- RAbD
- GNNモデル
評価指標は、以下の3点です。
- IMPROVE (%):鋳型CDRより優れたRosetta結合エネルギーを示す検体の割合
- RMSDref:鋳型構造とデザイン構造とのRMSD
- AAR:鋳型CDR配列との類似性
RMSDrefとAARは比較対象の手法と比べて、優れていました。IMPROVEはRAbDが最も高かったとのことですが、これはRAbDのデザインが評価指標であるRosettaエネルギー関数を直接利用していたためであると考察しています。
また、既存の抗体からHCDR3を除いた構造を出発構造として使用して、HCDR3をデザインすることで、任意の標的抗原に結合する抗体のデザインを試みています。デザインには、HDOCKで標的抗原に結合した構造モデルを利用しています。ウェットでの検証データは公開されていないのですが、デザインした配列の結合エネルギー分布から、妥当な配列が設計できていると主張しています。
最後の実施例は、抗体工学における究極的な課題に取り組んでいて非常に興味深いです。どのような鋳型抗体構造からデザインを出発するかで、結果が変わってきそうに思います。デザインの成功率が評価されることを期待しています。
コメント