【抗体デザイン】BERTとGNNを組み合わせた抗体のデザイン手法、AbBERT-HMPNとは

論文タイトル

Incorporating Pre-training Paradigm for Antibody Sequence-Structure Co-design

出典

Incorporating Pre-training Paradigm for Antibody Sequence-Structure Co-design
Antibodies are versatile proteins that can bind to pathogens and provide effective protection for human body. Recently, deep learning-based computational antibo...

確認したいこと

標的抗原に結合できる抗体のデザイン手法について調査しています。

要旨

BERTとHMPNを接続して抗体のH3をデザインする手法、AbBERT-HMPNを紹介した論文です。

解説など

課題設定やベンチマークとして想定している技術は、以前紹介したMEANと同じです。

つまり、エラー蓄積の原因となる逐次的な配列デザインに対処することが主な課題となります。この課題を解決するために、自己回帰ではなく、”one-shot”で配列を生成したり、H3だけでなく抗原やフレームワークの情報を含めた構造情報に基づく配列デザインに取り組んでいる点は、先の論文と同じです。

筆者らはこれらに加えて、少ない構造データ数に起因する、予測性能の限界を解決することを試みています。そのために、大規模配列データを利用した事前学習言語モデル(AbBERT)を利用しています。AbBERTでは、重鎖の配列に限定してデータを利用しています。マスクするポジションはCDRに限定してモデルを訓練しているとのことです。

構造予測のためのアーキテクチャはHERNをもとに構成されています。抗原側の構造情報はエピトープ領域だけ使用しています。構造をRefineするHMPNの前に、AbBERTが接続されています。原著にアーキテクチャの概念図が記載されていますので、詳しくはそちらをご参照ください。彼らは設計したフレームワークを、AbBERT-HMPNと名付けています。

手法を評価するための比較対象として、以下の手法が用いられています。

  • RosettaAntibodyDesign
  • LSTM-based model
  • Sequence model
  • AR-GNN
  • RefineGNN
  • HERN

評価のために解いているタスクは下記のとおりです。

  • 配列と構造の予測
  • 標的抗原に結合するH3のデザイン

いずれもRMSDやAAR(アミノ酸配列の回収率)を算出してみると、RefineGNNやHERNに比べてAbBERT-HMPNの方が優れていました。

RefineGNNやHERNを強く意識した手法の提案が複数出現していることで、今後もこれらの手法がベンチマークであり続けることが予想されます。

コメント