【抗体デザイン】免疫ライブラリを使って、結合抗体を分類・生成する深層学習モデル

論文タイトル

Predicting antibody binders and generating synthetic antibodies using deep learning

出典

MAbs. 2022 Jan-Dec;14(1):2069075.

Predicting antibody binders and generating synthetic antibodies using deep learning - PubMed
The antibody drug field has continually sought improvements to methods for candidate discovery and engineering. Historically, most such methods have been labora...

確認したいこと

深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。

要旨

抗体のスクリーニングデータを使って、抗原結合抗体を分類・生成するモデルを提案しています。

解説など

本論文に似た手法は、既報の報告が多いので、活用しているデータの種類とモデルのアーキテクチャを整理して理解することが重要です。本論文では、以下の条件で予測モデルを構築しています。

標的抗原:CTLA-4/PD-1

結合抗体の予測モデル

マウスに抗原タンパク質を免疫したscFvライブラリを、scFvで酵母ディスプレイパニング

結合配列基準(CTLA-4: 1,345配列、PD-1: 1,719配列)
  • >0.01%の出現頻度
  • パニング前と比較して、1.8倍以上の出現頻度
非結合配列基準(CTLA-4: 6,003配列、PD-1: 6,052配列)
  • >0.01%の出現頻度
  • パニング前と比較して、1.0倍以下の出現頻度
予測対象領域:HCDR3+LCDR3
モデルのアーキテクチャ:CNN

上記の条件で構築されたモデルを使って、検証データで結合抗体を予測し、90%以上の予測成績を示しています。データセットのサイズが予測精度に大きく影響しているとのことです。それなりに多様な抗体群を含むレパトアでないと、同等の予測精度を示すことは難しそうです。

筆者らは、GANで結合抗体を生成するモデルも作っています。特質すべきは、モデルごとにジャームラインをそろえるのが大事とのことで、事前に類似の配列群をクラスタリングしたのちに、各々のクラスタに対してモデルを構築しています。

コメント