論文タイトル
Predicting antibody binders and generating synthetic antibodies using deep learning
出典
MAbs. 2022 Jan-Dec;14(1):2069075.

Predicting antibody binders and generating synthetic antibodies using deep learning - PubMed
The antibody drug field has continually sought improvements to methods for candidate discovery and engineering. Historically, most such methods have been labora...
確認したいこと
深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。
要旨
抗体のスクリーニングデータを使って、抗原結合抗体を分類・生成するモデルを提案しています。
解説など
本論文に似た手法は、既報の報告が多いので、活用しているデータの種類とモデルのアーキテクチャを整理して理解することが重要です。本論文では、以下の条件で予測モデルを構築しています。
標的抗原:CTLA-4/PD-1
結合抗体の予測モデル
マウスに抗原タンパク質を免疫したscFvライブラリを、scFvで酵母ディスプレイパニング
結合配列基準(CTLA-4: 1,345配列、PD-1: 1,719配列)
- >0.01%の出現頻度
- パニング前と比較して、1.8倍以上の出現頻度
非結合配列基準(CTLA-4: 6,003配列、PD-1: 6,052配列)
- >0.01%の出現頻度
- パニング前と比較して、1.0倍以下の出現頻度
予測対象領域:HCDR3+LCDR3
モデルのアーキテクチャ:CNN
上記の条件で構築されたモデルを使って、検証データで結合抗体を予測し、90%以上の予測成績を示しています。データセットのサイズが予測精度に大きく影響しているとのことです。それなりに多様な抗体群を含むレパトアでないと、同等の予測精度を示すことは難しそうです。
筆者らは、GANで結合抗体を生成するモデルも作っています。特質すべきは、モデルごとにジャームラインをそろえるのが大事とのことで、事前に類似の配列群をクラスタリングしたのちに、各々のクラスタに対してモデルを構築しています。
コメント