抗体–抗原インターフェースに着目したADC活性予測モデル「ABFormer」の実力

論文タイトル

ABFormer: A Transformer-based Model to Enhance Antibody-Drug Conjugates Activity Prediction through Contextualized Antibody-Antigen Embedding

出典

ABFormer: A Transformer-based Model to Enhance Antibody-Drug Conjugates Activity Prediction through Contextualized Antibody-Antigen Embedding
Computational screening is increasingly becoming a crucial aspect of Antibody-Drug Conjugate (ADC) research, allowing the elimination of dead ends at earlier st...

要旨

抗体–抗原結合インターフェースを文脈的に埋め込み表現へと変換する Transformer ベースのモデル「ABFormer」を提案し、抗体薬物複合体(ADC)の活性予測精度を向上させています。

解説など

抗体薬物複合体(ADC)は、

  • 抗体
  • リンカー
  • ペイロード(細胞毒性薬剤)

の3要素から構成されます。

ADC の活性を予測するために開発された初の専用ディープラーニングフレームワークである「ADCNet」では、これらの構成要素を独立した特徴として単純に結合しています。しかし実際の ADC 活性は、抗体と抗原がどのように相互作用しているかという結合インターフェースの文脈に強く依存すると考えられます。

そこで本研究では、抗体–抗原間の相互作用情報を文脈的に捉えるTransformerモデル「ABFormer」を提案しています。

モデル設計について

ABFormerはマルチモーダル構成です。

(1) 抗体–抗原インターフェース

  • 事前学習済みモデル「AntiBinder」を利用
  • METデータセット(4,000ペア)で事前学習
  • 凍結して特徴抽出器として使用

(2) 小分子(リンカー・ペイロード)

  • FG-BERT(約145万分子で事前学習)を使用
  • 167-bit MACCS fingerprintも併用

(3) データセット

  • 有効データ:429 ADC(ADCdb由来、6例はAntiBinder処理不可)
  • 144抗体
  • 62抗原
  • 81リンカー
  • 70ペイロード
  • 活性ラベル:279 active / 150 inactive
  • 活性閾値:1000 nM

論文では、AntiBinderをゼロ化するとMCCが0.6964→0.2199まで低下し、精度も58.41%に落ちたと報告されています。また、FG-BERTを除去すると特異度(specificity)が低下し、過剰に「活性あり」と予測する傾向が出たと述べています。

つまり:

  • 抗体–抗原情報 → 分類能力の中核
  • 小分子エンコーダ → 偽陽性の抑制

という役割分担になっています。

Leave-Pair-Out の評価で ABFormer は AUC:0.8983±0.0061という結果、22検体の外部ベンチマークで100% accuracyとのことです。訓練、評価データともにサイズが少なく性能を見積もるには不十分に感じますが、モデル設計のコンセプトがADCNetから順当に進歩しており、限られたADCデータにおける現実的アプローチであると解釈できます。