抗体–抗原インターフェースに着目したADC活性予測モデル「ABFormer」の実力

論文タイトル

ABFormer: A Transformer-based Model to Enhance Antibody-Drug Conjugates Activity Prediction through Contextualized Antibody-Antigen Embedding

出典

ABFormer: A Transformer-based Model to Enhance Antibody-Drug Conjugates Activity Prediction through Contextualized Antibody-Antigen Embedding

Computational screening is increasingly becoming a crucial aspect of Antibody-Drug Conjugate (ADC) research, allowing the elimination of dead ends at earlier st...

要旨

抗体–抗原結合インターフェースを文脈的に埋め込み表現へと変換する Transformer ベースのモデル「ABFormer」を提案し、抗体薬物複合体（ADC）の活性予測精度を向上させています。

解説など

抗体薬物複合体（ADC）は、

抗体
リンカー
ペイロード（細胞毒性薬剤）

の3要素から構成されます。

ADC の活性を予測するために開発された初の専用ディープラーニングフレームワークである「ADCNet」では、これらの構成要素を独立した特徴として単純に結合しています。しかし実際の ADC 活性は、抗体と抗原がどのように相互作用しているかという結合インターフェースの文脈に強く依存すると考えられます。

そこで本研究では、抗体–抗原間の相互作用情報を文脈的に捉えるTransformerモデル「ABFormer」を提案しています。

モデル設計について

ABFormerはマルチモーダル構成です。

(1) 抗体–抗原インターフェース

事前学習済みモデル「AntiBinder」を利用
METデータセット（4,000ペア）で事前学習
凍結して特徴抽出器として使用

(2) 小分子（リンカー・ペイロード）

FG-BERT（約145万分子で事前学習）を使用
167-bit MACCS fingerprintも併用

(3) データセット

有効データ：429 ADC（ADCdb由来、6例はAntiBinder処理不可）
144抗体
62抗原
81リンカー
70ペイロード
活性ラベル：279 active / 150 inactive
活性閾値：1000 nM

論文では、AntiBinderをゼロ化するとMCCが0.6964→0.2199まで低下し、精度も58.41%に落ちたと報告されています。また、FG-BERTを除去すると特異度（specificity）が低下し、過剰に「活性あり」と予測する傾向が出たと述べています。

つまり：

抗体–抗原情報 → 分類能力の中核
小分子エンコーダ → 偽陽性の抑制

という役割分担になっています。

Leave-Pair-Out の評価で ABFormer は AUC：0.8983±0.0061という結果、22検体の外部ベンチマークで100% accuracyとのことです。訓練、評価データともにサイズが少なく性能を見積もるには不十分に感じますが、モデル設計のコンセプトがADCNetから順当に進歩しており、限られたADCデータにおける現実的アプローチであると解釈できます。