論文タイトル
ABFormer: A Transformer-based Model to Enhance Antibody-Drug Conjugates Activity Prediction through Contextualized Antibody-Antigen Embedding
出典

要旨
抗体–抗原結合インターフェースを文脈的に埋め込み表現へと変換する Transformer ベースのモデル「ABFormer」を提案し、抗体薬物複合体(ADC)の活性予測精度を向上させています。
解説など
抗体薬物複合体(ADC)は、
- 抗体
- リンカー
- ペイロード(細胞毒性薬剤)
の3要素から構成されます。
ADC の活性を予測するために開発された初の専用ディープラーニングフレームワークである「ADCNet」では、これらの構成要素を独立した特徴として単純に結合しています。しかし実際の ADC 活性は、抗体と抗原がどのように相互作用しているかという結合インターフェースの文脈に強く依存すると考えられます。
そこで本研究では、抗体–抗原間の相互作用情報を文脈的に捉えるTransformerモデル「ABFormer」を提案しています。
モデル設計について
ABFormerはマルチモーダル構成です。
(1) 抗体–抗原インターフェース
- 事前学習済みモデル「AntiBinder」を利用
- METデータセット(4,000ペア)で事前学習
- 凍結して特徴抽出器として使用
(2) 小分子(リンカー・ペイロード)
- FG-BERT(約145万分子で事前学習)を使用
- 167-bit MACCS fingerprintも併用
(3) データセット
- 有効データ:429 ADC(ADCdb由来、6例はAntiBinder処理不可)
- 144抗体
- 62抗原
- 81リンカー
- 70ペイロード
- 活性ラベル:279 active / 150 inactive
- 活性閾値:1000 nM
論文では、AntiBinderをゼロ化するとMCCが0.6964→0.2199まで低下し、精度も58.41%に落ちたと報告されています。また、FG-BERTを除去すると特異度(specificity)が低下し、過剰に「活性あり」と予測する傾向が出たと述べています。
つまり:
- 抗体–抗原情報 → 分類能力の中核
- 小分子エンコーダ → 偽陽性の抑制
という役割分担になっています。
Leave-Pair-Out の評価で ABFormer は AUC:0.8983±0.0061という結果、22検体の外部ベンチマークで100% accuracyとのことです。訓練、評価データともにサイズが少なく性能を見積もるには不十分に感じますが、モデル設計のコンセプトがADCNetから順当に進歩しており、限られたADCデータにおける現実的アプローチであると解釈できます。

