【抗体デザイン】Tencent AI の抗体設計用基盤モデル IgGM を紹介!

論文タイトル

A Generative Foundation Model for Antibody Design

出典

Just a moment...

要旨

本論文は Tencent AI for Life Sciences が開発した IgGM という 抗体設計の Foundation Model を紹介しています。

解説など

従来の抗体設計は以下のように タスクごとに別の専用モデルを使う必要がありました:

  • 構造予測(IgFold, AlphaFold2/3, tFold-Ag)
  • 配列設計(ProteinMPNN, IgDesign)
  • Affinity maturation(GearBind)
  • De novo design(RFantibody, DiffAb, dyMEAN)
  • Humanization(BioPhi, AbNativ)

IgGM の最大の貢献は「これら全てを、ひとつのモデルで実行できる」という点です。

IgGM の全体アーキテクチャ

IgGM は以下の3段階構成です。

(1) PPSM(ESM2 拡張版)による multi-chain embedding

  • 抗体・抗原の配列を Transformer で embedding
  • 抗原-抗体の “chain-aware” な表現を抽出

(2) Sgformer (16 層)

  • 抗体–抗原相互作用を学習
  • Pairwise representation と sequence representation を構築

(3) Prediction Module(SE(3)-Equivariant IPA)

  • 構造と配列を同時生成(hybrid diffusion)
  • Cα座標、SO(3) 配向、アミノ酸配列を同時生成

IgGM のトレーニングは SAbDab の抗体–抗原複合体構造データを利用しています。

本文では IgGM を以下のタスクに応用した事例を示しています。

タスク入力出力
構造予測抗体配列+抗原3D 構造(complex)
Inverse design構造CDR/全域の配列
Affinity maturation親抗体部分的 CDR 変異案
Framework 最適化(Protein A)親抗体FR 変異
Humanizationマウス抗体ヒト化配列(CDR構造維持)
De novo design抗原構造+epitopeVH/VL(あるいは VHH)完全生成

構造予測タスクでは、IgFold や dyMEAN など既存の抗体モデルに比べて高い予測精度を示す一方、AlphaFold3 と比べると低い結果です。しかし AF3 で予測した後に IgGMで refine するとさらに精度が上がるとのこと。

ヒト化のタスクでは、BioPhi → IgGM の2段階設計で、IgGM により Hunanness が 0.676 → 0.909 へ、CDR3 RMSD が 0.983 Å→0.750 Å に改善しています。

Affinity Maturation では拡散モデルによる変異生成と frequency ranking を組み合わせて、各ポジションにおいて有望な変異残基を出力する方法を提案しています。IL33と SARS-CoV-2 RBD に対する抗体の親和性増強が可能であることが本文では示されています。

コードはこちら。

GitHub - TencentAI4S/IgGM: Official Implementation of IgGM
Official Implementation of IgGM. Contribute to TencentAI4S/IgGM development by creating an account on GitHub.