全原子レベルでとらえる抗体言語モデルで抗体を最適化する

論文タイトル

Optimizing broadly neutralizing antibodies via all-atom interaction modeling and pre-trained language models

出典

Optimizing broadly neutralizing antibodies via all-atom interaction modeling and pre-trained language models
Antibody optimization is a fundamental challenge, and the identification of antibody-antigen interactions is crucial in the optimization process. However, curre...

要旨

抗体と抗原の相互作用を全原子レベルで捉える計算モデル「InterAb」を提案し、さらにそれを用いた抗体最適化フレームワーク「InterAb-Opt」を開発しています。

解説など

本研究の目的は、

  • 抗体と抗原がどのように結合しているかを高精度に予測し
  • その情報を使って、より広い変異株に効く抗体を計算機上で最適化する

ことです。

これまで様々な抗体・抗原相互作用の予測モデルが開発されていますが、本研究で開発された InterAb の最大の特徴は、抗体・抗原相互作用構造を原子レベルで解釈し予測に活用している点にあります。

InterAb は、抗体―抗原相互作用をマルチスケール情報として統合するモデルです。

  • 配列情報
    抗体に特化して事前学習された言語モデルを用い、抗体配列をベクトル表現(embedding)に変換します。
    ESM2も抗原と抗体の補助表現のため使用されています。
  • 単体構造(モノマー構造)情報
    抗体や抗原を単体として見たときの立体構造を、幾何グラフ学習によって表現します。
    実験構造がない場合は、ESMFold などの予測構造が用いられます。
  • 複合体構造(抗体―抗原)情報:AtomInter
    本研究の中核が、全原子相互作用モデリング(AtomInter)です。
    抗体と抗原の界面に存在する原子同士の距離や種類を特徴量として取り出し、原子レベルの Transformer により相互作用を学習します。実験構造がない場合は Chai-1による予測構造が用いられます。

InterAbは、下記複数のタスクにおいて、それぞれのデータセットを用いて独立したモデルが構築されその予測精度が検証されています。

  • 特異性予測:SPE7626 データセット
  • 親和性予測:AFF、SKEMPIデータセット
  • インフルエンザA抗体のスクリーニング:ELISAデータ

また筆者らは、InterAb を利用した最適化パイプライン、InterAb-Opt も開発しています。これは次の手順で最適化設計が進行します。

  • 元の抗体に対して、InterAb によるアラニンスキャンで重要残基を特定
  • 既存の抗体生成モデル(IgGM)で変異候補配列を生成
  • InterAb により複数抗原に対する親和性を評価
  • 上位候補を実験(BLI)で検証

SARS-CoV-2 に対する抗体 R1-32 を例に、複数の変異株(Lambda、BQ.1.1、EG.5.1、BA.2.86、KP.3)に対して結合性が改善された抗体が得られたと本文に記載されています。