【抗体デザイン】ヒト化に活用できる抗体言語モデル GLIMPSE の性能を紹介

論文タイトル

Better antibodies engineered with a GLIMPSE of human data

出典

Just a moment...

要旨

Infinimmune 社による抗体設計のための言語モデル GLIMPSE-1 の開発と応用について解説しています。

解説など

米国のバイオ企業 Infinimmune からのレポートです。ヒト抗体専用のタンパク質言語モデル GLIMPSE-1 を報告しています。彼らのモデルの特徴は、学習用データセットとしてヒト由来かつペア化された Fv 配列を利用している点です。具体的には、Jaffe らの公開データ + Infinimmune 社独自の Complete Human® 技術から得られたデータを利用しており、丁寧にキュレーションされているとのことです。データサイズとしては従来のヒト抗体言語モデルである Sapiens と比べて劣り、0.6M程度の配列数とのことです。

Infinimmune は、GLIMPSE-0(RoBERTaベース)の初期実験からスタートし、GLIMPSE-1ではデータだけでなくアーキテクチャも含めて改良を重ねています。

筆者らは本手法を以下の複数の事例に応用しています。

1. ヒト化(Humanization)

  • GLIMPSE-1 はマウス由来の20の臨床抗体に対して、CDRを保持しFRをヒト化するプロセスでSapiensを含む他モデルと同等もしくは上回る性能
  • 学習データが少ないにもかかわらず、臨床抗体に一致する変異を高精度で予測

2. 親和性および製造性の向上

  • 4つのターゲットに対してエンジニアリングを行い、親和性が向上した複数の変異体を同定
  • 分解・脱アミド化・異性化などのリスクを予測して除去

3. 種間交差性と等電点調整

  • ヒト・サル・マウスの抗原に対する結合性を評価、霊長類とヒトの間に強い相関(R²=0.78)
  • 等電点(pI)の調整により製剤性も改善

4. 多様で機能的な変異体の生成

  • 臨床抗体を起点として、90%以下の配列相同性で機能を保つ変異体を設計
  • 全てCHO発現可能で、結合性や熱安定性も保持

本モデルを用いた配列設計はあくまで非条件付きであるため、最適化を主目的とした設計には active learning や目的関数付きの最適化手法と組み合わせることが重要です。