論文タイトル
Better antibodies engineered with a GLIMPSE of human data
出典
Just a moment...
要旨
Infinimmune 社による抗体設計のための言語モデル GLIMPSE-1 の開発と応用について解説しています。
解説など
米国のバイオ企業 Infinimmune からのレポートです。ヒト抗体専用のタンパク質言語モデル GLIMPSE-1 を報告しています。彼らのモデルの特徴は、学習用データセットとしてヒト由来かつペア化された Fv 配列を利用している点です。具体的には、Jaffe らの公開データ + Infinimmune 社独自の Complete Human® 技術から得られたデータを利用しており、丁寧にキュレーションされているとのことです。データサイズとしては従来のヒト抗体言語モデルである Sapiens と比べて劣り、0.6M程度の配列数とのことです。
Infinimmune は、GLIMPSE-0(RoBERTaベース)の初期実験からスタートし、GLIMPSE-1ではデータだけでなくアーキテクチャも含めて改良を重ねています。
筆者らは本手法を以下の複数の事例に応用しています。
1. ヒト化(Humanization)
- GLIMPSE-1 はマウス由来の20の臨床抗体に対して、CDRを保持しFRをヒト化するプロセスでSapiensを含む他モデルと同等もしくは上回る性能
- 学習データが少ないにもかかわらず、臨床抗体に一致する変異を高精度で予測
2. 親和性および製造性の向上
- 4つのターゲットに対してエンジニアリングを行い、親和性が向上した複数の変異体を同定
- 分解・脱アミド化・異性化などのリスクを予測して除去
3. 種間交差性と等電点調整
- ヒト・サル・マウスの抗原に対する結合性を評価、霊長類とヒトの間に強い相関(R²=0.78)
- 等電点(pI)の調整により製剤性も改善
4. 多様で機能的な変異体の生成
- 臨床抗体を起点として、90%以下の配列相同性で機能を保つ変異体を設計
- 全てCHO発現可能で、結合性や熱安定性も保持
本モデルを用いた配列設計はあくまで非条件付きであるため、最適化を主目的とした設計には active learning や目的関数付きの最適化手法と組み合わせることが重要です。