【抗体デザイン】ヒト化に活用できる抗体言語モデル GLIMPSE の性能を紹介

論文タイトル

Better antibodies engineered with a GLIMPSE of human data

出典

要旨

Infinimmune 社による抗体設計のための言語モデル GLIMPSE-1 の開発と応用について解説しています。

解説など

米国のバイオ企業 Infinimmune からのレポートです。ヒト抗体専用のタンパク質言語モデル GLIMPSE-1 を報告しています。彼らのモデルの特徴は、学習用データセットとしてヒト由来かつペア化された Fv 配列を利用している点です。具体的には、Jaffe らの公開データ + Infinimmune 社独自の Complete Human® 技術から得られたデータを利用しており、丁寧にキュレーションされているとのことです。データサイズとしては従来のヒト抗体言語モデルである Sapiens と比べて劣り、0.6M程度の配列数とのことです。

Infinimmune は、GLIMPSE-0（RoBERTaベース）の初期実験からスタートし、GLIMPSE-1ではデータだけでなくアーキテクチャも含めて改良を重ねています。

筆者らは本手法を以下の複数の事例に応用しています。

1. ヒト化（Humanization）