【抗体デザイン】Prescient Design の抗体ループトークナイザー IGLOO とは

論文タイトル

Conformation-Aware Structure Prediction of Antigen-Recognizing Immune Proteins

出典

Conformation-Aware Structure Prediction of Antigen-Recognizing Immune Proteins
We introduce Ibex, a pan-immunoglobulin structure prediction model that achieves state-of-the-art accuracy in modeling the variable domains of antibodies, nanob...

要旨

抗体の CDR ループ構造(Complementarity-Determining Regions) を対象とした マルチモーダル・トークナイザー、IGLOO を開発した論文です。

解説など

IGLOO は、抗体CDRの配列・構造情報をトークン化する手法です。既存のエンベディングは、アミノ酸残基単位であることがほとんどですが、IGLOO では CDR ループを単位としてトークン化できる初めての手法です。

IGLOO は、ループ長・アミノ酸配列、二面角の3種を入力することで、128-256 次元のトークンを出力します。IGLOO そのものは、SAbDab を中心とした実験構造(108,167ループ)と、OAS 配列をIbex で予測した構造(699,648ループ)で学習しています。

モデルの評価では、既知構造を対象とした構造類似度やカノニカルクラスタ分類問題に対して、ProteinMPNN や ESM-2 に比べて優れた性能を示すことを確認しています。

さらに筆者らは、IGLOO を活用して抗体言語モデルである IgBert をファインチューニングした IGLOOLM、IGLOOALM を構築しています。

この2つには以下のような違いがあります。

  • IGLOOLM → IGLOO トークン(ループ表現)を「入力トークンとして明示的に使う」
  • IGLOOALM → IGLOO トークナイザーの「表現空間と事前学習済みパラメータ」を「構造条件付けの基盤」として内部的に利用する

これにより、IGLOOLM は、親和性予測・分類など構造文脈を理解する抗体言語モデルとして、IGLOOALM は、構造生成など構造を条件に制御生成するモデルとして活用可能です。

実際に、AbBiBench のデータセットを利用した親和性予測問題で、IGLOOLM は、AbLang2、IgBert に比べて優れた結果を示しています。また抗体ループのサンプリング問題に対しては、IgBert、AntiFold、AbMPNN に比べて IGLOOALM が優れていることが示されています。

コードはこちら。

GitHub - prescient-design/igloo: Tokenizing Loops of Antibodies
Tokenizing Loops of Antibodies. Contribute to prescient-design/igloo development by creating an account on GitHub.