【抗体デザイン】最新のB細胞エピトープ手法 SITA について解説

論文タイトル

SITA: Predicting site-specific immunogenicity for therapeutic antibodies

出典

ScienceDirect

要旨

抗体配列のアミノ酸レベルで免疫原性を予測する機械学習モデル「SITA」を提案した研究です。

解説など

本論文で提案された SITA は、抗体のB細胞エピトープを予測する手法です。

“humaness” に着目して間接的に免疫原性を予測する BioPhi や、エピトープのプロセシングや MHC 結合を扱うT細胞エピトープ予測とは異なり、単純に抗体が認識しやすい構造モチーフをもつエピトープを予測するための手法です。

これまでに、下記のようなB細胞エピトープ手法が世の中に存在していました。

  • sequence-based
    • BepiPred-3.0
  • structure-based
    • DiscoTope-3.0
    • ElliPro
    • epitope3D
    • SEPPA 3.0
    • EPSVR

これらと SITA の大きな違いは、抗体に含まれるB細胞エピトープの予測に特化している点です。

SITA の技術的な特徴は次のとおりです。

  • Spherical Shell Model と Triangle Patch Modelによる空間的・物理化学的特徴量の抽出
  • IAb-Ab データセットと Ag-Ab データセットを用いた transfer learning 的な学習戦略
    • 抗体-抗体複合体のデータセットは数が少ないので、抗原-抗体複合体データも重みを下げつつ活用
  • XGBoost による機械学習モデル
    • マニュアルで抽出した特徴量を扱う場合は、Tree-based のモデルが強力

論文の検証結果で、上記で挙げた既存の手法に比べて、SITA が優れていることを証明しています。

課題としては、本実施例においても一部の抗体クローンに対しては予測性能が低いことが挙げられます。これはデータ量が少ないことに由来すると考えられます。また残基レベルで予測スコアを算出することができますが、どのアミノ酸に置換すればよいかなど、デザインに適した提案は本手法ではできません。

コードはこちら。

GitHub - dhnihaoya/SITA: Code repository for ourpaper "SITA: Predicting Site-specific Immunogenicity for Therapeutic Antibodies"
Code repository for ourpaper "SITA: Predicting Site-specific Immunogenicity for Therapeutic Antibodies" - dhnihaoya/SITA