論文タイトル
SITA: Predicting site-specific immunogenicity for therapeutic antibodies
出典
ScienceDirect
要旨
抗体配列のアミノ酸レベルで免疫原性を予測する機械学習モデル「SITA」を提案した研究です。
解説など
本論文で提案された SITA は、抗体のB細胞エピトープを予測する手法です。
“humaness” に着目して間接的に免疫原性を予測する BioPhi や、エピトープのプロセシングや MHC 結合を扱うT細胞エピトープ予測とは異なり、単純に抗体が認識しやすい構造モチーフをもつエピトープを予測するための手法です。
これまでに、下記のようなB細胞エピトープ手法が世の中に存在していました。
- sequence-based
- BepiPred-3.0
- structure-based
- DiscoTope-3.0
- ElliPro
- epitope3D
- SEPPA 3.0
- EPSVR
これらと SITA の大きな違いは、抗体に含まれるB細胞エピトープの予測に特化している点です。
SITA の技術的な特徴は次のとおりです。
- Spherical Shell Model と Triangle Patch Modelによる空間的・物理化学的特徴量の抽出
- IAb-Ab データセットと Ag-Ab データセットを用いた transfer learning 的な学習戦略
- 抗体-抗体複合体のデータセットは数が少ないので、抗原-抗体複合体データも重みを下げつつ活用
- XGBoost による機械学習モデル
- マニュアルで抽出した特徴量を扱う場合は、Tree-based のモデルが強力
論文の検証結果で、上記で挙げた既存の手法に比べて、SITA が優れていることを証明しています。
課題としては、本実施例においても一部の抗体クローンに対しては予測性能が低いことが挙げられます。これはデータ量が少ないことに由来すると考えられます。また残基レベルで予測スコアを算出することができますが、どのアミノ酸に置換すればよいかなど、デザインに適した提案は本手法ではできません。
コードはこちら。
GitHub - dhnihaoya/SITA: Code repository for ourpaper "SITA: Predicting Site-specific Immunogenicity for Therapeutic Antibodies"
Code repository for ourpaper "SITA: Predicting Site-specific Immunogenicity for Therapeutic Antibodies" - dhnihaoya/SITA