【エピトープ予測】深層学習モデルを利用した抗体エピトープ予測手法を解説

論文タイトル

Antibody Specific B-Cell Epitope Predictions: Leveraging Information From Antibody-Antigen Protein Complexes

出典

Front Immunol. 2019 Feb 26;10:298

Antibody Specific B-Cell Epitope Predictions: Leveraging Information From Antibody-Antigen Protein Complexes - PubMed
B-cells can neutralize pathogenic molecules by targeting them with extreme specificity using receptors secreted or expressed on their surface (antibodies). This...

確認したいこと

  • 計算科学的なドッキングシミュレーションの精度を上げるためのエピトープ予測手法

要旨

抗体のエピトープを、既存の構造データセットを利用した深層学習モデルを活用して、予測する手法を提案している論文です。

用語

  • PC:Principal Components
  • RSA:Relative Solvent Accessibility

解説など

抗体・抗原相互作用のドッキングシミュレーションは、本ブログでも解説してきました。これまで紹介した手法は、計算科学的な手法、またはウェット実験に基づくアプローチになります。

本記事で紹介するのは、深層学習を活用した統計学的なアプローチによるエピトープ予測になります。

本手法では、抗体・抗原複合体の構造情報を、モデルの訓練データとして活用しています。データセットは、IEDB-3Dに登録された857種類の複合体構造が含まれています。各構造データから、下記の情報が抽出され特徴量として利用されます。

  • アミノ酸組成
  • 水素結合のドナー・アクセプター原子
  • 疎水性スコア
  • 芳香族・正電荷・負電荷残基
  • 主成分(x, y, z座標から計算)
  • パッチサイズ
  • パッチ密度
  • 溶媒露出度
  • トライアド
  • ゼルニケモーメント

本研究では、利用する特徴量を以下のとおりに分類して、モデルの精度評価を行っています。

  • Antigen feature only model:上記①のみ利用
  • Minimal model:上記①、②を利用
  • Full model:上記①、②、③を利用

つぎに、これらの特徴量を活用して学習モデルを構築します。深層学習モデルのアーキテクチャには、Feed Forward Neural Networksを使用しています。

ベンチマークデータを用いて、モデルを評価すると、期待通り、”Full”モデルが最も精度高くエピトープが予測できるという結果が得られました。既存のB細胞エピトープ予測ツールであるDiscotope-2.0と比較しても、優位な効果が確認できたとのことです。

エピトープ領域は、その抗原だけでなく、対象とする抗体の特徴にも依存しますので、抗体との組み合わせを考慮に入れた予測手法が望ましいと本研究からも主張できます。

本研究では、この予測手法を、同族ファミリー抗原のエピトープ予測に活用した事例なども紹介されています。興味のある方は原著をご覧ください。

コメント