【エピトープ予測】深層学習モデルを利用した抗体エピトープ予測手法を解説

Antibody Specific B-Cell Epitope Predictions: Leveraging Information From Antibody-Antigen Protein Complexes

Front Immunol. 2019 Feb 26;10:298

抗体のエピトープを、既存の構造データセットを利用した深層学習モデルを活用して、予測する手法を提案している論文です。

抗体・抗原相互作用のドッキングシミュレーションは、本ブログでも解説してきました。これまで紹介した手法は、計算科学的な手法、またはウェット実験に基づくアプローチになります。

本記事で紹介するのは、深層学習を活用した統計学的なアプローチによるエピトープ予測になります。

本手法では、抗体・抗原複合体の構造情報を、モデルの訓練データとして活用しています。データセットは、IEDB-3Dに登録された857種類の複合体構造が含まれています。各構造データから、下記の情報が抽出され特徴量として利用されます。

本研究では、利用する特徴量を以下のとおりに分類して、モデルの精度評価を行っています。

つぎに、これらの特徴量を活用して学習モデルを構築します。深層学習モデルのアーキテクチャには、Feed Forward Neural Networksを使用しています。

ベンチマークデータを用いて、モデルを評価すると、期待通り、”Full”モデルが最も精度高くエピトープが予測できるという結果が得られました。既存のB細胞エピトープ予測ツールであるDiscotope-2.0と比較しても、優位な効果が確認できたとのことです。

エピトープ領域は、その抗原だけでなく、対象とする抗体の特徴にも依存しますので、抗体との組み合わせを考慮に入れた予測手法が望ましいと本研究からも主張できます。

本研究では、この予測手法を、同族ファミリー抗原のエピトープ予測に活用した事例なども紹介されています。興味のある方は原著をご覧ください。