【結合ポケット予測】GCN を利用したリガンド結合サイト予測手法を紹介!

論文タイトル

Protein ligand binding site prediction using graph transformer neural network

出典

Protein ligand binding site prediction using graph transformer neural network
Ligand binding site prediction is a crucial initial step in structure-based drug discovery. Although several methods have been proposed previously, including th...

要旨

グラフトランスフォーマーニューラルネットワークを活用した、リガンド結合サイトの予測手法を紹介した論文です。

解説など

タンパク質のリガンド結合ポケットを予測する深層学習手法は、これまで主にアルゴリズムとして CNN を利用したアプローチがほとんどでした。これに対して筆者らは、”graph convolutional” ネットワーク (GCNs) を活用した手法を開発して公開しています。本手法は対象タンパク質の結合パートナーを明示してそれが結合する結合サイトを予測する手法ではなく、対象タンパク質の表面特性などからリガンドポケットになりやすい領域を特定するタイプの手法です。

モデルの訓練データセットとしては、以下の2種のデータを活用しています。

  • sc-PDB
  • PoSSuM

PoSSuM の方が sc-PDB データと比べるとデータ数が充実しています。実際にモデルの性能は PoSSuM を利用したモデルの方が優れていました。そのほか、訓練データに SASA を加えると成績が改善、パラメータ数 1.28→ 7.34 M の増加で成績は微良とのことです。

また、下記の既存の手法に比べて、本手法は優れた成績を示していました。

  • Fpocket
  • DeepSite
  • Kalasanty
  • P2Rank
  • DeepPocket

コードはこちらから。

GitHub - pfnet-research/pocket_detection: Pocket detection
Pocket detection. Contribute to pfnet-research/pocket_detection development by creating an account on GitHub.