深層学習を活用した結合界面予測手法PINetとは

論文タイトル

Protein interaction interface region prediction by geometric deep learning

出典

Bioinformatics. 2021 Mar 6;37(17):2580-2588.

Protein interaction interface region prediction by geometric deep learning - PubMed
Supplementary data are available at Bioinformatics online.

確認したいこと

深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。

要旨

深層学習を活用して、特定のリガンド・レセプター間の相互作用界面領域を予測するための手法、PINetを提案した論文です。

解説など

筆者らは、相互作用予測に関わる従来の手法を、下記のとおり様々な角度から分類しています。

相互作用予測計算法
  • 物理モデル
  • データ駆動・機械学習モデル
機械学習アプローチのタンパク質表現手法
  • 配列情報を活用
  • 構造情報を活用:BIPSPI、PAIRPred
機械学習アプローチのタスク分類
  • 界面領域予測:MaSIF、PECAN
  • 接触予測:ComplexContact、SASNet
  • 接触予測結果を後処理して、界面領域を予測:BIPSPI、PAIRPred
界面領域予測の分類
  • パートナー非依存的予測:MaSIF
  • パートナー依存的予測:Sela-Culang et al.、Hua et al.

この中で、筆者らが提案するPINetという手法は、以下の特徴やタスク定義に分類される手法となります。

  • 物理モデル(ポイントクラウドの構築、残基ごとの電荷や疎水性の同定)とデータ駆動モデル(点群データを用いた深層学習アプローチ)の両方の利点を活用した手法
  • 界面領域予測かつパートナー特異的予測

予測モデルのアーキテクチャの概念図は原著の図2で示されていて、非常に複雑です。多段階の特徴量抽出を経た深い予測モデルが構築されています。このネットワークのベースはPointNetであるとのことです。

筆者らは3つのデータセットを用いて、3段階でPINetの有用性を評価しています。

  • Step1 : Protein Docking Benchmark 5.0 (DBDS)のデータセットを用いて、タンパク質間相互作用の予測精度を評価
  • Step2 : MaSIFのデータセットを用いて、大規模かつ精錬されていないデータセットを用いた予測精度を評価
  • Step3: 抗体抗原結合予測を対象に、PINetのパフォーマンスを評価

結果は、いずれも従来法と同等以上の性能を示したと主張されていました。

コメント