【de novoデザイン】GNNを利用したタンパク質デザインモデルProteinSolverを解説

論文タイトル

Fast and Flexible Protein Design Using Deep Graph Neural Networks

出典

Cell Syst. 2020 Oct 21;11(4):402-411.e4.

Fast and Flexible Protein Design Using Deep Graph Neural Networks - PubMed
Protein structure and function is determined by the arrangement of the linear sequence of amino acids in 3D space. We show that a deep graph neural network, Pro...

確認したいこと

深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。

要旨

グラフニューラルネットワークを利用したタンパク質デザインモデルProteinSolverを提案した論文です。

解説など

本論文で紹介されたProteinSolverは、タンパク質のデザインに活用できる深層グラフニューラルネットワークモデルです。

このモデルの特徴は、構造的特徴を比較的小さいデータセットで訓練した従来のモデルに比べて、大規模なデータセットが存在する配列情報を訓練データに活用していることです。

従来のモデルは、残基間距離のほかに、

  • 主鎖の2面角
  • 残基間の配向
  • ロータマー

の情報を取り入れていましたが、ProteinSolverでは、残基間の最短距離のみを取り入れています。

具体的には、タンパク質をグラフとして取り扱っています。ノード(点)はアミノ酸、エッジ(辺)は残基間距離に対応し、残基間距離は12Å以内のものだけを情報として保持します。

一方で訓練データとしては、PDBに登録されているタンパク質だけではなく、それらのホモログ配列も採用しています。7,200万ものUniParc由来のGene3Dドメイン配列を対象としています。

デザインしたデノボタンパク質や変異体の安定性を指標に、RosettaとStructured Transformer (下記リンク参照)と性能を比較して、これらの手法に劣っていないことを示しています。

原理的にStructured Transformerとは異なり、ProteinSolverは両方向性で、前後のアミノ酸残基を考慮しながらデザインすることができるのが特徴です。

コメント