【タンパク質構造解析】表面露出残基をウェブサーバで解析 DeepRExとは

論文タイトル

DeepREx-WS: A web server for characterising protein-solvent interaction starting from sequence

出典

Comput Struct Biotechnol J. 2021 Oct 13;19:5791-5799.

DeepREx-WS: A web server for characterising protein-solvent interaction starting from sequence - PubMed
Protein-solvent interaction provides important features for protein surface engineering when the structure is absent or partially solved. Presently, we can inte...

確認したいこと

  • タンパク質の表面露出残基を同定する手法

要旨

タンパク質の表面露出領域を予測する深層学習手法DeepRExを提案した

解説など

タンパク質の表面露出領域を同定する手法は、先日のブログ記事でも紹介しました。

タンパク質の構造はAlphafold2などの進展で高精度化が期待されています。一方で、現在においても構造予測の難しいタンパク質は存在することから、少ない計算資源で、タンパク質のデザインに重要な要素にフォーカスして予測できる需要は高いと考えられます。

今回の論文の緒言には、先日紹介したものとは異なる、既往の表面露出領域を予測するプログラムとして、以下のものが挙げられています。

  • DSSP
  • PSAIA
  • PaleAle
  • NetSurfP-2.0

これらのほかにも、機械学習を利用した様々な手法が世の中に存在している状況です。本論文では、ウェブサーバにも公開されているDeepRExという名の新規の手法が紹介されています。

DeepREx-WS

DeepRExでは、PDBデータから抽出された構造情報から訓練され、モデルが構築されています。タンパク質の各ポジションについて、Kyte-Doolittle疎水性指標および、アライメントから得られた残基の保存性をもとに、表面暴露の程度を評価するアルゴリズムです。

実際にPaleAleやNetSurfP-2.0の予測精度と比較しても、遜色ない精度を示したとのことです。これらはいずれもLSTMや畳み込み層が利用されたニューラルネットワークのアーキテクチャを使用していることが特徴です。

本研究では、DeepRExにより予測された表面露出量と、その他のパラメータとの相関解析を実施されています。その結果は以下のとおりです。

  • MEDUSAによって予測されるアミノ酸残基の柔軟性は、表面露出量と相関する
  • 露出量とヘリックスまたはストランド構造との相関はほぼない
  • 露出量とコイル構造との相関はわずかに正
  • 露出量と親水性は負の相関を示す
  • 露出量と疎水性または保存性は負の相関を示す

コメント