論文タイトル
DeepREx-WS: A web server for characterising protein-solvent interaction starting from sequence
出典
Comput Struct Biotechnol J. 2021 Oct 13;19:5791-5799.

確認したいこと
- タンパク質の表面露出残基を同定する手法
要旨
タンパク質の表面露出領域を予測する深層学習手法DeepRExを提案した
解説など
タンパク質の表面露出領域を同定する手法は、先日のブログ記事でも紹介しました。
タンパク質の構造はAlphafold2などの進展で高精度化が期待されています。一方で、現在においても構造予測の難しいタンパク質は存在することから、少ない計算資源で、タンパク質のデザインに重要な要素にフォーカスして予測できる需要は高いと考えられます。
今回の論文の緒言には、先日紹介したものとは異なる、既往の表面露出領域を予測するプログラムとして、以下のものが挙げられています。
- DSSP
- PSAIA
- PaleAle
- NetSurfP-2.0
これらのほかにも、機械学習を利用した様々な手法が世の中に存在している状況です。本論文では、ウェブサーバにも公開されているDeepRExという名の新規の手法が紹介されています。
DeepRExでは、PDBデータから抽出された構造情報から訓練され、モデルが構築されています。タンパク質の各ポジションについて、Kyte-Doolittle疎水性指標および、アライメントから得られた残基の保存性をもとに、表面暴露の程度を評価するアルゴリズムです。
実際にPaleAleやNetSurfP-2.0の予測精度と比較しても、遜色ない精度を示したとのことです。これらはいずれもLSTMや畳み込み層が利用されたニューラルネットワークのアーキテクチャを使用していることが特徴です。
本研究では、DeepRExにより予測された表面露出量と、その他のパラメータとの相関解析を実施されています。その結果は以下のとおりです。
- MEDUSAによって予測されるアミノ酸残基の柔軟性は、表面露出量と相関する
- 露出量とヘリックスまたはストランド構造との相関はほぼない
- 露出量とコイル構造との相関はわずかに正
- 露出量と親水性は負の相関を示す
- 露出量と疎水性または保存性は負の相関を示す
コメント