論文タイトル
SSnet: A Deep Learning Approach for Protein-Ligand Interaction Prediction
出典
Int J Mol Sci. 2021 Jan 30;22(3):1392.

確認したいこと
深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。
要旨
本論文では、タンパク質間相互作用を予測する深層学習モデル SSnetを提案しています。
解説など
本予測モデルの特徴は、タンパク質構造の表現方法にあります。
既存の深層学習によるタンパク質構造表現の課題として、表現に活用される標的構造にあてた3Dグリッドが、巨大であり、さらにスパースな構造であることが挙げられます。
この課題を解決するため、本手法ではタンパク質骨格の曲率(κ)とねじれ(τ)を、1次元で表現しています。曲率とねじれは、2次構造のわずかな変化に敏感なため、これらを表現指標に含めることで予測精度が増すとのことです。
有効な特徴量を使用した効率的な学習によって、訓練データとなる構造情報の、高解像度化が不要になることが期待されます。
本論文では、ベンチマークとなるタンパク質間相互作用予測手法として、以下の技術と比較されていました。
- BLM
- RLS-ave
- RLS-kron
- KBMF2K
- GNN-CNN
ところで、以前の記事で紹介したMaSIF-siteについては、本論文内で言及はありませんでした。MaSIF-siteは、ジオメトリカルな特徴・化学的な特徴など幅広く特徴量として利用しているため、予測精度は本手法よりも高いことが想像されます。より重要な特徴量を効率的に使用することで、コストパフォーマンスの高いモデルを構築することが本手法の方向性になるのでしょうか。
少し脱線しますが、本論文の中では、タンパク質構造中の予測相互作用領域を可視化するために、Grad-CAMが使用されています。Grad-CAMは、画像認識タスクにおいて、モデルが認識に重要な画像領域を明示するために良く利用される分析手法です。以下のサイトで分かりやすく解説されていましたので、リンクを貼っておきます。

コメント