未知のタンパク質構造を予測する新時代へ:進化的アプローチの最新研究解説

論文タイトル

Zero-shot mutation effect prediction on protein stability and function using RoseTTAFold

出典

Just a moment...

要旨

進化情報を用いて未知のタンパク質の3D構造を予測する最新の技術の紹介です。

解説など

本論文は、RFjoint モデルが、タンパク質の突然変異を既知情報のないところからゼロショットで予測できる能力をもっているか、を評価した論文です。特にタンパク質の構造だけではなく、安定性や機能に焦点を当てている点が特徴です。

パフォーマンスの評価のためのデータセットとしては、公表されている深層突然変異スキャニングのデータセットを用いています。

Deep Mutational Scanning: Library Construction, Functional Selection, and High-Throughput Sequencing - PubMed
Deep mutational scanning is a highly parallel method that uses high-throughput sequencing to track changes in >10(5) protein variants before and after selection...

また比較のため、以下の手法と並べて評価をおこなっています。

  • MSA Transformer
https://www.biorxiv.org/content/10.1101/2021.02.12.430858v3
  • DeepSequence
Deep generative models of genetic variation capture the effects of mutations - PubMed
The functions of proteins and RNAs are defined by the collective interactions of many residues, and yet most statistical models of biological sequences consider...

結果として、予測と実測の Spearman 順位相関係数は、いずれのモデルも 0.4~0.6(強い相関)で、非機械学習モデルの MSA をベースラインと大きく変わる結果ではありませんでした。最も優れたモデルは DeepSequence です。

38 のデータセットのうち、タンパク質の熱安定性に関わるデータは2ケースだけですので、熱安定に対する予測精度は、追加の評価が必要そうです。

進歩性の高い文献ではありませんが、既存のモデルで達成できるレベルを知っておくことは大事なことです。突然変異予測のための最新手法が開発されることを期待しています。