【タンパク質分類】タンパク質の機能分類に新しい風。Urfold という概念について

論文タイトル

Deep Generative Models of Protein Structure Uncover Distant Relationships Across a Continuous Fold Space

出典

Deep Generative Models of Protein Structure Uncover Distant Relationships Across a Continuous Fold Space
Our views of fold space implicitly rest upon many assumptions that impact how we analyze, interpret and understand protein structure, function and evolution. Fo...

要旨

Urfold という独自のタンパク質分類を解釈できる深層学習モデル DeepUrfold の開発を示した論文です。

解説など

筆者らは、新しい着眼点からタンパク質の構造・機能分類を試みています。ここで重要なキーワードは、”topology” と “architecture” という2つの単語です。

タンパク質構造に言及する際に筆者らは、これら2つのワードを以下のように使い分けています。

  • Topology: SSEs (2次構造要素) の接続パターンと順序
  • Architecture: SSEs の相対的な配置

topology は、アミノ酸残基やドメインの1次構造的な順序を考慮しますので、例えば permutate されたタンパク質は、まったく異なる topology に分類されることになります。筆者らは topology の異なるタンパク質でも、architecture が同じであれば、機能性は類似すると考え、そのようなタンパク質群は “Urfold” という分類階層が共通であるととらえています。

彼らはさらにこのような独自の特徴指標を解釈できる深層学習モデル DeepUrfold を開発しています。

筆者らの手法を含む深層学習モデルベースのタンパク質の表現方法は、CATH のような階層分類のように相互排他的でないため、柔軟に比較的弱い関連性をを精度高くとらえることができることがメリットです。十分な表現力があることと説明可能であることが両立できることが、このような取り組みの重要なマイルストーンであるといえます。