【タンパク質構造解析】タンパク質構造を「周期表」で表現

論文タイトル

A ‘periodic table’ for protein structures

出典

Nature. 2002 Apr 11;416(6881):657-60.

A 'periodic table' for protein structures - PubMed
Current structural genomics programs aim systematically to determine the structures of all proteins coded in both human and other genomes, providing a complete ...

確認したいこと

以下の記事で紹介した論文のリファレンスから、タンパク質の構造分類に関連した知見を深堀してみました。

要旨

タンパク質の構造レパトアを、周期表としてまとめる方法を提案しています。

解説など

既存のタンパク質やドメインの構造分類手法は、以下の記事でもまとめています。

また、タンパク質の基本構造単位の定義についても、いくつかの記事で紹介してきました。

本記事で紹介する構造分類法は、20年も前に紹介された方法ではありますが、以下の点で特徴があります。

  • タンパク質構造を、2次構造の組み合わせから形成される”Forms”として分類していること
  • Formsの規則性に着目することで、タンパク質構造の多様性を周期表としてまとめていること

α-helixやβ-strandなどの基本的な2次構造は、a-helixどうし、またはβ-strandどうしで相互作用して「層」を形成します。α-helixで形成されたα-layer、β-strandで形成されたβ-layerなどです。

この層は、フラットな平面、もしくは層が曲がることで曲面として存在します。また曲面は一周すれば、両端がつながりバレル構造になります。

様々なタンパク質は、この層が重なることで一つのドメイン構造を形成します。層の数は1~4層になることが通常です。一般的にα-layerは、連続的につながることはありません。

  • β
  • αβ
  • αβα
  • αββα

などが、多様性の例として挙げられます。

また、その層を形成する2次構造の数(対象のα-layerにα-helixが何個あるか、β-layerにβ-strandが何個あるか)にも多様性があります。

このような違いを、ひとつひとつの”Form”として定義しています。そして各Formを「周期表」として整理しています。

このように周期表として、タンパク質構造を分類することは、階層的なクラスタリングで分類する手法に比べて、以下のメリットがあります。

  • 絶対的な分類基準に従うため、タンパク質の種類が増えても分類結果が変わらない
  • 大きなタンパク質のドメイン分類にも対応できる

タンパク質の構造は、ループなどのdisorderd領域が存在するため、仮に2次構造まで細分化したとしても、分子の構造式のように明確に定義することはできません。現状は、解析目的に応じて適した分類法が異なることから、様々な手法が並列に存在することは避けられないでしょう。

コメント