【Rosetta】超入門!フラグメントアセンブリによるタンパク質構造予測

論文タイトル

Protein structure prediction using Rosetta

出典

Methods Enzymol. 2004;383:66-93.

Protein structure prediction using Rosetta - PubMed
Protein structure prediction using Rosetta

確認したいこと

Rosettaの使い方を学習できるコンテンツを作成しました。引き続きコンテンツを拡充するために学習中です。

https://www.udemy.com/course/biospace_rosetta/learn/lecture/

先日の記事で、FFLを用いたタンパク質のデザイン手法を解説しました。

本手法で使用された、フラグメントアセンブリによってフォールディングを予測するプロトコルについて詳細を確認しました。

要旨

モンテカルロサンプリングによりフラグメントをアセンブルする戦略で、タンパク質の構造を予測する手法について紹介します。

解説など

近交のタンパク質であれば、ホモロジーモデリングにより精度高く構造予測することが可能ですが、デノボ由来のタンパク質にその手法は適用できません。本手法では、全長構造をフラグメントに分割し、局所構造単位で既知の構造とマッチングすることで、デノボ構造を予測する手法を提案しています。

具体的には、以下2つの手順を経て構造が予測されます。

フラグメントの選択

予測したい配列の局所構造に適合するフラグメントを、既知構造のライブラリから選択します。この工程は”fragment insertion”とも言われます。具体的には、3残基または9残基の区分(ウィンドウ)が抽出され、ライブラリ由来の既知構造フラグメントに置換されます。選択したフラグメントが適合するかどうかは以下の複数の指標から判断されます。

  • profile-profile similarity score (PSIBLAST)
  • secondary structure (Psipred, SAM-T99, IUFO)

最終的に各ウィンドウに対して、200個の9-merフラグメントと、200個の3-merフラグメントのリストが得られます。

フラグメントのアセンブリ

各ウィンドウに対して、リスト化された9-merのフラグメントのうちのひとつが、ランダムに選択されます。フラグメントのアセンブルにより、全長の構造が生成されることになります。その後生成された構造に対して、エネルギーを計算し、安定な値を示す構造をモンテカルロ法によって探索します。エネルギーを計算するためのスコア関数は、fragment insertionの反復回数に応じて異なるものを使用します。9-merのフラグメントが探索された後は、3-merのフラグメントを用いて、さらに構造が精緻化されます。

フラグメントアセンブリのような局所的な構造に着目する手法では、ときに大きくトポロジーが崩れた構造が生成されます。したがって、大局的なスケールで構造を調整できる手法を取り入れることが望ましいです。本論文では、fragment insertionを、この方針で改良したプロトコルについても言及があります。ぜひ原著をご参照ください。

コメント