論文タイトル
Validation of de novo designed water-soluble and transmembrane proteins by in silico folding and melting
出典
確認したいこと
深層学習を用いたタンパク質デザイン手法をベンチマークしています。
要旨
計算機でデザインしたタンパク質を、インシリコでスクリーニングするときの、AF2 や ESMFold の有用性について評価した報告です。
用語
- AF2:AlphaFold2
解説など
本論文は、インシリコでデザインしたタンパク質を AF2 と ESMFold でスクリーニングした場合の、それぞれの有用性や違いについて言及したレポートになります。
計算機上でデザインしたタンパク質の妥当性を評価したり、多数生成した構造群から優れたものを選抜する際の、ゴールドスタンダードとなる評価法は、現時点では AF2 になります。また計算コストとの兼ね合いから、MSA の不要な ESMFold も代替案として挙げられます。計算機でデザインしたモデル構造の評価は、どのような目的で設計したかに限らず実施しますので、各構造予測モデルの特徴を知ることは、とても重要です。
本論文での評価の特徴は、βシート構造を有するタンパク質や膜タンパク質を、ベンチマークのデータセットとして利用している点です。αヘリックス構造がメインのヘリックスバンドル構造におけるデザイン成功率は、50%以上といわれていますので、より課題感の強い構造のデザインを指向した評価となっています。
結論としては、
- ESMFold では、効率的に(計算コストを抑えて)”designable”な高品質の構造を選抜できる
- AF2では、実際にウェット試験に進めたときに正しくフォールディングするタンパク質を選抜できる
ことが、本論文の主張です。
“designable”とは、βバレルのようなきちんとアセンブルされた天然の構造であり、バックボーン構造の制約が正確に決まっているものを指しています。この制約が不透明な構造は ESMFold によって効率的に除去できるということです。一方で”designable”であるものが、実際の実験で正しく発現できるかは、また別の話で、この点をフォローできるのが AF2 であるとのことです。
ESMFoldにおける、”designable”なタンパク質を見分けるためのクライテリアは、以下のとおりです。
- plDDT > 0.75
- RMSD < 2.0Å
またAF2における、膜タンパク質に対するフィルター条件は、以下のとおりでした。
- plDDT > 0.85
- RMSD < 1.85Å
AF2を介することで、デザインの成功率が2~3倍向上しています。
また最後に、ESMFold でもフォールドするタンパク質を選抜するための工夫として、筆者らは in silico melting という手法を紹介していました。
コメント