論文タイトル
Computational design of soluble analogues of integral membrane protein structures
出典
https://www.biorxiv.org/content/10.1101/2023.05.09.540044v1
確認したいこと
深層学習を用いたタンパク質デザイン手法をベンチマークしています。
要旨
天然の不溶性のタンパク質を、可溶性のタンパク質として発現できるように、配列を設計し直すための手法を紹介しています。
解説など
GPCRを含む複数回膜貫通タンパク質は、良い治療標的であるものの、そのタンパク質調製が難しく各種アッセイに用いることが困難であることが課題です。本論文では、天然の不溶性のタンパク質を、可溶性のタンパク質として発現できるように、配列を再設計するための手法について紹介しています。
パイプラインの流れは、AF2seq からのトポロジー生成と、それに続く ProteinMPNN での配列デザインです。設計した配列は、AF2 と RF で再予測して、以下のフィルターで有望な配列を選抜しています。
- TM score > 0.8(標的との構造類似性)
- pLDDT > 80(信頼性スコア)
- e-value > 0.1(配列の新規性)
ここでのポイントは、ProteinMPNN の weight です。通常の ProteinMPNN の weight で配列を設計すると、膜タンパクのようなトポロジーの場合、表面に疎水性残基が露出するため、低い溶解度の配列が生成される傾向にあります。そこで可溶性のタンパク質のみをデータセットに用いて、ProteinMPNN ネットワークを再訓練させたモデル(MPNNsol)を用いた、とのことです。このモデルを用いると、表面疎水性の低い新規配列を生成することができます。
筆者らは、本手法を以下に示すケースに適用して、その有用性を検証しています。
- Ig-like fold
- β-barrel fold
- TIM-barrel fold
- 膜型タンパク質
- Claudin
- Rhomboid protease
- GPCR
これらの実施例から、本手法はMDシミュレーションよりも小さい Cα RMSD を達成しています。
コメント