論文タイトル
Improving protein expression, stability, and function with ProteinMPNN
出典
要旨
ProteinMPNN を利用した配列再設計で、天然タンパク質の機能や熱安定性、発現量を改善した実施例です。
解説など
本論文は、手法そのものに独自性は少なく、シンプルに ProteinMPNN による配列再設計で、タンパク質の熱安定性が向上できることを示した実施例としての位置づけが強いと思います。
ProteinMPNN のネットワークには、タンパク質の進化情報および構造情報が含まれていますので、それらの情報を活用することで、タンパク質の熱安定性をどの程度改善できるかを、この論文から示唆できます。一方で、既存の計算機手法に対する優位性については言及されていません。配列デザインにおける ProteinMPNN の汎用性は広く認知されていますので、なじみのあるツールでどこまでタンパク質の機能改善が図れるか、また、デザイン時に注意すべきコツはあるかが、この論文の焦点に感じます。
デザインの手順は次のとおりです。
標的タンパク質の活性部位や基質結合部位を保存するために、まず機能ドメイン周囲のアミノ酸配列を固定しています。この部位は、結晶構造複合体における基質結合部位から 7 Å 以内の位置として定義されます。
次に、ProteinMPNN を使用して配列設計を実行した後、AlphaFold2 を使用して構造を予測し、pLDDT および入力構造に対する Cα 二乗平均平方根偏差 (RMSD) によって、フィルター処理しています。
本論文では、ミオグロビンとTEVプロテアーゼを標的に配列デザインを実施しています。
ProteinMPNN の配列生成では、システインを(ミオグロビンのみメチオニンも)排除するデザインで、3つの温度因子(0.1, 0.2, 0.3)から、それぞれ 20 配列を生成しています。
AF2 は MSA なしの予測です。デザインのフィルタリングでは、
- ミオグロビン:pLDDT > 85.0 および Cα RMSD < 1.0
- TEVプロテアーゼ:pLDDT > 85.0 および Cα RMSD < 2.0
が採用されています。
どちらもさらなる活性向上を目指して、バックボーンからの再設計も試みていますので、詳細を知りたい方は原著をご覧ください。