【タンパク質デザイン】HDX-MSデータを活用したMLモデルで、局所的な揺らぎを制御するタンパク質を設計

論文タイトル

Large-scale discovery, analysis, and design of protein energy landscapes

出典

Large-scale discovery, analysis, and design of protein energy landscapes
All folded proteins continuously fluctuate between their low-energy native structures and higher energy conformations that can be partially or fully unfolded. T...

要旨

多数のタンパク質ドメインに対し、HDX-MSで高エネルギー状態の挙動を測定する方法を開発し、安定性や協同性を制御する配列を設計できる事例を示した論文です。

解説など

タンパク質の局所的な構造揺らぎに焦点を当てた論文です。HDX-MSによりタンパク質の各残基に含まれるアミド水素の交換反応の時間経過を測定すると、その反応速度からその残基がどれだけ「open」であるかを ΔGopen という値で評価することができます。タンパク質の各アミノ酸残基は局所的に常に揺らいでおり、この「closed」→「open」への遷移が残基間で連携して、最終的にマクロな現象として、タンパク質の全体構造が「unfold」となります。これは ΔGunfold として定量化することができます。

筆者らは、ΔGunfoldではなく、ΔGopenを解析することの重要性を主張しています。その理由には以下4つのポイントがあります。

  • 構造が安定でも、「揺らぎ」が多いと問題になる場面がある
    • 局所的な開きが、凝集の核になったり、プロテアーゼ感受性を高める恐れがある
    • cooperativity を高めることは安定性を実現するカギとなる
  • 免疫原性の抑制
    • 意図しないエピトープの露出=免疫原性の原因となる
    • cooperativity を高めることで、免疫原性リスクの低減に貢献
  • 酵素やバインダーのon/off制御に生かせる
    • cooperativity が高いと、機能をスイッチする分子が作成可能
  • 安定性改善エンジニアリングのの効率化
    • cooperativity に着目すると点変異で制御可能、実験的なコストを最小限に最大の安定性改善効果が得られる

筆者らは多様なタンパク質のΔGopenを網羅的に調べるために、オリゴプールで調製された cDNAライブラリを対象に同時にHDX-MS解析をおこないました。これをMultiplex HDX-MS (mHDX-MS)と呼びます。

ライブラリとしては、

  • デノボデザイン由来の4ファミリー (ααα、βαββ、αββα、ββαββ)
  • 天然ドメイン由来の6ファミリー (LysM, PASTA, WW, SH3, Pyrin, Cold-Shock domains)

を対象に、最終的に5,778ドメインのタンパク質を解析しました。

この網羅データを通じて、

  • アミノ酸残基全体で一斉に開く→高い協同性(two-state unfolding, all-or-nothing)
  • 局所的に開く→低い協同性(multi-state unfolding)

という2種類の性質のどちらを示すかで、タンパク質を分類できることを明らかにしました。また、一般に低い協同性を示すタンパク質は、ΔGunfoldが高い(全体構造が安定)傾向にあるとのことです。

最後に彼らは cooperativityを改善するタンパク質デザインを試みました。対象は、ααα、ββαββをそれぞれもつデノボタンパク質です。これは両者ともΔGunfoldは高いのに、ΔGopenの分布が広く、協同性が低い典型例です。

筆者らは、配列の構造的・物理的な特徴(Rosettaスコア、2次構造、疎水性、pLDDT)を入力に、ΔGunfoldとcooperativityを予測できる機械学習モデルを、mHDX-MSデータを用いて構築しました。

このモデルを使って、計算機ですべての2改変の組み合わせを仮想的に探索し、ΔGunfold が維持もしくは改善、かつcooperativity が改善する変異体を選定し、評価に進めています。実際にランダムで選択された改変に比べ、設計した改変は cooperativity が高まる改変である確率が格段に高いことを示しています。