【タンパク質デザイン】立体構造を変化させる変異を予測する手法 “ConformationalBiasing” とは

論文タイトル

Computational design of conformation-biasing mutations to alter protein functions

出典

Just a moment...

要旨

タンパク質の立体構造の平衡を意図的にシフトさせる変異を、計算的に効率よく設計する手法を開発・検証した研究です。

解説など

タンパク質には取り得る立体構造が複数存在するものがあります。そのような多様構造を予測するための手法として AFCluster や BioEmu などが知られています。本研究では、そのような立体構造の平衡に影響を与える変異を探索する方法を紹介しています。

本論文では、この目的のため ProteinMPNN などの Inverse Folding Model を活用しています。

これらは構造に対応する配列を復元する訓練を受けているため、

  • 非常に点変異に敏感であり、
  • 異なる立体構造に対して配列の適合性(スコア)が変化する

という特徴があります。

この特性を利用すれば、同じ配列変異が複数の構造においてどの程度「好適」かを比較することで、特定のコンフォメーションを安定化する変異を推定できる、と筆者らは考えました。

彼らが開発した、ConformationalBiasing (CB)には、以下のプロセスが実装されています。

  • 2つ以上の構造ファイルを用意
    • 例:活性状態のPDBと不活性状態のPDB
  • 変異ライブラリを生成
    • 単一変異・組み合わせ変異など
  • 各変異配列を全ての構造に対してスコアリング
    • これは内部的にProteinMPNNやESM-IF1など既存IFMを呼び出すだけ
    • sequence scoring モードで、各配列に対する global score を算出
  • スコアの差を計算
    • 例えば:「活性構造スコア − 不活性構造スコア」
  • 差が大きい変異をランキング
    • より強く片方の構造に適合する変異を特定
  • 結果をCSVや可視化で出力

つまり、事前に定義した2つの構造(活性型・不活性型など)を用意し、そのタンパク質の変異体に対して網羅的に ProteinMPNN でスコアリングすることで、どの変異がどの構造に偏らせるかを探索します。

ProteinMPNN を使って一方の構造でスコアを付ける従来手法も試したものの、このアプローチでは、変異のスコアが発現レベル(expression level)と強く相関してしまい、構造状態特異的な機能とは関連が薄い変異が優先されるとのことで、CB法によるスコア差に着目することが大事であると主張しています。

コードはこちらから。

GitHub - alicetinglab/ConformationalBiasing: Code for designing biased protein states
Code for designing biased protein states. Contribute to alicetinglab/ConformationalBiasing development by creating an account on GitHub.