【タンパク質デザイン】突然変異の効果をインシリコで予測しやすいタンパク質の特徴とは

論文タイトル

What makes the effect of protein mutations difficult to predict?

出典

https://www.biorxiv.org/content/10.1101/2023.09.25.559319v1

要旨

タンパク質の突然変異の効果を予測しにくい構造的特徴について考察した文献です。

解説など

本論文は、タンパク質の突然変異に対する影響予測モデルについての報告です。しかし予測精度の高いモデルを開発した、というレポートではなく、既存の予測手法がタンパク質のどのような特徴をもった残基を予測しやすいのか、また予測しにくいか、を調べ上げた結果について報告しています。

いまだに AlphaFold を用いても突然変異の予測能力には課題があることは、背景として良くあげられます。筆者らは、タンパク質領域・残基ごとに予測しやすさが異なり、予測しにくい残基には何らかの共通の特徴が存在すると仮説を立てて、各構造的特徴ごとに予測成績を確認しました。

具体的に筆者らが着目した構造的特徴は下記の4つです。

  • 埋没性
  • 接触残基の数
  • 活性部位からの距離
  • 2次構造の有無

検証のためのデータセットは、αアミラーゼの野生型と、その突然変異体の活性データです。

ここからは、結果についてです。個別の特徴ごとに見ていくと、以下の傾向があることがわかりました。

  • ヘリックス・シート・ループ領域に変異を持つ変異体間の活性の差は大きくない
  • 埋没性の高い(表面露出が少ない)変異体は、変異体の活性が低減しやすい

一方で、どの特徴に着目してもその中に活性を上げる改変、下げる改変の両方があるとのことで、どの特徴もそれだけで活性予測できるわけではないことがわかります。

さらに組み合わせ変異まで深くみていくと、変異部位の埋没性が高い、活性部位が近い、接触残基数が多い残基は、予測能力が低いことがわかります。一方でこれらの改変は単一変異では、予測能が他の性質と比較して極端に低いわけではないことから、エピスタス(組み合わせ効果)が重要であると考えられます。

本論文の結果は、直感とたがわぬように感じます。今後、予測能の低い構造的特徴に対するゼロショット予測手法が開発されることに期待しましょう。