【de novoデザイン】TERMを利用したタンパク質の計算機デザイン手法dTERMenを解説

論文タイトル

A general-purpose protein design framework based on mining sequence–structure relationships in known protein structures

出典

Proc Natl Acad Sci U S A. 2020 Jan 14;117(2):1059-1068.

A general-purpose protein design framework based on mining sequence-structure relationships in known protein structures - PubMed
Current state-of-the-art approaches to computational protein design (CPD) aim to capture the determinants of structure from physical principles. While this has ...

確認したいこと

先日、TERMを利用したタンパク質デザインのための深層学習モデルについて、紹介しました。

本論文の中でも引用されていた、深層学習を利用しないTERMによるタンパク質設計手法 dTERMenについて、原点に戻って紹介したいと思います。

要旨

TERMを用いて、タンパク質の設計をおこなう手法dTERMenを提案した論文です。

解説など

TERMとは、タンパク質に普遍的に存在する部分構造定義の1種です。様々なタンパク質は、少ない種類のTERMの組み合わせで構成されていると考えることができます。

本研究では、原子間相互作用に基づく第一原理的な手法ではなく、TERMSをベースとした情報科学的な解析をベースに、タンパク質の構造決定や設計を試みています。

筆者らの開発したdTERMenでは、以下の手順でタンパク質のデザインを行います。

  • 標的タンパク質をTERMの構造単位で切断する
  • 各TERMにマッチするフラグメントをPDBから探索する
  • 探索結果に基づき”pseudoenergy potential”を算出し、構造最適化または設計のためのスコアリングを行う

手法の精度評価

手法の評価結果を以下に示します。

  • Rosettaと比較して、設計されたアミノ酸配列の回収率は、ほぼ同等
  • Rosettaと比較して、設計された配列の特徴は大きく異なる
  • ジスルフィド結合の設計が可能

また、dTERMenによって蛍光タンパク質であるmCherryの再デザインをおこなっています。設計した配列を大腸菌で発現させたところ、48の変異を有していたにも関わらず、野生型のタンパク質に特徴的な発色団の特徴を維持することができた、とのことです。

コメント