【タンパク質デザイン】タンパク質の計算機デザインの歴史を学ぶ

論文タイトル

De novo protein design, a retrospective

出典

De novo protein design, a retrospective - PubMed
Proteins are molecular machines whose function depends on their ability to achieve complex folds with precisely defined structural and dynamic properties. The r...

確認したいこと

タンパク質の計算機デザインについて、レビュー稿を作成しようと考えています。既存の代表的なレビュー論文を参照しました。

要旨

タンパク質をデノボでデザインするための研究を、歴史を追って概説したレビュー論文です。

章立て

  1. 緒言
  2. マニュアルでのタンパク質デザイン
  3. 基本的な物理化学性質で指示された計算機デザイン手法
    1. ヘリックスバンドル、1から構造がデザインされた最初のタンパク質
    2. コイルドコイル
    3. 機能性をもつデノボヘリックスバンドル
      1. 金属イオンや補因子に結合するサイトを構築するための戦略
      2. 2価・4価の金属錯体
      3. 3本ヘリックスバンドルにおける3点結合サイト
      4. 天然タンパク質スキャフォールドに基づく亜鉛結合型ヘリックスバンドルにおける、エステラーゼ活性の分子進化
      5. 触媒やタンパク質間相互作用のインヒビターとしてのヘリックスバンドル
      6. 補因子結合のためのヘリックスバンドル
    4. ヘリックスバンドルを超えて
  4. 膜タンパク質のデザイン
    1. 膜タンパク質のフォールディング、安定性、集合のルールを理解する
      1. TMヘリックス・ヘリックスパッキング相互作用を安定化させる少数残基モチーフ
      2. 水素結合が膜タンパク質を安定させる
      3. 大きな無極性残基のパッキングが膜タンパク質の安定性に寄与する
    2. 機能性膜タンパク質のデザイン
      1. プロトン、金属イオン、電子の伝達が可能なTMタンパク質のデザイン
      2. 天然タンパク質のTMヘリックスを認識するTMペプチドのデノボデザイン
  5. フラグメントベース・バイオインフォマティクスに基づくタンパク質の計算機デザイン
    1. 骨格フラグメントと配列の統計指標がタンパク質デザインの範囲を広げた
    2. 機能性を付与するための、計算機デザインと実験的なライブラリースクリーニングとの融合
  6. タンパク質集合体のデザイン
    1. 1次元空間への拡張:並進・回転対称性をもつスーパーヘリックス集合体
    2. 2次元空間への拡張:平面格子状の構造
    3. 複数の対称性を組み合わせたかご型構造のアセンブリ
    4. 3次元空間への拡張:結晶のエンジニアリング
  7. 総括と展望

解説など

タンパク質デザインの歴史を総括したレビュー論文です。近年の深層学習を利用したデータドリブンな手法より、前の手法について詳説されています。計算機的な手法の確立の歴史というよりは、対象となるタンパク質構造ごとにフォーカスをあてて、その構造がより安定的にもしくは複雑な機能をもってデザインできるようになる過程を、歴史に沿って解説しています。

具体的にフォーカスを充てているタンパク質構造は、章立てのとおりですが、改めて以下に列挙します。

  • ヘリックスバンドル
  • 膜タンパク質
  • タンパク質アセンブル(少数複合体ではなく、規則的に遠くまで広がる集合体)

ヘリックスバンドルのデザインの歴史

ここでは、ヘリックスバンドルの章をピックアップして解説します。ヘリックスバンドルは、最も古くからデザインが試みられています。最初はロイシンとリジンからなる反復配列がヘリックスバンドル構造を取ることが示唆され、そのデザイン分子をさらに安定化するため再設計が試みられました。分子の対称性を考慮することで、探索する構造空間を制限したパラメトリックモデルが広く活用されています。

Einsenbergらが設計したα1Aが、Kendrewモデルを用いて構築されたことを皮切りに、α1B、α4へと再設計され、初めて水溶液中で球状のフォールディングを形成するデノボタンパク質であることが示されました。

さらに、すべての天然アミノ酸を含むヘリックスバンドル構造を生成するための試みが検討され、α2Bという2量体の4ヘリックスバンドル構造がデザインされました。

その次に、側鎖のリパッキングやエネルギーランドスケープを考慮に入れたデザインが試みられ、α3Dという3ヘリックスバンドル構造がデザインされました。設計構造と、解析された構造が非常に一致したということで、目的の構造を計算機でデザインするという大きなマイルストーンを初めて達成した分子です。

この研究は、その構造に機能(分子間相互作用、触媒活性など)を付与するという新しい課題に取り組む形で、今も進展しています。

1つの構造に着目してその歴史を見ていくと、その時点で何がデザインの課題であり、それをどうやって解決されているかが、見えやすく、理解の助けになるのでおすすめだと思いました。

計算機デザイン手法開発の歴史

手法改良の流れとしては、どの構造を対象にとっても、おおざっぱに以下の流れになると思います。

  • manual protein design: 単純な物理モデルに基づく第一原理計算(非経験的電子状態計算)
  • computational design guided by fundamental physicochemical principles:  既知構造情報を活用したパラメトリック(経験的な)デザイン
  • fragment-based and bioinformatically informed computational protein design: 物理化学的な計算とパラメトリックデザインを組み合わせた自動計算アルゴリズムの開発(Rosettaなど)

1番目は第一原理に基づく計算です。1970-1980年代に主流で、分子力学、動力学をもとに構造を求める手法になります。このような手法で計算できるタンパク質の多様性は小さく、数十残基程度の分子デザインが限度でした。

2番目はパラメトリックデザインです。1980年代後半から徐々に採用されだした手法です。パラメトリックデザインにおいて重要な役割を果たした技術は2つあります。1つは骨格構造を定義するための数式の開発、2つ目がロータマーを活用したリパッキング手法です。これにより望みの構造を示す配列のデザインが容易になりました。天然タンパク質の構造も徐々に解かれるようになった時代です。コアの疎水性パッキングがフォールディングの推進に重要であるなど、物理化学的に重要な性質が、経験をともなって明らかになってきます。この手法を元にヘリックス型の構造をもつデザインが進展していきました。

3番目の計算手法の開発では、フラグメントアセンブリによる構造モデリングが利用されました。PDBに登録された既知の構造フラグメントを活用することで、骨格構造のデザイン精度が向上することができます。これにより、これまで困難であったβシートを含む構造の生成ができるようになってきました。

このような技術が発展した背景には、遺伝子やタンパク質の調製・解析技術が向上したことが挙げられます。遺伝子合成の技術や、タンパク質を遺伝子工学的に調製する技術は、天然のタンパク質構造を明らかにするのに十分な数の構造情報を世の中に提供しました。

コメント