【タンパク質デザイン】タンパク質の粗視化表現を活用したデザイン手法を紹介します!

論文タイトル

DiffTopo: Fold exploration using coarse grained protein topology representations

出典

DiffTopo: Fold exploration using coarse grained protein topology representations
A major challenge in the field of computational de novo protein design is the exploration of uncharted areas within protein structural space, i.e., generating “...

要旨

タンパク質の新規表現手法CGトポロジーを用いて、タンパク質を設計する手法について紹介します。

解説など

本日は、タンパク質の主鎖構造生成手法について紹介します。

本論文で解決したい課題として、一般的にタンパク質のデザインにおいては、200アミノ酸を超える長さの構造を生成すると、自由度が指数関数的に増加するために、安定して望みの構造を設計できる確度が低くなることが知られています。

そこで筆者らは、粗粒(CG)トポロジーと呼ぶたんぱく質の表現方法を新たに開発して、デザインに活用しました。これは従来の「Form」表現とタンパク質スケッチ表現を参考に開発された表現方法です。端的には、タンパク質の構造を2次構造の集合体としてあらわす手法になります。これにより、非常に少ないデータ点を使用して、タンパク質のフォールディングを正確に表現でき、かつサンプリングスペースを削減できます。

さらに彼らは、2次構造情報を入力情報として、妥当なタンパク質構造をCGトポロジーとして生成するための拡散生成モデルとして、DiffTopoを開発しました。DiffTopoから生成した構造にもとづき、タンパク質スケッチを作成し、そこから、RFDiffusionで主鎖構造を生成、ProteinMPNNで配列を設計するという一連の流れでタンパク質の設計を試みています。

このパイプラインを用いて、αfold、βfold、α-βあらゆる2次構造の組み合わせに対して、新規なフォールドを生成できることを示しています。さらに本文では、PDL1バインダーのモチーフスキャフォールディングにも適用していますので、ご興味のある方は原著をご参照ください。