【酵素デザイン】酵素の設計を可能にするRFdiffusion の新バージョン RFdiffusion2 を紹介

論文タイトル

Atom level enzyme active site scaffolding using RFdiffusion2

出典

Atom level enzyme active site scaffolding using RFdiffusion2
De novo enzyme design starts from ideal active site descriptions consisting of constellations of catalytic residue functional groups around reaction transition ...

要旨

原子レベルの生成を可能にする酵素設計に適したモデル RFdiffusion2 を紹介した論文です。

解説など

Baker ラボから酵素のデノボデザインの最新レポートです。先日はこちらの記事で Baker ラボの酵素デザインの実施例を紹介しました。

筆者らは、既存の RFdiffusion を用いた酵素デザインの課題として、原子レベルで活性中心を定義できないことや、あらかじめ活性中心を構成するアミノ酸残基に残基番号を付与しなければならないを挙げています。確かに活性中心にはタンパク質を含まない補因子が存在することが多いですし、非連続的な活性中心にあらかじめ残基番号を指示するのは、使い方から考えて非現実的です。

筆者らは、この課題を達成するために RFdiffusion2 という新しいモデルを構築しました。

RFdiffusion2 では酵素の活性中心を “atomized residue” という原子レベルでその座標を表現するための手法を採用しています。そしてその活性中心に生成するスキャフォールドは “frame” として主鎖原子で表現します。これによりタンパク質を原子レベルで表現することを実現しています。モデルは過去に報告された RFdiffusion All-Atom がベースになっているのですが、既報の RFdiffusionAA とは異なりモデルのアーキテクチャに flow matching を採用しています。これにより、モデルの学習が安定化し、auxiliary loss (主タスクの学習を助けるために導入される追加の損失関数) や self-conditioning (前のステップの予測出力を次のステップへの入力として再利用することでモデルの一貫性を保つ) などの工夫が不要になりました。これによって、先ほどの課題を解決した条件付きの生成が可能になりました。また、ORI token を使うことで生成するタンパク質の重心を指定することができたり、RASA (Relative Accessible SurfaceArea: タンパク質やリガンド中の原子がどれだけ溶媒にさらされているか) のラベルを付与することで、その原子の露出度を制御することができるようになっています。

筆者らは、以下の酵素反応の設計を試みデザインを実験的に検証しました。

  • Aldol reaction
  • Ester hydrolysis
  • Metallohydrolysis

RFdiffusion2 で生成した構造モデルは、LigandMPNN で配列設計し、Chai-1 でモデリングしています。いずれのケースでも96以下のデザインで酵素活性を示す分子デザインに成功しています。一方でその活性はまだ天然の酵素に匹敵するものではないとのことです。

コードはこれから公開されるとのことですので、楽しみに待ちましょう。