【タンパク質デザイン】Chroma のコードが公開されました!

論文タイトル

Illuminating protein space with a programmable generative model

出典

Illuminating protein space with a programmable generative model - Nature
Evolution has produced a range ofdiverse proteins, and now a generative model called Chroma can expand that set by allowing the user to design new proteins and ...

要旨

タンパク質のデザイン手法 Chroma の公開コードについて紹介します。

解説など

本日は、先日発表されたプロテインデザインツールであります、Chroma について解説します。本手法の概要は過去にプレプリントサーバーで公開されており、本ブログでも紹介しました。

概要を再度ご説明しますと、かなり柔軟性の高い望みの制約条件に基づいて、タンパク質の全原子構造とアミノ酸配列を生成することができるツールです。このいわゆる”programmability”が売りの手法になります。RFDiffusion と同時期に公開されて、とても話題になりました。

最近、この手法が Nature でパブリケーションされるのと同時に、コードも公開されました。

GitHub - generatebio/chroma: A generative model for programmable protein design
A generative model for programmable protein design - generatebio/chroma

Github 上では、簡易なテストコードともに、Colab Notebooks も公開されています。

上記で説明した programmability は、”Conditioner API”という機能で実現できます。Conditioner を用いることで、タンパク質の対称性や2次構造、CATH などの特定の分類に基づくドメイン、テキストキャプションなどの制約からタンパク質を生成することが可能です。各 Conditioner フレームワークは、微分可能な方法で、タンパク質の状態をエネルギーとして表現した関数です。

本ツール内で実装された Conditioner だけではなく、Conditioner API を用いることで制約条件を自由に開発できることがこのツールで大きな特徴です。下記のような4つの入力から、順伝播関数を定義することで、望みのタンパク質の生成にチャレンジすることができます。

  • X: 座標情報
  • C: チェインマップ
  • O: 配列
  • U: エネルギー

論文でも紹介されているアルファベットやアラビア数字をタンパク質で模したデザインは、このようなツールの柔軟性により実現されています。実際にリアルワールドでこのようなフォールドを取れるかは、もちろん検証が必要で、文献内でもウェットの検証は単純な構造にとどまっているため未知なところです。