【タンパク質デザイン】Multi-Step Diffusion による Hallucination デザイン手法 Protein Hunter とは

論文タイトル

Protein Hunter: exploiting structure hallucination within diffusion for protein design

出典

Just a moment...

要旨

Protein Hunter は “構造予測モデルのハルシネーション能力を逆利用して、構造と配列を同時に最適化する新しい protein design フレームワーク” です。

解説など

本手法のポイントは2つです。

● 革新的ポイント ①

Diffusion 型構造予測モデル(AlphaFold3 / Boltz-2 / Chai-1)の “幻覚(hallucination)” を利用

  • これらの AF3-style モデルは、全残基を X(未知アミノ酸)にしても、なぜか折りたためる“それっぽい”構造を作りだす
    → これを starting backbone として利用。
  • 特に Boltz-2 が最も良い構造を hallucinate(高 pLDDT、低 RMSD、ヘリックス偏り少ない)。

● 革新的ポイント ②

構造予測(hallucination) ↔ 配列最適化(ProteinMPNN)の iterative cycle

  • step1: all-X 配列を AF3-style モデルに入れて hallucination
  • step2: その構造を ProteinMPNN / LigandMPNN で配列デザイン
  • step3: 再度構造予測(folding)
  • step4: 再デザイン
  • → この cycle を数回(通常 5 cycles)

すると backbone と sequence が互いに適応して最適化される。

AF2cycler や BoltzDesign よりも軽量で高速。

バインダーの設計例を見ると、RFdiffusion と比較して、11 targets 中 9 target で Boltz-2 使用時にRFdiffusion を上回る ipTM を示したとのことです。

Protein Hunter では、構造予測モデルに、Boltz-2、Chai-1、AF3を使用することができます。この論文では、Boltz-2 の性能が特によかったとのことです。non-canonical residues (X tokenなど)を1トークンで自然に扱えること、各diffusionステップで rigid-body alighnment が実行されるため、denoising が安定することなどが理由とのことです。

コードはこちら。

GitHub - yehlincho/Protein-Hunter
Contribute to yehlincho/Protein-Hunter development by creating an account on GitHub.