【バインダーデザイン】任意のフォールドをもつタンパク質バインダーを設計できる FoldCraft を紹介

論文タイトル

An improved model for prediction of de novo designed proteins with diverse geometries

出典

Just a moment...

要旨

特定の構造フォールド(折りたたみ様式)を持つタンパク質結合分子(バインダー)をディープラーニングで設計する新しい手法「FoldCraft」を提案した論文です。

解説など

既存のバインダー生成モデルでは、特定のフォールドを指定して正確に生成するのが難しいという課題がありました。本論文で紹介されている FoldCraft では、これを実現して nanobody を設計した事例を紹介しています。

この手法の特徴は、入力構造と生成構造の接触確率マップ(cmap)を比較し、 コンタクトマップの類似性損失を減少するように生成配列を更新するアプローチです。cmap とは対象タンパク質の各残基の接触確率を表す行列で、AlphaFold2 で出力することができる distogram から算出することができます。本論文では、残基間が14Å 以内のペアを接触とみなしています。

デザインアルゴリズムは、ColabDesign や BindCraft のように、ランダム配列から出発し AF2 で構造予測、損失計算、勾配を逆伝搬し配列更新する流れです。このように設計した配列はタンパクの安定性や発現量が十分でないケースが多いことが知られているため、最後に配列設計モデル (ProteinMPNN / SolMPNN) で配列を再設計しています。

本論文では、FoldCraft で下記6種類のスキャフォールドを鋳型に PD-L1 バインダーを設計した結果を紹介しています。8-45% のデザインが、鋳型構造から3.5 Å 以内の RMSD であったとのことです。

  • Top7
  • β-barrel
  • Ig-like fold
  • TIM barrel
  • β-solenoid
  • Ankyrin repeat

また、4つの治療標的(PD-1, PD-L1, IFNAR2, EGFR)に対するナノボディを設計し、RFAntibody + ProteinMPNN との性能を下記の指標で比較しています。

  • AlphaFold3 metrics
    • plDDT >70
    • ipAE <10
    • ipTM >0.5

結果として、RFAntibody では上記を満たす設計はゼロだったのに対して、FoldCraft では最大19.5%の成功率を示したとのことです。

FoldCraft はおそらく RFAntibody に比べて計算コストが高い手法なので、同じ生成数で性能を比較するのは適切ではないこと、評価はいずれも計算上のみで実験による検証はおこなわれていないことなどは考慮する必要があるでしょう。

コードはこちら。

GitHub - KhondamirRustamov/FoldCraft
Contribute to KhondamirRustamov/FoldCraft development by creating an account on GitHub.