【タンパク質デザイン】拡散モデル・ハルシネーション型両方のタンパク質設計が可能なパイプライン PXDesign について

論文タイトル

PXDesign: Fast, Modular, and Accurate De Novo Design of Protein Binders

出典

Just a moment...

要旨

エンドツーエンドのタンパク質バインダー設計パイプライン、PXDesign の開発を紹介した論文です。

解説など

中国のテクノロジー企業 ByteDance の Protenix 開発チームからの報告です。Protenix とはタンパク質構造予測モデルでこのアーキテクチャを活用した設計手法を本論文で公開しています。

PXDesign は、以下の 2 本柱で構成されています。

  1. 生成 (Generation)
    • PXDesign-d(拡散モデルベース)
      • RFDiffusion like
      • Cartesian座標を直接生成する DiT (Diffusion Transformer) を採用。
      • AlphaFold2/3 のフレーム表現や三角更新を省き、長配列でも高速。
      • 多様なターゲットや条件(MSA, ホットスポット, 二次構造指定など)に対応可能。
    • PXDesign-h(ハルシネーション型)
      • BindCraft like
      • Protenix 構造予測器を用いた勾配ベース最適化。
      • Protenix-Mini による高速化、エンサンブルによる頑健性を導入。
  2. フィルタリング (Filtering & Ranking)
    • AlphaFold2-IG(AF2-IG)や Protenix 予測器から得られる信頼度スコア(pTM, ipTM, pLDDTなど)を用いて候補を絞り込み。
    • Protenixベースのスコアは AF2 よりも実験的バインダー濃縮能力が高く、EGFRチャレンジやSKEMPIベンチで優位性を示した。
    • AF2-IGとProtenixは補完的 で、異なる真の陽性集合を拾う → 複数フィルターの併用が有効。

本手法は複数の標的で性能を検証されており、AlphaProteo に比べて優れた性能を示しています。

  • PXDesign-d は PXDesign-h に比べ時間単位のヒット生成効率が高い
  • PXDesign-d は高速・大規模探索向き、PXDesign-hは小規模・局所最適化に有効
  • 最適な閾値は標的ごとに異なり、統一的な設定が難しい
  • TNF-α のように難しい標的も依然として存在

従来法に比べて大幅な改善効果はありませんが、BindCraft のような Hallucination アプローチをオープンソースで実行できる実装は貴重に感じました。

コードはこちら。

GitHub - bytedance/PXDesignBench: A Unified Evaluation Suite for Protein Design
A Unified Evaluation Suite for Protein Design. Contribute to bytedance/PXDesignBench development by creating an account on GitHub.