【タンパク質デザイン】リン酸化ペプチドバインダーを設計できる RFDの拡張版 RFD2-MI とは

論文タイトル

De novo design of phospho-tyrosine peptide binders

出典

Just a moment...

要旨

RFDiffusion2を拡張してリン酸化依存的タンパク質結合分子を設計可能にした研究です。

解説など

RFD2 はもともと酵素活性部位や小分子結合部位を設計するための拡散モデルです。

今回の RFD2-MI (Molecular Interfaces) はこれを拡張して、リン酸化ペプチドのような修飾タンパク質を標的にしたバインダー設計を可能にしています。RFD2-MIには以下の特徴があります。

  • 1D条件付けベクトル:各残基に対し、二次構造、SASA、hotspot/anti-hotspotマスク、モチーフフラグ等を入力条件として与える
  • all-atom生成:側鎖原子を含む全原子構造を生成可能
  • hotspot中心ノイズ初期化:拡散過程の初期座標ノイズを、結合部位のhotspot中心に設定して配置を制御
  • 学習データ:コンパクトで良く折り畳まれたタンパク質–タンパク質複合体を中心に学習、disordered領域は除去

学習データについて補足すると、RFdiffusionでは単鎖PDB構造+特定モチーフ、RFD2ではタンパク質-リガンド複合体が学習データであったところから、RFD2-MIではさらに広い複合体構造を対象に特化して学習しています。

筆者らは、この手法をリン酸化ペプチドバインダーの生成に適用しています。標的リン酸化ペプチドは配列として入力し、構造生成時にはバインダーとともにpYペプチド構造を同時に生成します。

標的としたリン酸化サイト

  1. CD3ε pY188
  2. EGFR pY1068
  3. EGFR pY1173
  4. INSR pY1361

設計パイプライン

  1. 拡散生成 (RFD2-MI)
    • タンパク質とリン酸化ペプチドを同時に拡散生成。
    • 必要に応じて Logos pipeline と組み合わせ。
  2. 配列設計 (LigandMPNN)
    • 全原子構造から最適化された配列を予測。
  3. Rosetta ΔΔG フィルタ
    • 全体の結合エネルギー、pYとのH結合数、非リン酸化部位への結合特異性を評価。
  4. AlphaFold3による再予測・スクリーニング
    • pAE, ipTM, RMSD, H結合数などを基準に最終選抜。

結果

標的構築数検出されたヒット特異的バインダーのKD
CD3ε pY18845911.5 μM(非リン酸化は結合なし)
EGFR pY106850821(特異的)3.8 μM
EGFR pY117324082(特異的)最低 577 nM
INSR pY1361802(特異的)1.2 μM

成功率は低く(<0.1%)、親和性も中程度(500 nM〜数 μM)です。リン酸基の脱溶媒化エネルギー補償が課題であると考えられています。