RFdiffusion3とAlphaFold3によるDNAバインダー設計

論文タイトル

Generative design of sequence specific DNA binding proteins

出典

Attention Required! | Cloudflare

要旨

特定のDNA配列を選択的に認識するタンパク質を、既存の天然DNA結合タンパク質を改変するのではなく、de novo設計する深層学習パイプラインを報告しています。

解説など

DNA結合タンパク質は、遺伝子発現制御やゲノム操作の基盤になります。しかし「任意のDNA配列」にだけ高精度で結合するタンパク質を新規設計することは、長年難題でした。

従来は、

  • Zinc finger
  • TAL effector
  • CRISPR-Cas系

など既存プラットフォームの改変が主流でしたが、サイズ、標的制約、オフターゲットなどの限界がありました。本研究では、タンパク質そのものを新規に生成し、DNA配列選択性まで計算的に組み込むことを目指しています。

方法

1. Binder block(まず結合するタンパク質を作る段階)
  • RFdiffusion3で構造生成
    • ターゲットは主に10 bp前後
    • 120–150 aa長のタンパク質足場を多数生成
    • ホットスポット指定
      • 6塩基ごとの領域を選ぶ
      • その重心から主構側へ3Åずらした位置にori tokenを配置
    • Hydrogen bond conditioning でDNA塩基と水素結合しやすい生成バイアスを付与
  • LigandMPNNで配列最適化
  • AlphaFold3で複合体構造を予測
    • 設計構造との整合性(RMSD、ipTMなど)でフィルタ
    • DSSRにもとづく水素結合数でフィルタ
2. Specificity block(特異性を高める段階)

DNA設計で本当に難しいのは、「標的に結合する」こと以上に「似た別配列には結合しない」ことです。

そこで著者らは、

  • オンターゲットDNA
  • 複数のオフターゲットDNA

それぞれについてAlphaFold3予測を行い、minPAE(予測整列誤差)差分(ΔminPAE)で比較しました。

つまり、 標的配列では高信頼、非標的配列では低信頼 な設計を優先しています。

結果

成功率

本文では、15種類のDNA標的に対し各96デザインを実験評価し、7標的で特異的バインダーを同定したと記載されています。

  • Binder blockのみ:約0.5% 平均特異的成功率
  • Specificity block後:約3% 平均特異的成功率
  • 以前のde novo DNA binder設計より約100倍高い成功率
結合親和性

本文では、代表例でKDが3–30 nMと報告されており、低ナノモルレベルの高親和性です。

構造的特徴
  • 多くは天然DNA結合タンパク質と配列相同性なし
  • グローバル構造もPDB既知構造と大きく異なる
  • ただし、長いDNA接触面や多点水素結合ネットワークという原理は天然TFに類似

conditioningの方法論はタンパク質標的でも活用できる可能性があり、大変参考になる論文です。