論文タイトル
Generative design of sequence specific DNA binding proteins
出典
Attention Required! | Cloudflare
要旨
特定のDNA配列を選択的に認識するタンパク質を、既存の天然DNA結合タンパク質を改変するのではなく、de novo設計する深層学習パイプラインを報告しています。
解説など
DNA結合タンパク質は、遺伝子発現制御やゲノム操作の基盤になります。しかし「任意のDNA配列」にだけ高精度で結合するタンパク質を新規設計することは、長年難題でした。
従来は、
- Zinc finger
- TAL effector
- CRISPR-Cas系
など既存プラットフォームの改変が主流でしたが、サイズ、標的制約、オフターゲットなどの限界がありました。本研究では、タンパク質そのものを新規に生成し、DNA配列選択性まで計算的に組み込むことを目指しています。
方法
1. Binder block(まず結合するタンパク質を作る段階)
- RFdiffusion3で構造生成
- ターゲットは主に10 bp前後
- 120–150 aa長のタンパク質足場を多数生成
- ホットスポット指定
- 6塩基ごとの領域を選ぶ
- その重心から主構側へ3Åずらした位置にori tokenを配置
- Hydrogen bond conditioning でDNA塩基と水素結合しやすい生成バイアスを付与
- LigandMPNNで配列最適化
- AlphaFold3で複合体構造を予測
- 設計構造との整合性(RMSD、ipTMなど)でフィルタ
- DSSRにもとづく水素結合数でフィルタ
2. Specificity block(特異性を高める段階)
DNA設計で本当に難しいのは、「標的に結合する」こと以上に「似た別配列には結合しない」ことです。
そこで著者らは、
- オンターゲットDNA
- 複数のオフターゲットDNA
それぞれについてAlphaFold3予測を行い、minPAE(予測整列誤差)差分(ΔminPAE)で比較しました。
つまり、 標的配列では高信頼、非標的配列では低信頼 な設計を優先しています。
結果
成功率
本文では、15種類のDNA標的に対し各96デザインを実験評価し、7標的で特異的バインダーを同定したと記載されています。
- Binder blockのみ:約0.5% 平均特異的成功率
- Specificity block後:約3% 平均特異的成功率
- 以前のde novo DNA binder設計より約100倍高い成功率
結合親和性
本文では、代表例でKDが3–30 nMと報告されており、低ナノモルレベルの高親和性です。
構造的特徴
- 多くは天然DNA結合タンパク質と配列相同性なし
- グローバル構造もPDB既知構造と大きく異なる
- ただし、長いDNA接触面や多点水素結合ネットワークという原理は天然TFに類似
conditioningの方法論はタンパク質標的でも活用できる可能性があり、大変参考になる論文です。

