物理ベース設計と深層学習を組み合わせたCLAIREが切り拓くデノボ小分子バインダー設計

論文タイトル

A Hybrid Physics-Deep Learning Framework for Combinatorial De Novo Design of Small-Molecule Binding Proteins

出典

Just a moment...

要旨

小分子(ステロイドなど)に結合するタンパク質をゼロから設計するために、物理ベース計算と深層学習を統合した「CLAIRE(CombinatoriaL Assembly with Integrated REfinement)」という設計フレームワークが提案されています。

解説など

小分子結合タンパク質のデノボ設計(天然に存在しない新規タンパク質を計算で設計すること)は、タンパク質工学の中でも特に難しい課題です。特に難しい要素は水素結合の形成です。疎水性相互作用よりも幾何学条件(距離や角度)が厳密で、少しズレるだけで結合性能が落ちやすいことが、従来法の成功率を下げていました。

本研究では、

  • 小分子に対する理想的な相互作用モチーフ(binding motif)
  • それを受け入れる多様なタンパク質骨格(scaffold)

を別々に大量生成し、その後に組み合わせる「組合せ型」戦略を採用しています。これを「CLAIRE(CombinatoriaL Assembly with Integrated REfinement)」と命名しています。

CLAIREは複数段階から構成されています。

1. BSFF(Binding Sites from Fragments)

標的分子を化学フラグメントに分解し、PDB中の既知構造から、その部分構造に対してよく使われるアミノ酸相互作用を抽出します。さらに頻出する相互作用モード(例えばπスタッキングやcation-π)を統計的に選別し、4残基モチーフとして組み合わせます。

Rosettaの単純エネルギー関数だけでは、

  • πスタッキング
  • cation-π
  • 多点水素結合

のような複雑な幾何を十分評価しにくい場合がありますので、それを解決してくれる方法です。

2. LUCS(Loop-helix-loop Unit Combinatorial Sampling)

NTF2トポロジー(α/β構造を持つフォールド)をベースに、ヘリックス位置や長さを細かく変えた1,816種類の骨格を作成します。diffusionモデルでは設計可能性が低下しやすく、固定のスキャフォールド利用では自由度が低い点を改善した中間的なアプローチです。

3. Rosetta Match

作ったモチーフを骨格へ厳密な幾何条件で埋め込みます。本文では、距離0.5 Å以内、角度・二面角10–15°以内という狭い条件でマッチングしたと記載があります。

4. HBRefine(新規開発)

埋め込んだ後に、埋もれた未満足水素結合ドナー/アクセプターを修正します。ここが本研究の重要点で、水素結合不足を重点的に補正することで、in silico成功率が最大約7倍改善したと本文にあります。

5. ProteinMPNN + Rosetta + AlphaFold2

  • ProteinMPNN:結合部位以外の配列最適化
  • Rosetta:物理ベース安定化
  • AlphaFold2:設計構造の成立性チェック

上記のとおりAIは最終ステップのみで利用し補助的な役割を果たします。

本手法の評価対象として、化学構造が似ている2種類のステロイド、

  • Estriol(ESL)
  • Progesterone(PRG)

を標的に選択しました。本文では、

  • 26デザインを実験検証
  • 15/26 が単量体
  • 8/26 が良好にフォールド
  • 4/26 が標的に結合

と報告されています。PRGに対しては特異的に結合する分子が得られたものの、ESLバインダーはPRGに交差するとのことです。

コードはこちら。

GitHub - cvgalvin/CLAIRE: Combinatorial Assembly with Integrated REfinement for de novo design of small molecule binding proteins
Combinatorial Assembly with Integrated REfinement for de novo design of small molecule binding proteins - cvgalvin/CLAIRE