【拡散モデル】ついにpico molarオーダーのバインダーをデザイン! RF diffusionのポテンシャル

論文タイトル

Broadly applicable and accurate protein design by integrating structure prediction networks and diffusion generative models

出典

https://www.bakerlab.org/wp-content/uploads/2022/11/Diffusion_preprint_12012022.pdf

確認したいこと

深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。

要旨

拡散モデルを用いたタンパク質デザイン手法 RF diffusionを提案した論文です。

解説など

David Baker研からのレポートです。拡散モデル (Denoising diffusion probabilistic models, DDPMs)を利用したタンパク質デザイン手法を提案しています。筆者らは本手法を、RoseTTAFold Diffusion (RF diffusion)と呼んでいます。

拡散モデルとは、非常に簡易化すると、ノイズデータからスタートして、徐々にノイズを除去していくことで望みのデータを生成する技術になります。拡散モデルを活用することで、構造を直接生成することが可能です。

拡散モデルを用いたタンパク質デザイン手法は既報がありますが、いずれもモチーフであったり、2次構造レベルの”fold”に限定された生成手法でした。また、in silicoでの生成事例までで実験による検証がなされていないケースがほとんどでした。

また既報には、欠損した配列を修正するRosettaFoldを用いたデザイン手法であるRfjoint Inpaintingなどもありますが、十分なトポロジーの情報を与えないとデザインが難しく、生成できるタンパク質の多様性がかなり制限されるといった特徴がありました。

一方で、RF diffusionは、初期構造なしで(ランダムノイズから)、非常に多様なタンパク質をデザインすることができます。この利点を活かし、本手法は非常に多岐にわたるユースケースで成果を出しています。具体的には下記の応用事例が紹介されていました。

  • 無条件でのモノマータンパク質のデザイン
  • 対称性を有するオリゴマータンパク質のデザイン
  • 機能性を有するスキャフォールドのデザイン
  • 酵素活性部位を保持するスキャフォールドのデザイン
  • 対称性を有するオリゴマー機能スキャフォールドのデザイン
  • ペプチドバインダーのデザイン

Rf diffusionでは、構造モデルの生成にRoseTTAFoldを使用していますが、これはAF2やOmegaFoldなど別のモデルに置き換えることも可能とのことです。RF diffusionによって生成された構造は、ProteinMPNNを用いることでアミノ酸配列に変換することができます。

RFdiffusionは、HallucinationやRFjointなどの既報技術と比較して、その性能が評価されています。いずれのケースにおいても、優れた成績を残しています。ペプチドバインダーデザインの成果が特に出色で、pico molarオーダーの親和性を有するペプチドのデザインに成功しています。ヒットレートも高く、96クローンのデザインから数十個のバインダーが同定できています。RifGen/Dockと比べると、非常に高い成功率です。

デザインされた分子はヘリックスバンドル構造をとっています。将来的には、非連続なエピトープも認識になると良いと思います。

筆者らは、今後の展望として、核酸や低分子リガンドと、そのタンパク質パートナーとの相互作用に対しても適用できる可能性があると述べています。

コメント