【RFDiffusion】低分子に対するタンパク質バインダーを計算機で生成して構造予測!

論文タイトル

Generalized Biomolecular Modeling and Design with RoseTTAFold All-Atom

出典

https://www.biorxiv.org/content/10.1101/2023.10.09.561603v1

要旨

複合体の構造予測やデザインを、非タンパク質性の分子にまで拡張した計算機手法、RoseTTAFold-All-Atom (RFAA) と RFdiffusion All-Atom (RFdiffusionAA) について解説した論文です。

解説など

構造予測モデルである RoseTTAFold と、タンパク質生成モデルである RFDiffusion の続報です。

上記の手法は、標的分子がタンパク質に限定されていましたが、本論文では、標的分子が非タンパク質性の分子まで拡張されています。具体的には、

  • 核酸
  • 小分子
  • 金属
  • 化学修飾

など、さまざまです。

このような方法が実現したのは、分子表現をアミノ酸から原子レベルまで精緻化できたからです。

もちろん、タンパク質の表現をすべて原子レベルで表現するには、計算量がいくらあっても足りません。そこで筆者らは、生体高分子(タンパク質と核酸)の配列ベースの記述と、小分子やタンパク質修飾分子の原子グラフ表現を組み合わせることを試みました。

具体的には、まず1Dトラックには各非ポリマー原子の元素の種類を入力します。2Dトラックでは原子間の化学結合、そして3Dトラックはキラリティーに関する情報を入力しています。

これにより構築された構造予測モデルを、RoseTTAFold-All-Atom (RFAA)、拡散生成モデルは、RFdiffusion All-Atom (RFdiffusionAA) と命名しています。

筆者らは、まず RFAA を用いて、タンパク質と低分子の複合体モデリングを試みました。リガンドRMSD が 2 Å 未満を基準とすると、既報のツールである AutoDock Vina では成功率が8%であったのに対し、RFAA では症例の 32% だったとのことです。

また、タンパク質と低分子の結晶構造が既知であった場合のドッキング予測においては、DiffDock が38% の成功率であったのに対して、RFAAでは 42% でした。一方で、タンパク質とその結合ポケットまでわかった状態で予測すると、AutoDock Vina のように物理化学的に予測する手法の方が優れた成績を示した、とのことです。

筆者らは次に、RFdiffusionAA のポテンシャルを評価するために、以下に示す低分子に対する結合ポケットを有するタンパク質のデザインを試みています。

  • Digoxigenin
  • Heme
  • Bilins

Digoxigenin は、4,416 個のデザインを酵母ディスプレイでスクリーニングし、Heme と Bilins はクローナルな遺伝子を発現して評価に進めています。いずれも標的抗原に結合性を示す分子を同定できているとのことで素晴らしい成果です。やはり、RFdiffusion のプロテインバインダーデザインに比べると、難度の高さがうかがえます。コードが公開されることを期待して待ちましょう。