論文タイトル
De novo Design of All-atom Biomolecular Interactions with RFdiffusion3
出典
Just a moment...
要旨
これまでのRFdiffusion系列を発展させた全原子レベルのタンパク質設計モデル RFD3 を紹介した論文です。
解説など
RFDiffusion の全原子設計モデルが公開されました。
これまでの RFdiffusion1 (RFD1) や BindCraft は残基レベルの生成モデルであり、主に骨格やタンパク質間相互作用設計に有効でしたが、小分子・核酸との原子レベル相互作用設計は難しいという制約がありました。RFdiffusion2 (RFD2) では一部の触媒残基やリガンド結合原子を条件付けできましたが、依然として残基レベル拡散であり、十分に多様な側鎖相互作用を生成できませんでした。RFdiffusion3 (RFD3)はこれらの課題を克服するものです。
RFD3のアーキテクチャ
- 基本単位をアミノ酸残基ではなく原子とする拡散モデル
- すべての残基を 「4つの主鎖原子 + 最大10の側鎖原子」=14原子トークンで表現。小さな側鎖は仮想原子で補完
- TransformerベースのU-Net構造で、原子レベル特徴と残基レベル特徴をスパースアテンションとクロスアテンションで結合
- Pairformer(AF3の距離抽出モジュール)を2層に縮小し、計算コストを大幅に削減(パラメータ数168M、AF3の半分以下)
- Classifier-free guidanceを導入し、条件付き生成の精度を向上
本手法では、例えば入力構造(例えばバインダーデザインにおける標的タンパク質)も同時に拡散生成するため、複合体として自然な幾何構造を探索することが可能です。これにより生成される構造の多様性も改善します。
生成時には、一部を仮想原子で補完しているので、配列決定まではRFD3でできず、従来通り ProteinMPNN を活用します。しかしRFD3で生成された側鎖原子の情報は、主鎖構造の制約にも寄与しますので、ProteinMPNNで再設計した配列には、結果的に生成された側鎖原子の情報も加味されます。
本論文では、インシリコのメトリクス上で、従来のタンパク質バインダー設計で多様かつ成功率が高いことを示しつつ、DNAや小分子に対するバインダーデザインや酵素設計への応用可能性を検証しています。

