【RFpeptide】RFDiffusion を利用した環状ペプチドデザインで single nM のバインダー取得に成功

論文タイトル

Accurate de novo design of high-affinity protein binding macrocycles using deep learning

出典

Accurate de novo design of high-affinity protein binding macrocycles using deep learning
The development of macrocyclic binders to therapeutic proteins typically relies on large-scale screening methods that are resource-intensive and provide little ...

要旨

RFDiffusion を用いた環状ペプチド設計で、実験的にバインダーを設計できることを証明した論文です。

解説など

先日も RFDiffusion ベースの環状ペプチドの設計手法を紹介しましたが、

今回紹介する論文は、Baker 研と同じくワシントン大の医薬科学学科の Bhardwaj ラボとの共同研究の成果です。コンセプトとしては先述と同じで、RFDiffusion に入力する位置エンコーディングを環状ペプチド用に修正するアプローチで、こちらの論文の方が先出です。また実験的に手法の性能を評価している点が論文の価値を高めています。

手法としては、主鎖構造を RFDiffusion で 10,000~20,000 個生成し、配列は各主鎖構造に対して4種類の配列を ProteinMPNN と Rosetta Relax を4ラウンド繰り返し実行して生成しています。Rosetta Relax により局所的な主鎖構造が変化するので配列の多様性を向上させることができます。

モデルのフィルタリングとして、構造予測に AfCycDesign と RosettaFold2 (ipAE, RMSD)、物理学的性質の評価に Rosetta (ddG, SAP, CMS) を利用しています。

トライアルの標的抗原は以下の4種です。

  • MCL1: αhelical epitope
  • MDM2: α helical epitope
  • GABARAP: α helical / β-sheet epitope
  • RbtA: 実験的に構造決定されていないタンパク質

後半に向かうにつれ、デザインの難度は増していますが、結果的にすべてのターゲットでバインダーを設計することができています。MDM2を例にとると、

  • ipAE < 0.3
  • ddG < -50 kcal/mol
  • CMS > 300
  • SAP score < 35

を満たすデザインが 17 デザインあり、うち3つは結合活性を有していたとのことです。

いずれの標的に対しても、Fmoc 固相合成法でデザインの半数は収量が足りずに評価に進めることができなかったというのが課題に感じました。MCL1 や MDM2 バインダーはいずれのデザインも α ヘリカルな構造が含まれていましたが、結合にはループ部分も寄与していたとのことです。GAPBARAP のような β シート性のエピトープをもつ標的だと、デザイン側にも β シート構造を持つ傾向がありました。

RbtA のような実験構造がない標的に対しては、AfCycDesign と RosettaFold2 で構造を予測し、両者で構造が妥当であること、さらには unconditional な RFDiffusion デザインでエピトープになりやすかった領域をホットスポットとして指定して、主鎖構造を生成する、という工夫を施してバインダー同定に導いています。

実装コードが公開されることが待ち遠しい有益な実証結果です。