【タンパク質デザイン】リガンド結合ポケットをデザインできる PocketGen について解説します

論文タイトル

PocketGen: Generating Full-Atom Ligand-Binding Protein Pockets

出典

PocketGen: Generating Full-Atom Ligand-Binding Protein Pockets

Designing small-molecule-binding proteins, such as enzymes and biosensors, is crucial in protein biology and bioengineering. Generating high-fidelity protein po...

要旨

リガンドに結合するタンパク質ポケットをデザインする手法 PocketGen を紹介した論文です。

解説など

タンパク質・リガンド間相互作用をデザインする手法には、physics-basedの手法である PocketOptimizer や、深層学習モデルとして代表的な RFDiffusionAA などが挙げられます。

筆者らは、RFDIffusion → ProteinMPNN などのデザインアプローチにおいて、主鎖構造の生成と配列の設計が独立したステップで実行されることによる、構造・配列間の不一致性を課題としてとらえて、構造と配列を同時に生成するモデルである PocketGenを開発しました。ちなみに、彼らは FAIR という同じくリガンド結合ポケットをデザインする手法を公開していますが、これは２ステップの refinement プロセスから成る手法であり、PocketGen は、この点も改善した end-to-end なアプローチとなっています。

モデルのアーキテクチャは、以下２つのモジュールから構成されています。

bilevel graph transformer
sequence refinement module

グラフベースで構造情報を抽出しており、ポケット構造の生成には、進化情報を利用するため pLM (ESM) を活用しています。生成するポケット構造は、リガンドから3.5 Å 以内の領域を考慮に入れていて、アミノ酸長でおよそ８残基程度になります。

筆者らは、PocketGen の性能を、以下２つのベンチマークデータセットで評価しています。

CrossDocked dataset
Binding MOAD dataset

デザインの評価指標には、以下を活用しています。

AutoDock Vina score
RMSD
pLDDT
scTM
AAR

比較対象の既存モデルは以下のとおりになります。執筆時点で RFDiffusionAA のモデルは公開されていませんでしたので、こちらは比較評価の対象には含まれていません。

PocketOpt
DEPACT
dyMEAN
FAIR
RFDIffusion
PocketGen

結果としては、RMSD 以外のほぼすべての指標で、RFDiffusion を含む既存の手法より優れていることが示されています。Vina score が高いことから、標的リガンドに結合する可能性も相対的に高いモデルであることが期待されます。ウェットでの検証と、RFDiffusionAA との比較が気になるところです。

コードはこちらです。