論文タイトル
PocketGen: Generating Full-Atom Ligand-Binding Protein Pockets
出典

要旨
リガンドに結合するタンパク質ポケットをデザインする手法 PocketGen を紹介した論文です。
解説など
タンパク質・リガンド間相互作用をデザインする手法には、physics-basedの手法である PocketOptimizer や、深層学習モデルとして代表的な RFDiffusionAA などが挙げられます。
筆者らは、RFDIffusion → ProteinMPNN などのデザインアプローチにおいて、主鎖構造の生成と配列の設計が独立したステップで実行されることによる、構造・配列間の不一致性を課題としてとらえて、構造と配列を同時に生成するモデルである PocketGenを開発しました。ちなみに、彼らは FAIR という同じくリガンド結合ポケットをデザインする手法を公開していますが、これは2ステップの refinement プロセスから成る手法であり、PocketGen は、この点も改善した end-to-end なアプローチとなっています。
モデルのアーキテクチャは、以下2つのモジュールから構成されています。
- bilevel graph transformer
- sequence refinement module
グラフベースで構造情報を抽出しており、ポケット構造の生成には、進化情報を利用するため pLM (ESM) を活用しています。生成するポケット構造は、リガンドから3.5 Å 以内の領域を考慮に入れていて、アミノ酸長でおよそ8残基程度になります。
筆者らは、PocketGen の性能を、以下2つのベンチマークデータセットで評価しています。
- CrossDocked dataset
- Binding MOAD dataset
デザインの評価指標には、以下を活用しています。
- AutoDock Vina score
- RMSD
- pLDDT
- scTM
- AAR
比較対象の既存モデルは以下のとおりになります。執筆時点で RFDiffusionAA のモデルは公開されていませんでしたので、こちらは比較評価の対象には含まれていません。
- PocketOpt
- DEPACT
- dyMEAN
- FAIR
- RFDIffusion
- PocketGen
結果としては、RMSD 以外のほぼすべての指標で、RFDiffusion を含む既存の手法より優れていることが示されています。Vina score が高いことから、標的リガンドに結合する可能性も相対的に高いモデルであることが期待されます。ウェットでの検証と、RFDiffusionAA との比較が気になるところです。
コードはこちらです。