【バインダーデザイン】低分子リガンド依存的な On-Switch バインダーがデザインできる、MaSIF の新規手法を紹介

論文タイトル

Targeting protein–ligand neosurfaces with a generalizable deep learning tool

出典

Targeting protein–ligand neosurfaces with a generalizable deep learning tool - Nature
A computational deep learning approach is used to design synthetic proteins that target the neosurfaces formed by protein–ligand interactions, with applications...

要旨

低分子リガンドが結合したタンパク質表面をエピトープとするバインダーの設計手法 MaSIF-neosurf を紹介した論文です。

解説など

MaSIF については、過去の記事で何度か取り上げています。

MaSIF には、タンパク質表面の中で相互作用界面となり得る領域を同定する MaSIF-site や、その表面パッチに結合する相互作用モチーフを探索する MaSIF-seed が実装されています。ほかの構造予測や構造生成手法と比べたときの MaSIF の特徴は、タンパク質の表面特性にフォーカスして特徴量化している点です。

筆者らは本論文で、MaSIF の応用範囲を広げるため、低分子リガンドが結合した状態のタンパク質表面を相互作用領域とするバインダーの生成を試みています。このようなバインダーは、リガンド依存的にタンパク質結合を示すので、ON-switch activation を可能にします。

筆者らが新しく開発した MaSIF-neosurf では、タンパク質表面の特徴量化に、以下のとおり幾何学的な特徴と化学的な特徴の2つを活用しています。

  • geometric features
    • shape index
    • distance-dependent curvature
  • chemical features
    • Poisson-Boltzmann electrostatics
    • hydrogen bond donor/acceptor propensity
    • hydrophobicity

低分子リガンドに特化した特徴を積極的に活用しているわけではないため、タンパク質間相互作用を中心としたデータセットでモデルを訓練させることができ、それをリガンド-タンパク質間相互作用に応用しても後述のとおり高い成績を示すことができるとのことです。

MaSIF-neosurf のパフォーマンスを調査するために、リガンド-タンパク質複合体界面に対する既知の結合パートナーを予測できるか検証したところ、MaSIF では 70%の成功確率で予測できることが示されました。RoseTTAFold All-Atom では、20%の成功確率であったとのことです。

この MaSIF-neosurf を新規のバインダーデザインに応用することも試みています。標的とするのは以下の3種類のリガンド-タンパク質複合体の結合界面です。

  • Bcl2 with venetoclax
  • DB3 (anti-progesterone antibody) with progesterone
  • PDF1 with antibiotic actinomin

各標的に対して100 ~ 120 の構造シードを生成し、配列設計を経て 2,000 個程度のデザインを選抜します。これを酵母ディスプレイと FACS ソーティングでスクリーニングする流れです。結果として各標的に対して最低1種類のバインダーを生成することに成功しています。生成された分子の構造は α-helical / β-sheet が主体であるとのことです。本文では site-saturation mutagenesis を通じてさらに親和性を増強しています。

また、上記のバインダーデザインでは配列設計に Rosetta を活用していましたが、配列設計手法を LigandMPNN に変更して、生成した構造を AF2 でフィルタリングすると、さらにバインダーの成功確率を上げることができるそうです。

コードはこちら。

GitHub - LPDI-EPFL/masif-neosurf: MaSIF-neosurf: surface-based protein design for ternary complexes.
MaSIF-neosurf: surface-based protein design for ternary complexes. - LPDI-EPFL/masif-neosurf