【SURFACE-Bind】バインダーデザインに重要な標的エピトープをヒトタンパク質に対して網羅的に探索

論文タイトル

Mapping targetable sites on the human surfaceome for the design of novel binders

出典

Mapping targetable sites on the human surfaceome for the design of novel binders
The human cell surfaceome, integral to cell communication and disease mechanisms, presents a prime target for therapeutic intervention. De novo protein binder d...

要旨

ヒトタンパク質の相互作用界面を網羅的に探索してデータベース化した論文です。

解説など

MaSIF を開発した EPEL(スイス連邦工科大学ローザンヌ校)からの最新レポートです。MaSIF には、タンパク質表面の特徴から標的に適したエピトープを選抜するメソッド(MaSIF-site)や、そのエピトープに結合できる構造シードを選抜するメソッド(MaSIF-seed)が実装されています。筆者らはこのツールを用いて、ヒトのタンパク質に存在する標的可能なエピトープを網羅的に探索してデータベースとして公開しました。

対象となるタンパク質は、in silico surfaceome database である SURFY というデータベースに登録された 2,886 種です。各タンパク質に対する AF2 モデルを用意し、それぞれに MaSIF-site で界面のフィンガープリントを同定、残基単位で結合サイトを明示するためにアミノ酸領域を DBSCAN を用いて決定しました。結果として対象タンパク質には、以下の2つのスコアがアノテートされています。

  • unbound-state score: 以下の構造的・化学的な指標に基づく相互作用界面指標
    • shape index
    • curvature
    • binding interface area
    • sequence composition
    • SASA
    • hydrophobicity scale
  • seed-bound-state score: シード構造との相互作用に基づく指標
    • 640,000シード構造 (helical/beta strand fragments) を対象のタンパク質とのドッキングシミュレーションにより、各結合サイトの標的可能性を評価する。総計 30 億個のドッキングモデルを評価している。各サイトにベストなシード構造が complementarity matching scoreとともに示されている。

このデータから以下のことが示されました。

  • GPCR やトランスポーターは最もインターフェース数が少ない
  • Kinase や Receptor は平均 6 つの結合サイトが存在
  • Ig family に属する receptor が最もマッチングシードが多い
  • Leu, Val, Ser が結合界面に最も多い

さらに筆者らはこのツールを使って、FGFR2, IFNAR2, HER3 に対するバインダー設計事例を紹介しています。デザインプロセスは次のとおりです。

  • MaSIF-site で各標的に対して一つの結合サイトを同定
  • MaSIF-seed-search pipeline で各標的に対して 2,000 個のデザインを生成
  • 酵母ディスプレイでスクリーニング

いずれの標的に対しても特異的に結合するバインダーを同定することに成功しています。

さらに面白いのは、ペプチドモダリティのバインダーを本手法で設計していることです。バインダーデザインの過程で設計されたバインダーインターフェースをベースに環化デザインを行うことで環状ペプチドを設計しています。環化は Rosetta の kinematic closures algorithms を活用して設計しています。MaSIF-seed によるシード構造の汎用性が示された結果です。