論文タイトル
Mapping targetable sites on the human surfaceome for the design of novel binders
出典

要旨
ヒトタンパク質の相互作用界面を網羅的に探索してデータベース化した論文です。
解説など
MaSIF を開発した EPEL(スイス連邦工科大学ローザンヌ校)からの最新レポートです。MaSIF には、タンパク質表面の特徴から標的に適したエピトープを選抜するメソッド(MaSIF-site)や、そのエピトープに結合できる構造シードを選抜するメソッド(MaSIF-seed)が実装されています。筆者らはこのツールを用いて、ヒトのタンパク質に存在する標的可能なエピトープを網羅的に探索してデータベースとして公開しました。
対象となるタンパク質は、in silico surfaceome database である SURFY というデータベースに登録された 2,886 種です。各タンパク質に対する AF2 モデルを用意し、それぞれに MaSIF-site で界面のフィンガープリントを同定、残基単位で結合サイトを明示するためにアミノ酸領域を DBSCAN を用いて決定しました。結果として対象タンパク質には、以下の2つのスコアがアノテートされています。
- unbound-state score: 以下の構造的・化学的な指標に基づく相互作用界面指標
- shape index
 - curvature
 - binding interface area
 - sequence composition
 - SASA
 - hydrophobicity scale
 
 
- seed-bound-state score: シード構造との相互作用に基づく指標
- 640,000シード構造 (helical/beta strand fragments) を対象のタンパク質とのドッキングシミュレーションにより、各結合サイトの標的可能性を評価する。総計 30 億個のドッキングモデルを評価している。各サイトにベストなシード構造が complementarity matching scoreとともに示されている。
 
 
このデータから以下のことが示されました。
- GPCR やトランスポーターは最もインターフェース数が少ない
 - Kinase や Receptor は平均 6 つの結合サイトが存在
 - Ig family に属する receptor が最もマッチングシードが多い
 - Leu, Val, Ser が結合界面に最も多い
 
さらに筆者らはこのツールを使って、FGFR2, IFNAR2, HER3 に対するバインダー設計事例を紹介しています。デザインプロセスは次のとおりです。
- MaSIF-site で各標的に対して一つの結合サイトを同定
 - MaSIF-seed-search pipeline で各標的に対して 2,000 個のデザインを生成
 - 酵母ディスプレイでスクリーニング
 
いずれの標的に対しても特異的に結合するバインダーを同定することに成功しています。
さらに面白いのは、ペプチドモダリティのバインダーを本手法で設計していることです。バインダーデザインの過程で設計されたバインダーインターフェースをベースに環化デザインを行うことで環状ペプチドを設計しています。環化は Rosetta の kinematic closures algorithms を活用して設計しています。MaSIF-seed によるシード構造の汎用性が示された結果です。

  
  
  
  
