論文タイトル
Mapping targetable sites on the human surfaceome for the design of novel binders
出典

要旨
ヒトタンパク質の相互作用界面を網羅的に探索してデータベース化した論文です。
解説など
MaSIF を開発した EPEL(スイス連邦工科大学ローザンヌ校)からの最新レポートです。MaSIF には、タンパク質表面の特徴から標的に適したエピトープを選抜するメソッド(MaSIF-site)や、そのエピトープに結合できる構造シードを選抜するメソッド(MaSIF-seed)が実装されています。筆者らはこのツールを用いて、ヒトのタンパク質に存在する標的可能なエピトープを網羅的に探索してデータベースとして公開しました。
対象となるタンパク質は、in silico surfaceome database である SURFY というデータベースに登録された 2,886 種です。各タンパク質に対する AF2 モデルを用意し、それぞれに MaSIF-site で界面のフィンガープリントを同定、残基単位で結合サイトを明示するためにアミノ酸領域を DBSCAN を用いて決定しました。結果として対象タンパク質には、以下の2つのスコアがアノテートされています。
- unbound-state score: 以下の構造的・化学的な指標に基づく相互作用界面指標
- shape index
- curvature
- binding interface area
- sequence composition
- SASA
- hydrophobicity scale
- seed-bound-state score: シード構造との相互作用に基づく指標
- 640,000シード構造 (helical/beta strand fragments) を対象のタンパク質とのドッキングシミュレーションにより、各結合サイトの標的可能性を評価する。総計 30 億個のドッキングモデルを評価している。各サイトにベストなシード構造が complementarity matching scoreとともに示されている。
このデータから以下のことが示されました。
- GPCR やトランスポーターは最もインターフェース数が少ない
- Kinase や Receptor は平均 6 つの結合サイトが存在
- Ig family に属する receptor が最もマッチングシードが多い
- Leu, Val, Ser が結合界面に最も多い
さらに筆者らはこのツールを使って、FGFR2, IFNAR2, HER3 に対するバインダー設計事例を紹介しています。デザインプロセスは次のとおりです。
- MaSIF-site で各標的に対して一つの結合サイトを同定
- MaSIF-seed-search pipeline で各標的に対して 2,000 個のデザインを生成
- 酵母ディスプレイでスクリーニング
いずれの標的に対しても特異的に結合するバインダーを同定することに成功しています。
さらに面白いのは、ペプチドモダリティのバインダーを本手法で設計していることです。バインダーデザインの過程で設計されたバインダーインターフェースをベースに環化デザインを行うことで環状ペプチドを設計しています。環化は Rosetta の kinematic closures algorithms を活用して設計しています。MaSIF-seed によるシード構造の汎用性が示された結果です。