【RFjoint】複数のモチーフを一つのタンパク質としてスキャフォールディングする方法を紹介します!

論文タイトル

Accurate single domain scaffolding of three non-overlapping protein epitopes using deep learning

出典

Accurate single domain scaffolding of three non-overlapping protein epitopes using deep learning
De novo protein design has seen major success in scaffolding single functional motifs, however, in nature most proteins present multiple functional sites. Here ...

要旨

RSVタンパク質の複数のエピトープを、一つのタンパク質としてスキャフォールディングした実施例です。

解説など

モチーフスキャフォールディングの実施例の紹介です。モチーフスキャフォールディングとは、機能性のペプチドモチーフを、その構造を保持したまま安定なタンパク質として調製するために、その周辺のスキャフォールド構造をデザインすることを指します。

筆者らは過去に、RFjoint を活用したモチーフスキャフォールディングの手法を公開しています。

Scaffolding protein functional sites using deep learning - PubMed
The binding and catalytic functions of proteins are generally mediated by a small number of functional residues held in place by the overall protein structure. ...

本論文では、この手法をさらに洗練して、複数のモチーフを一つのタンパク質に組み込むスキャフォールドのデザインを試みました。標的とするタンパク質は、RSVタンパク質(RSVF)です。これはウイルスタンパク質であり、このウイルスに対する中和抗体の設計に需要があります。複数のRSVFエピトープを同時に組み込んだ免疫原を人工的に設計することで、効率的な中和抗体の創成が期待できるということです。

デザインの手法は次の通りです。まず筆者らは、既報の RFjoint を改良した RFjoint2 を活用してスキャフォールド構造の主鎖骨格を設計しました。エピトープモチーフとして、RSVF の異なるドメインからおよそ20アミノ酸程度の中和エピトープを選定しています。各モチーフ構造はテンプレートとして活用し、RFjoint2 のネットワークに入力します。そして、エピトープ間の接続長は10-20アミノ酸に制限し、スキャフォールドの主鎖構造を生成します。各RSVFエピトープ間の相対配置は、免疫原として特に重要ではありませんので、特に指定せずに融合タンパク質を設計しました。最終的に計 17,475 個の構造を生成しています。これらの構造は、以下の指標をもとに、プレスクリーニングを行っています。

  • pLDDT > 0.6
  • compactness (RG値とタンパク質の全長距離)

選抜された構造は、ProteinMPNNで配列設計しています。各エピトープをつなぐスキャフォールドと、エピトープの中でも抗体のエピトープになりやすい表面側鎖以外のアミノ酸は、すべて配列再設計の対象となっています。各構造につき、16配列設計されました。そして、設計された配列は、次の指標でスクリーニングされています。

  • Epitope RMSD, AF2 vs Native < 1Å
  • Overall RMSD, AF2 vs design model < 2Å
  • AF2 pLDDT > 80
  • Rosetta ddg for each epitope aligned to its respective antibody < -10
  • Rosetta SAP score < 40

スクリーニング後は、酵母ディスプレイを経て良デザインが選抜されます。設計したタンパク質は各エピトープに対して中和抗体が高い親和性で結合するのとともに、これを免疫原として利用することで優位に抗体価が上がっていることが示されています。WTのRSVタンパク質に比べて純粋な抗体価は低いですが、その結合活性はWTより高いことが特徴です。