【ドッキング】実験情報を活用したタンパク質ドッキングシミュレーション手法(原著編)

論文タイトル

Modeling Antibody-Antigen Complexes by Information-Driven Docking

出典

Structure. 2020 Jan 7;28(1):119-129.e2.

Modeling Antibody-Antigen Complexes by Information-Driven Docking - PubMed
Antibodies are Y-shaped proteins essential for immune response. Their capability to recognize antigens with high specificity makes them excellent therapeutic ta...

確認したいこと

  • information driven dockingの実施例

要旨

事前に取得したエピトープ情報をもとに、抗体・抗原複合体構造のドッキングモデルを作成する手法について紹介した論文です。

解説など

今回紹介する論文は、先日記事にしたレビュー論文の引用文献です。

実データを交えて、ドッキング手法の成績がまとめられています。

本研究では、以下の4つの手法について性能を評価していました。

  • ZDOCK: 高速フーリエ変換探索アルゴリズムベースの、剛体ドッキング手法
  • ClusPro : 高速フーリエ変換探索アルゴリズムベースの、剛体ドッキング手法
  • LightDock : “normal mode”を利用して、タンパクの柔軟性を考慮したドッキング手法
  • HADDOCK : refinementステップにおいて、柔軟性を考慮したドッキング手法

各ドッキングアルゴリズムに対して適応するデータセットを、以下の3つの条件で解析しています。

  • HV-Surf: エピトープ情報を一切含まない
  • HV-Epi9: 抗体から9Åの距離に存在する抗原残基をエピトープと定義
  • Real interface : 結合界面の情報を厳密に定義

解析結果をレビューすると、HADDOCKが、他3つに比べて圧倒的に成績が高いことがわかります。HV-Surfにおける上位1モデルにおける正解率はおよそ25%、Real interfaceでは100%です。

これはHADDOCKが、サンプリングやリファインメントステップで、直接的にエピトープによる拘束条件を活用している一方で、その他の手法は、モデルのフィルタリングやスコアリングステップにおいてのみでしか、高速条件を利用していないためであると考えられます。

対象とした複合体構造をi-RMSD(結合界面におけるRMSD)をもとに、剛体(rigid)と中程度(medium)に2つに分類すると、やはりrigidである方が、正解率やモデルの質が高いモデルを提案できたことも示されています。

出力されたモデル群はクラスタリングを経由することで、スコアリングの精度が大幅に向上することが知られています。このクラスタリングは、主に構造の差異を元にした分類で、positional RMSDが利用されており、FCC(fraction of common contacts)クラスタリングと呼ばれています。

HADDOCKはFCCクラスタリングがデフォルトで使用されているため、適応した際の成績についても言及されていました。詳細な傾向は原著論文を参照いただきたいのですが、クラスタリングによって大きな改善効果は感じられませんでした。

HDX-MSや変異体解析データを、なるべく一次情報に近い形で解釈してくれるアルゴリズムがあると良いと思ったのですが、現状では生データからエピトープを定義する事前ステップが必要のように感じました。

コメント