ナノボディ構造予測における「HCDR3ブループリント」と「非カノニカルジスルフィド結合」の重要性

論文タイトル

Disulphide and sequence-encoded conformational priors guide nanobody structure prediction

出典

Disulphide and sequence-encoded conformational priors guide nanobody structure prediction
Nanobody binding is largely governed by the HCDR3 loop, which adopts distinct placement regimes relative to the framework: compact, framework-contacting (kinked...

要旨

ナノボディの HCDR3 ループがとる「kinked/extended」という配置様式(ブループリント)と、非カノニカルジスルフィド結合に着目し、これらを明示的に扱う軽量構造予測モデル NbForge を公開しています。

解説など

本研究は、ナノボディ(VHH)の構造予測において、特に重要な以下の2点を明示的に扱うことを目的としています。

  • HCDR3ループの「kinked(フレームワークに折り返して接触する型)」と「extended(溶媒側に伸びる型)」という離散的な配置様式(blueprint)
  • 追加のシステイン残基による非カノニカルジスルフィド結合(NCDB)

従来の構造予測モデルは、主に RMSD(原子座標のずれ)といった連続値の誤差で評価されてきました。しかし本文では、RMSD が良好でも、HCDR3の配置様式を取り違えたり、正しいジスルフィド結合を再現できないケースがあると指摘されています 。

そこで著者らは、

  • 配列から HCDR3 の blueprint を予測する分類器「NbFrame」
  • ジスルフィド結合の幾何拘束を明示的に学習させた構造予測モデル「NbForge」

を開発しました。

(1) NbFrame:配列から blueprint を予測

まず、PDB 構造をもとに HCDR3 の構造的特徴(角度、FR2 との接触密度、相対溶媒アクセス性など)を用いて、kinked/extended を分類しています。

そのうえで、フレームワーク領域(CDRではない部分)のアミノ酸組成に着目し、特定ポジションでの残基出現頻度を特徴量としてロジスティック回帰モデルを学習しています。

(2) NbForge:ジスルフィド拘束を組み込んだ軽量モデル

NbForge は、AlphaFold2 の「structure module」をベースにした軽量モデルです。

特徴は以下の3点です。

  1. VH/VHH 両方のデータを活用した学習
  2. ジスルフィド結合に対する明示的な損失関数
    • SG–SG距離、Cβ–Cβ距離、角度や二面角の拘束
  3. 自己蒸留(self-distillation)
    • 約2,200万配列のVHHライブラリから
    • MMseqs でクラスタリング
    • NbFrame で blueprint が高信頼な配列のみ抽出
    • 約58,575構造を合成データとして再学習

NbForge は、H3 構造予測や blueprint の正答率などにおいて、Boltz1 を超え、また推論時間が大きく早いことが性能面での特徴です。