GeoFlow-V3とは?最大50配列・3週間で抗体候補を見つける、迅速de novo抗体設計パイプラインの全体像

論文タイトル

Rapid De Novo Antibody Design with GeoFlow-V3

出典

Attention Required! | Cloudflare

要旨

抗体-抗原複合体の構造予測とde novo抗体設計を統合した原子レベル拡散モデル「GeoFlow-V3」を報告しています。

解説など

中国の BioGeometry チームからの最新抗体生成モデル GeoFlow-V3 の紹介です。

GeoFlowの特徴は、単なる配列生成モデルではなく、

  • 抗体-抗原複合体の構造予測
  • 標的エピトープ(狙いたい結合部位)を条件にした抗体生成
  • モデル自身の信頼度スコアによるbinder / non-binder識別
  • in silico evolution(計算機内進化)による候補改善

を一つの枠組みに統合しています。

名前のとおり前モデルからの改良版を本論文で報告しています。V3では以下の拡張が施されています。

  • Partial diffusionを使った「in silico evolution」の導入
    • V2:一度の大量生成してランキングするOne-Shot型
    • V3:Generate→Evaluate→Partial redesign→Re-evaluateによる再設計を内包
  • Constraint-conditioningの拡張
    • V2:Pseudo-sequence + epitope
    • V3:以下の条件付けが可能に
      • Epitope constraints
      • Contact constraints
      • Target structure constraints
      • Initial guess constraints

本文では以下の実施例が報告されています。

構造予測性能

本文では、低相同性104件の抗体-抗原複合体ベンチマークで、GeoFlow-V2比でHigh DockQ成功率がTop-1で45%相対改善と記載されています。

また、confidence score > 0.8 の高信頼予測は、Acceptable以上のDockQ構造を80%以上のprecisionで識別できたとされています。これは「生成した大量候補から、どれを実験に回すか」の優先順位付けに重要です。

Binder識別

10種類のbinder/non-binderデータセットで、GeoFlow-V3のipTMが比較的一貫したAUROC性能を示したと本文にあります。一方で、点変異レベルのbinding affinity順位予測は依然難しく、「強く結合する順番まで正確に当てる」のは未解決とされています。

De novo VHH設計

もっとも注目されるのはここです。

  • 8/8キャンペーンで少なくとも1 binder確認
  • 平均hit rate 15.5%(PD-1除外)
  • 各ターゲット最大50候補のみ検証
  • 一部でナノモル親和性VHHを確認

モデルサーバーはこちら。

GeoFlow Server
Web service for BioGeometry's cutting-edge protein foundation model GeoFlow, unifying structure prediction and generation for the molecules of life.