【Boltz】Boltz-2の親和性予測器をタンパク質間相互作用に拡張

論文タイトル

On fine-tuning Boltz-2 for protein-protein affinity prediction

出典

https://arxiv.org/pdf/2512.06592v1

要旨

構造ベース最先端モデル Boltz-2 を PPI 親和性回帰に適用した論文です。PLM の表現を融合することで予測精度の改善効果が示されています。

解説など

構造予測モデルである Boltz-2 は protein-ligand 親和性予測器を備えていることで有名です。筆者らは protein-protein affinity を予測可能な形でモデルを再構築しています。

Boltz-2は、構造と表現を出力する Boltz trunk と 親和性予測器である affinity module に分かれますが、Affinity module のみを PPI データで学習させています。

使用するデータセットは次のとおりです。

(1) TCR3d

  • 約 251 複合体
  • 実験測定された Kd → pKd
  • 強いリーク防止分割
    • 配列類似度(Levenshtein 距離)ベースで connected components を作り、train/test を分離

(2) PPB-affinity (filtered)

  • 8,207 PPI
  • 広範なタンパク質相互作用
  • ≤30% sequence identity で分割(既存研究準拠)

結果としては芳しくなく、ベンチマークとした ESM2 と ProtT5 に由来する親和性予測モデルと比較すると予測成績が低いことがわかりました。一方で、Boltz-2 と ESM2 のエンベディングを組み合わせたときに若干元の ESM2 より改善する結果が得られています(一方で ProtT5 では改善効果が弱い)。

Boltz-2 の表現はドッキングの品質に最適化されており、疎水性や電荷の微差などエネルギー勾配はあまり考慮されていない可能性が高いと考察されています。