【抗体最適化】抗体設計モデルの性能を比較評価するためのベンチマークフレームワークを紹介

Benchmark for Antibody Binding Affinity Maturation and Design

抗体の結合親和性の成熟および設計を目的とした機械学習モデルの性能を評価するためのベンチマークフレームワーク「AbBiBench」を提案しています。

従来の抗体デザイン手法では、

などがモデルの性能指標として用いられてきました。しかし、抗体はV(D)J再構成や体細胞超変異により自然な進化圧から外れた極めて多様な配列を持つため、自然抗体にどれだけ似ているかで評価することは不適切です。

この問題を解決するための評価フレームワーク AbBiBench は、次の特徴を持ちます。

抗体単体ではなく抗原との複合体（Ab–Ag complex）で評価
- 構造的整合性や結合親和性を反映する
9種類の抗原に対する11種類の実験データセット
- インフルエンザ、SARS-CoV-2、HER2、VEGFなど
- 合計15万以上の変異抗体を含む
- 重鎖の可変領域のみが対象
- データセットは親抗体とそのバリアントを２０種以上含むデータに制限
- 実験データは、ディスプレイパニングの enrichment か Kd
14種類の機械学習モデルを比較評価
- マスク付きLM（例: ESM-2, AntiBERTy）
- オートレグレッシブLM（例: ProGen2）
- インバースフォールディングモデル（例: ProteinMPNN, ESM-IF）
- グラフ・拡散生成モデル（例: MEAN, DiffAb）
評価タスクは2種類
- (1) ゼロショット親和性予測：モデルの対数尤度と実験的親和性のスピアマン相関
- (2) 新規抗体の設計：F045-092抗体を対象にCDR-H3を再設計

1. 親和性予測タスク（Fig. 4, 5）

2. CDR-H3再設計タスク（H1N1結合向上）

ESM-IFとSaProtが最も有望な変異体を生成。
- 高い結合エネルギー（低ΔΔG）と高い配列尤度（AntiBERTy, ProteinMPNN）を両立。
- AlphaFold3による構造予測でも高いpLDDTスコアを示し、安定な複合体形成が予測される。
DiffAbやMEANは一部で改善を示すも、一貫性や配列妥当性に課題。

設計タスクにおいて、設計配列の実験データは取得されていません。