論文タイトル
Adapting ProteinMPNN for antibody design without retraining
出典
Just a moment...
要旨
抗体言語モデルである AbLang の出力スコアを加味することで、ProteinMPNN の抗体配列設計性能を改善した報告です。
解説など
ProteinMPNN は与えられた構造に適したアミノ酸配列を設計できる強力なニューラルネットワークですが、
- ループ領域、特に抗体の CDR(Complementarity-Determining Regions)に弱い
- 設計配列が「抗体らしくない」(例:V遺伝子との類似性が低い、CDR構造に適合しない、野生型配列との一致率が低い)
という問題があることが報告されています。
AbLang は抗体配列データのみを学習した言語モデルで、「抗体らしい」配列生成に強みがあります。この研究では、両モデルの logits(出力スコア)を加算して softmax し、1残基ずつサンプリングするというシンプルな方法でアンサンブル設計を実現しています。
検証1
以下の指標で、ProteinMPNN 単独では抗体らしさや構造再現性において劣ることが示されました。
- V遺伝子との配列類似度(median 75% vs 90% for therapeutics)
- CDR 中の抗原結合残基の回収率(非常に低い)
- CDRH3 の refolding RMSD(native構造との差が大きい)
一方、AbLang やそのアンサンブルでは ProteinMPNN 単独に比べて優れた結果を示しています。
- CDR配列の「抗体らしさ」が向上
- CDRH3の構造再現性が改善
- CDR1/2における多様性も維持(Shannon entropy)
検証2
96個ずつ設計・合成した Trastuzumab CDRH3 バリアントを SPR で検証:
ProteinMPNN | 3/96 |
AbLang | 1/96 |
ProteinMPNN + AbLang | 36/96 |
検証1では、AbMPNN との比較結果が示されていますが、検証2ではデータがないのが少し残念です。モデルの再訓練が不要であることが本手法の利点なので、抗体特化の inverse folding モデルがあればそれが第一選択であることに代わりはないと感じます。