【抗体デザイン】AbLang を活用して ProteinMPNN の配列設計性能を改善

Adapting ProteinMPNN for antibody design without retraining

抗体言語モデルである AbLang の出力スコアを加味することで、ProteinMPNN の抗体配列設計性能を改善した報告です。

ProteinMPNN は与えられた構造に適したアミノ酸配列を設計できる強力なニューラルネットワークですが、

という問題があることが報告されています。

AbLang は抗体配列データのみを学習した言語モデルで、「抗体らしい」配列生成に強みがあります。この研究では、両モデルの logits（出力スコア）を加算して softmax し、1残基ずつサンプリングするというシンプルな方法でアンサンブル設計を実現しています。

以下の指標で、ProteinMPNN 単独では抗体らしさや構造再現性において劣ることが示されました。

一方、AbLang やそのアンサンブルでは ProteinMPNN 単独に比べて優れた結果を示しています。

96個ずつ設計・合成した Trastuzumab CDRH3 バリアントを SPR で検証：

検証１では、AbMPNN との比較結果が示されていますが、検証２ではデータがないのが少し残念です。モデルの再訓練が不要であることが本手法の利点なので、抗体特化の inverse folding モデルがあればそれが第一選択であることに代わりはないと感じます。