論文タイトル
A Simple yet Effective DDG Predictor is An Unsupervised Antibody Optimizer and Explainer
出典
要旨
抗体の変異体の ΔΔG をインシリコで予測する Light-DDG を紹介した論文です。
解説など
中国の西湖大学からのレポートです。抗体変異体の標的抗原結合能を表すΔΔGを予測する手法を開発しました。
既存の予測法としては、従来の物理化学ベース、統計ベースの他、近年の深層学習を活用した手法が挙げられます。近年報告がある手法は、AlphaFold2 の IPA-style backbone を使用していることが多く、モデルの軽量化が困難であることが課題です。筆者らは予測性能を担保しつつ推論コストの低いモデルである Light-DDG を構築することを試みました。
具体的には、モデルのアーキテクチャとして、軽い Transformer ベースの構造表現を使用しています。また Prompt-DDG という別の高精度の大規模モデルを知識蒸留することで軽量なモデルを作成しました。
一方でモデルの性能を維持するために、学習データとなる既存の SKEMPI v2.0 データセットを独自に拡張しています。データセットにある配列レコードにランダム変異を加えて、Prompt-DDG で疑似ラベルを付与したデータを活用しています。
これにより構築された Light-DDGでは、下記の既存のモデルに比べて高い実験データとの相関が得られています。
- MIF-Network
- RDE-Network
- DiffAffinity
- ProMIM
- Prompt-DDG
さらに、これらのモデルに比べて約90倍ほど計算速度が速いことを明らかにしました。
また筆者らは、Light-DDGモデルをコアに抗体最適化を目的とした配列サンプリング法を実装した、Unified framework for Antibody optimization (Uni-Anti) も構築しています。これにより有望変異部位を推定し効率的に親和性増強改変を探索することができます。
この論文では Uni-Anti を SARS-CoV-2抗体に適用しました。重鎖のCDR 26 か所、計 494 変異を作成し、Light-DDG で DDG を予測し親和性増強改変をランク付けしました。これにより既知の5つの親和性増強改変のうち4つがランキング5%以内に存在することを示しています。
また、ランダム変異や以下の既存の配列設計手法と比べて効率的に親和性増強が探索できることも明らかにしています。
- RefineGNN
- MEAN
- DiffAb
- dyMEAN
コードはこちら。