論文タイトル
Inverse folding for antibody sequence design using deep learning
出典
Inverse folding for antibody sequence design using deep learning
We consider the problem of antibody sequence design given 3D structural information. Building on previous work, we propose a fine-tuned inverse folding model th...
要旨
抗体に特化した逆折り畳み問題を解くモデル、AbMPNN を紹介した論文です。
解説など
このブログでは過去に、抗体に特化した配列デザインモデルを以下のとおり紹介してきました。
これらに対して、本文で公開されたモデル AbMPNN の特徴は、ProteinMPNN のシンプルなファインチューニングモデルであるという点です。
チューニング用のデータセットには、OAS と SAbDab のデータが用いられています。ペアリング情報は主に OAS から、構造情報は SAbDab から学習できることを期待しています。OAS→SAbDab の順にチューニングされています。訓練データのフィルタリングや学習時のパラメータは、詳しく本文に記載されています。
AbMPNN の性能を評価するために、AbMPNN で設計した配列を AbodyBuilder2 で構造予測したモデルと、実験構造との RMSD を算出しています。結果として ProteinMPNN や OAS もしくは SAbDab 単独で訓練したモデルと比べて AbMPNN は正確なモデルを予測できることが示されています。
その他の公開データとしては、 recovery rate や、生成される配列のジャームライン頻度などがありました。
コードはまだ公開されていません。抗体に特化した配列設計モデルも多様化されつつある時代であることを感じます。