論文タイトル
Bayesian Optimization of Antibodies Informed by a Generative Model of Evolving Sequences
出典
要旨
“clonal family” の情報を活用したベイズ最適化による抗体最適化手法 CloneBO を紹介した論文です。
解説など
BigHat Biosciences からの抗体最適化手法のレポートです。これまでに免疫レパトアを学習した抗体言語モデルは、Sapiens、IgLM、AbLang など多数公開されています。これらは個別の抗体配列を学習対象としていました。一方で筆者らがこの論文で構築した言語モデル CloneLM は、クローンファミリー (clonal family) を1サンプルとして学習したモデルです。これにより免疫による配列進化情報を深くモデルに取り込めることが期待されます。
筆者らは、さらにこの CloneLM をベイズ最適化の事前分布に活用して、新たな最適化抗体配列の提案手法 (CloneBO) を開発しました。CloneLM 単独では対象とする標的抗原周辺の情報が不十分なため、実験で得られた配列情報を十分に活用するため、CloneLM の出力にバイアスをかけて配列を生成する手法 (Twisted Sequencial Monte Carlo, tSMC) を提案しています。CloneBO では、CloneLM + tSMC により得られる「適応度関数の事後分布」から Thompson Sampling により最良候補を選びます。
CloneBOは以下の手法と比較することで、その性能が評価されています。
- ルールベース
- Greedy: top4の高スコア配列からランダムに1変異置換する
- Sapiens: 高スコア配列にSapiens のスコアを最大化する変異を選ぶ
- ベイズ最適化
- LaMBO:汎用的なベイズ最適化。Denoising AutoEncoder による潜在空間に変換
- LaMBO-Ab:抗体特化
- EvoBO:進化戦略+ガウス過程による不確実性制御
- 進化戦略
- Genetic
- AdaLead:各ステップで適応的に変異を選び、探索領域を拡大
- CMS-ES:分布を反復的に更新して極致を探索
- 強化学習
- Dyna-PPO:ポリシー勾配法による系列生成強化学習
- 生成モデル誘導
- CbAS:生成モデルを好スコアサンプルで再訓練
logKD や Tm を予測する関数を用いて生成配列の質を評価したところ、いずれの手法よりも -LogKD や Tm の高い配列が CloneBO で生成されていることを確認しています。また次点で優れていた LaMBO-Ab モデルと実験データまで取得し評価することで、CloneBO の優位性を確かなものとしています。
コードはこちら。