【抗体最適化】ベイズ最適化を活用した多目的最適化手法を解説

論文タイトル

Antibody Design with Constrained Bayesian Optimization

出典

Antibody Design with Constrained Bayesian Optimization
In therapeutic antibody design, achieving a balance between optimizing binding affinity subject to multiple constraints, and sequence diversity within a batch f...

要旨

Constrained Bayesian Optimization を活用して抗体の多目的最適化を実現するための手法を紹介した論文です。

解説など

Bighat Biosciences から抗体最適化手法の紹介です。本論文ではベイズ最適化を活用した多目的最適化に焦点を当てた手法を報告しています。本手法は以下のような技術で構成されています。

  • VAE:抗体配列を潜在空間に写す(Encoder)→ 潜在空間上で操作 → 抗体配列に戻す(Decoder)
  • SCBO:VAEの潜在空間上で、親和性最大化+熱安定性などの制約を守る方向に最適化を実行
  • オラクル(親和性・熱安定性の予測器):VAEからデコードした配列の性質を予測して SCBO に教える

つまり、VAE が連続潜在空間を作り、SCBO がその空間上で制約付き探索を行い、オラクルが各候補配列を評価してフィードバックする、という流れです。このオラクルで親和性だけでなく熱安定性を予測するため多目的最適化が実現されます。

VAE は最適化のために親抗体近傍の配列のみを生成できるように訓練されています。具体的には親配列から CDR 領域だけに1~10個のランダム変異を入れた計180万種の配列を訓練データとして活用しています。

一方でオラクルは、CNN アーキテクチャに基づく10種類の回帰モデルアンサンブルで構成されます。事前学習として、650,000 の ディスプレイスクリーニングの配列データを活用し、最適化の親抗体近傍の 1425 配列のクローナルな評価データでファインチューニングをしています。具体的には BLI と NanoDSF でそれぞれ抗原結合と熱安定性を評価しています。

構築されたモデルから提案された配列は、単純な MLM による greedy サンプリングに比べて、高い結合親和性と Tm をもつことが示されています。

精度を維持するために必要なファインチューニングデータの量や質にどのような制約があるか気になるところです。