論文タイトル
FlowDesign: Improved Design of Antibody CDRs Through Flow Matching and Better Prior Distributions
出典

要旨
Flow Matching を利用した抗体のデザイン手法 FlowDesign を紹介した論文です。
解説など
既存の拡散生成モデルには以下の課題点が存在します。
- デノイジングの初期分布には一般的にガウス分布が利用され、初期情報として抗体のドメイン情報が反映されていない
- 非連続的なアミノ酸タイプの生成が困難である
- 計算コストが高い
これに対して、Flow Matching を活用した生成モデルは、任意の初期分布から標的分布(抗体構造など)へマッピングすることができるなど、上記の課題を克服することが期待できます。
筆者らが構築した FlowDesign では以下のとおりに抗体の構造・配列生成にあたる推論プロセスが進行します。まず、抗体と抗原の複合体構造が入力情報となります。この構造情報は dyMEAN やAlphaFold3 で予測することで配列のみを出発情報とすることも可能です。
CDR を対象に構造と配列を生成する場合は、その初期分布を自由に設定することができます。本文では、
- random distributions
- dyMEAN
- KIC (kinematic-closure-based method)
- ESM2
の4種類を比較しています。検討の結果、dyMEAN が最も AAR や CαRMSD で優れた成績であることが示されました。
標的構造へのデノイジングは Flow Matching によりワンステップで実行されます。難易度の高い問題設定の場合は、デノイジングに係数をかけたり逐次的に繰り返すことも可能です。得られた構造は、Rosetta を利用して側鎖のパッキングをおこない、原子間の衝突を緩和させます。
筆者らはこの Flow Design を以下の既存の構造生成モデルと比較しています。
- HERN
- Refinegnn
- RosettaAb
- Diffab
- dyMEAN
いずれのモデルよりも Flow Design が、AAR や CαRMSD の観点から優れていることが示されました。また実施例においては、配列情報のみから dyMEAN と AlphaFold3 で複合体構造を予測した後、Flow Design を実行する事例も紹介され、dyMEAN では十分な成績が得られなかった(そもそも複合体ポーズが大きく異なっていた)のに対して、AlphaFold3 では比較的正解構造を用いたときと遜色ない結果が得られたことが示しています。
ここまでは in silico ベースの指標のみに基づいて手法を評価していましたが、最後に抗HIV-1抗体 (Ibalizumab) の配列再設計を対象に、デザインのウェットデータを紹介しています。FlowDesign で HCDR3のみを 50,000配列設計し、Rosetta energy で12,000配列まで選抜したのち、酵母ディスプレイでスクリーニングしています。結果として、WT の Ibalizumab よりも活性の高いクローンを取得できたことを示しています。
コードはこちら。