【抗体デザイン】抗体の粘性を構造予測なしで予測する TherAbDesign を紹介

論文タイトル

A Guided Design Framework for the Optimization of Therapeutic-like Antibodies

出典

A Guided Design Framework for the Optimization of Therapeutic-like...
Antibodies must meet stringent developability criteria for successful commercialization—a challenge for machine learning approaches given the limited available ...

要旨

抗体の粘性を構造情報なしで予測する手法 TherAbDesign について紹介した論文です。

解説など

Genentech の Prescient Design からの論文です。本研究では抗体の物理化学的な情報からその粘性を予測する手法を提案しています。抗体の物性予測手法はこれまで数多くの報告がありますが、既存の手法には以下の課題があるといいます。

  1. 構造ベース手法は精度は高いが、計算コストが高くスループットが低い
  2. 単純なフィルタリングは有望候補も除外してしまう危険がある
  3. 機械学習で予測するにはデータが不十分

本手法で提案された TherAbDesign は次のような方法で、各課題を解決しています。

① TherAbDesignは抗体のFv配列から、構造を介さずに電荷・疎水性指標(APBS/SAP)を直接予測する

② 単なるしきい値ベースのフィルターではなく、パレート最適化に基づくガイド設計を導入

③ 予測対象を、粘度や凝集といった高レベルな性質ではなく、中間的・物理的に解釈可能な物性指標(APBS, SAP)にすることで汎化性を向上

TheraAbDesign は、物理化学的な特性を予測する回帰モデルと、物性を改善する生成モデルから構成されます。回帰モデルでは、MolDesk で計算できる抗体の電荷や疎水性といった下記の物理学的な特性を、物性リスクを判断する指標として採用しています。

  • SAP BM:SAP(Black-Mouldスケールによる疎水性)
  • SAP WW:SAP(Wimley-Whiteスケール)
  • APBS pos/neg        電荷分布(APBSで計算)
  • CAP        VH/VL電荷非対称性

訓練データは OAS 由来の配列を ESMFold で構造予測し、MolDesk で SAP, APBS, CAP を計算したデータです。生成モデルは、LaMBO-2を改良した拡散モデルを使用しています。

本文では、物性指標を MolDesk から計算される指標のほかに TAP を活用したり、構造モデルに MD シミュレーションで緩和させた平均構造試しましたが、これらは性能の向上に貢献しませんでした。

本手法による生成は、CDRH3領域の芳香族残基(F, W, Y)を SやTなどに置換して粘度改善したり、CDRH2/CDRL2の”DD”モチーフが強い陰電荷を RやKなどの陽性残基に置換する傾向があるとのことです。