Direct Preference Optimization (DPO)を活用した、最新抗体デザイン手法 ABDPOを紹介！

論文タイトル

Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization

出典

Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization

Antibody design, a crucial task with significant implications across various disciplines such as therapeutics and biology, presents considerable challenges due ...

要旨

DPO を利用した抗体のデザイン手法 ABDPO を紹介した論文です。

解説など

抗原結合抗体デザインの最新手法です。本論文では、”direct preference optimization” (DPO) という手法を採用しています。DPOは、以前の記事でも紹介しました。

筆者らは、この抗体特化モデルを ABDPO と命名しています。このモデルでは DPO の活用のほか、その学習データにエネルギー値を採用し、物理化学的な指標を特徴量の一つとして活用しているのが特徴です。

モデルの事前学習には SAbDab のデータセットを活用し、ナンバリングは IMGT を利用しています。またファインチューニングとして、RAbD ベンチマークデータ由来の抗原・抗体複合体構造を活用しています。この構造を PyRosetta で側鎖をリパッキングし、エネルギースコアを算出しています。用いるエネルギー指標は、以下の3種類です。

CDR E(total)
CDR-Ag E(nonRep)
CDR-Ag E(Rep)

E(total) は、抗原無関係のエネルギースコアで、抗体構造そのものの安定性を示します。CDR-Ag は、抗体・抗原複合体の相互作用エネルギーを示し、反発エネルギーとそれ以外を分けて算出しています。これら２つは、抗原抗体相互作用の妥当性を示す指標として使用します。

筆者らは、RAbD データセットに含まれる 55 種類の標的抗原に対して、ABDPO で抗体の CDR をデザインし、E(total) や CDR-Ag ΔG において優れたデザインを 1 種類選抜し、各デザインの平均値から、そのモデルの性能を評価しています。モデルの比較対象として、以下に挙げられる既知のモデルのデザイン結果も活用しています。

HERN
MEAN
dyMEAN
DIffAb

結果として、ABDPO は、いずれのモデルよりも優れた成績を収めていることが確認できます。HERN, MEAN, dyMEAN においては、E(total)自体の値がそもそも高いことから、抗体単体の構造において、すでにクラッシュなどが存在していることが示唆されます。DiffAb は、これらよりも優れた成績を示しており、ここまで差が開かれていることは驚きです。

筆者らはこの理由を、DiffAbではアミノ酸の回転を明示的にモデル化しているため、クラッシュが起こりにくいことと、生成モデルなのでデザインの多様性に優れており、Top1デザインを選抜した成績では有利に評価されている可能性があると述べています。

ABDPO のコードは公開されておらず、ウェットでの評価も論文中に示されていません。続報があることを期待しましょう。