【抗体抗原結合予測】AlphaSeq データを使用した抗原結合予測の事前学習モデル AlphaBind について

論文タイトル

AlphaBind, a Domain-Specific Model to Predict and Optimize Antibody-Antigen Binding Affinity

出典

AlphaBind, a Domain-Specific Model to Predict and Optimize Antibody-Antigen Binding Affinity

Antibodies are versatile therapeutic molecules that utilize combinatorial sequence diversity to cover a vast fitness landscape. However, designing optimal antib...

要旨

抗体の抗原結合活性を予測するモデル AlphaBind について紹介した論文です。

解説など

本論文で紹介する AlphaBind は、実験データを活用したタンパク質の抗原結合活性予測モデルです。AlphaBind を用いて、対象となる親抗体をもとにさらに抗原結合活性の高いバリアントを設計することができます。本手法の特徴は、標的抗原とは無関係の抗体・抗原相互作用データを活用した事前学習モデルを活用することで、結合活性の予測精度を改善しているところです。具体的な方法論は次のとおりです。

事前学習モデル (AlphaBind) の構築

事前学習モデル用のデータセットには、AlphaSeq で取得した20種、計 7.5M の結合活性データを活用しています。

レコード中の抗体と標的抗原の配列はそれぞれ ESM-2nv でエンベディングされて、トランスフォーマーベースの結合活性予測モデル（AlphaBind Model) が訓練されます。

AlphaBindのfine-tuning

標的となる親抗体の親和性増強に AlphaBind を活用する場合は、この事前学習モデルを対象のデータでファインチューニングします。実施例では親抗体に対してすべての single mutation やランダムに選抜された double, triple mutation を含む 30,000 配列の AlphaSeq データが使用されています。ファインチューニングに活用するデータセットは、必ずしも AlphaSeq データフォーマットである必要はありません。本文では、公知の Trastuzumab の変異体データを用いた実施例も公開されています。