【抗体抗原結合予測】AlphaSeq データを使用した抗原結合予測の事前学習モデル AlphaBind について

論文タイトル

AlphaBind, a Domain-Specific Model to Predict and Optimize Antibody-Antigen Binding Affinity

出典

AlphaBind, a Domain-Specific Model to Predict and Optimize Antibody-Antigen Binding Affinity
Antibodies are versatile therapeutic molecules that utilize combinatorial sequence diversity to cover a vast fitness landscape. However, designing optimal antib...

要旨

抗体の抗原結合活性を予測するモデル AlphaBind について紹介した論文です。

解説など

本論文で紹介する AlphaBind は、実験データを活用したタンパク質の抗原結合活性予測モデルです。AlphaBind を用いて、対象となる親抗体をもとにさらに抗原結合活性の高いバリアントを設計することができます。本手法の特徴は、標的抗原とは無関係の抗体・抗原相互作用データを活用した事前学習モデルを活用することで、結合活性の予測精度を改善しているところです。具体的な方法論は次のとおりです。

事前学習モデル (AlphaBind) の構築

事前学習モデル用のデータセットには、AlphaSeq で取得した20種、計 7.5M の結合活性データを活用しています。

レコード中の抗体と標的抗原の配列はそれぞれ ESM-2nv でエンベディングされて、トランスフォーマーベースの結合活性予測モデル(AlphaBind Model) が訓練されます。

AlphaBindのfine-tuning

標的となる親抗体の親和性増強に AlphaBind を活用する場合は、この事前学習モデルを対象のデータでファインチューニングします。実施例では親抗体に対してすべての single mutation や ランダムに選抜された double, triple mutation を含む 30,000 配列の AlphaSeq データが使用されています。ファインチューニングに活用するデータセットは、必ずしも AlphaSeq データフォーマットである必要はありません。本文では、公知の Trastuzumab の変異体データを用いた実施例も公開されています。

最適化配列の生成

構築されたファインチューニングモデルを使用して、親抗体からその変異体を生成します。

TAPによる生成配列のフィルタリング

生成された配列は、TAP を使って developability が計算機上で評価され、最終的にウェットで試験する配列が選抜されます。

実施例では、以下3種類の親抗体と変異体のデータセットをもとに親和性増強改変の探索をおこない、いずれにおいても親抗体に比べて結合活性の高い変異体を選抜することに成功しています。

  • AAB-PP489: anti-human TIGIT scFv
  • Pembrolizumab: humanized anti-human PD-1 antibody
  • VHH72: anti-SRS-Cov1/2 RBD camelid single-chain antibody

モデルからの提案配列は、特定のポジションに偏ることなくフレームワークを含めて多岐にわたっていることが特徴です。多様な配列が生成できることは、配列から予測できる物性や免疫原性の回避が容易となるため、とても便利です。

コードやモデルのウェイトはこちらに公開されているので、誰でも使用できます。

GitHub - A-Alpha-Bio/alphabind: AlphaBind code + model accompanying pre-print
AlphaBind code + model accompanying pre-print. Contribute to A-Alpha-Bio/alphabind development by creating an account on GitHub.