Fold2Seqを抗体デザインに適用

論文タイトル

Benchmarking deep generative models for diverse antibody sequence design

出典

Benchmarking deep generative models for diverse antibody sequence design
Computational protein design, i.e. inferring novel and diverse protein sequences consistent with a given structure, remains a major unsolved challenge. Recently...

確認したいこと

先日の記事では、タンパク質フォールドから、配列をデザインするFold2Seqという手法について紹介しました。この手法を抗体デザインに適用した事例がありましたので、情報を整理してみたいと思います。

要旨

Fold2Seqを抗体デザインに適用した事例です。

解説など

Fold2Seqの詳細な説明は、先日の記事をご参照ください。

本研究では、Fold2Seqを以下の2つの手法と比較して、その有用性を検証しています。本検証ではラマ抗体のCDRがデザインの対象となっています。

  • ARモデル(Sequence based)
  • GVPモデル(Structure based)

Sequence recovery rate、NLL、Uniqueness、Novelty、TM-score、Sequence identityなど様々な指標で評価されていて、結果はやや複雑です。どの評価指標を用いても傾向は同じ、というわけではなく、それぞれの手法に応じて、評価指標ごとの特徴が表れています。

ARモデルは、比較的Sequence recovery rateやNLLが高いもののNovelotyが低く、また短いH3の生成に長けています。一方でGVPは、天然配列との構造的な類似性が高く、長いH3の生成が得意です。これらに対してFold2Seqは、生成された配列の多様性や新規性が高いという結果でした。

これらの特徴から、

  • 入力構造と近い配列を生成したい → GVP
  • 入力構造に、短いH3をグラフティングしたい → AR
  • 多様性のある配列を生成したい → Fold2Seq

という、モデルの使い分けが提唱されています。

コメント