論文タイトル
De novo design of high-affinity protein binders with AlphaProteo
出典
https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/AlphaProteo2024.pdf要旨
新しい深層学習ベースのバインダーデザイン手法、AlphaProteo を紹介した論文です。
解説など
本記事ではデノボバインダーの新手法について紹介します。AlphaProteo と呼ぶこの手法は、Google 傘下で AlphaFold 開発元の Google DeepMind が公開した手法です。
結論から言うと、SOTA手法であった RFDiffusion に比べて高い成功率で高親和性のバインダーをデザインできることが、複数の標的タンパク質に対して実験事実に基づいて示されています。一方で、生成モデルのアーキテクチャなど詳細に関しては、非開示で文献内での言及はありません。
分かっていることとしては、まず入力として標的タンパク質の構造(とオプションとしてエピトープ情報)を受け取り、モデルを介してバインダーの構造と配列が生成されることです。また、AlphaProteo は大きく、バインダーを生成するモデルと生成したデザインを評価する分類器の2つで構成されます。生成モデルは、深層学習モデルとして PDB に登録された構造情報や AlphaFold 予測構造を用いて訓練されています。
彼らが検証用に標的としたタンパク質は以下の8種類です。
- BHRF1: 難度の低い標的
- SARS-CoV-2 spike protein: 難度の高い標的
- IL-7RA: RFDiffusion 実施例あり (high success rate)
- PD-LI: RFDiffusion 実施例あり (low success rate)
- TrkA: RFDiffusion 実施例あり (low success rate)
- IL-17A: 実施例なし
- VEGF-A: 実施例なし
- TNFα: インシリコスクリーニングで難度が高いと判定
各標的タンパク質に対して、50-140 アミノ酸残基のデザインを 47~172 の数で取得し、酵母ディスプレイで結合評価しています。ヒットレートは、確かに RFDiffusion と比べて高く、6/8のターゲットで10%を超えています。当然これに引きずられる形でデザインの親和性も向上しています。
唯一 TNFα に対してのみ、本手法でも(当然その他の手法でも)バインダーが得られませんでした。これは標的エピトープが非常にフラットで極性残基が多いことが理由として考えられます。このような考察をしていることからも、本手法がほかの手法に比べて独自なインターフェースデザインコンセプトを採用しているわけではなく、精度改善を志向した手法であることが伺えます。
また、デザインされた分子のフォールドは all-beta が最も多く、次いで alpha または alpha-beta が優先して生成されたとのことです。
本手法はAPIを含めてまだ公開されておらず、今後どこまでアクセスできるようになるのか非常に注目です。