【バインダーデザイン】MDシミュレーションで生成した訓練データを活用してMonobodyをデザイン

論文タイトル

Deep Generative Design of Epitope-Specific Binding Proteins by Latent Conformation Optimization

出典

Deep Generative Design of Epitope-Specific Binding Proteins by Latent Conformation Optimization
Designing de novo binding proteins against arbitrary epitopes using a single scaffold, as seen with natural antibodies, remains an unsolved challenge in protein...

確認したいこと

深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。

要旨

深層生成モデルを利用して、Monobody型のバインダーをデザインする手法”Sculptor”を紹介した論文です。

解説など

筆者らは、この手法を公開する前にバインダーデザインの要素技術である以下の2つの技術を報告しています。

タンパク質(抗体)構造生成:https://www.biorxiv.org/content/10.1101/2020.08.07.242347v2

配列設計:https://pubmed.ncbi.nlm.nih.gov/35136054/

前者のIg-VAEについては過去の記事でも紹介しました。

これらの技術に、抗原相互作用領域の選定や、構造最適化ループの手順を組み合わせることで、バインダーのデザインへ応用しています。筆者らはこの一連をアルゴリズムを”Sculptor”と呼んでいます。

標的抗原におけるエピトープの同定には、Arpeggioという相互作用解析ツールをPDBデータに適用した情報を活用しています。

構造生成初期には、以下の3つに関わるパラメータが初期化されます。

  • VAEによる構造生成のための潜在ベクトル
  • バインダーの3次元座標を記述する”Homolenous transformation”
  • 相互作用領域のアサインメント

これらのパラメータは、Sculptorの最適化アルゴリズムによって最適化されます。この最適化には、以下の3つの技術が使用されています。

  • gradient descent
  • Metropolis-Hastings
  • linear sum assignment

本手法の特徴を2つ挙げると、まずその1つに生成モデルの訓練データの生成が挙げられます。筆者らは34種のPDB登録データだけではなく、それらの構造からMDシミュレーションを行い、新たにデザインした160万もの構造データを活用しています。これにより密な構造空間から訓練されたモデルは、より精緻な構造を生成できると考えられます。

特徴の2つ目として、筆者らはMonobodyをデザインしています。Monobodyとはfibronectin3ベースの人工スキャフォールドです。結合界面はループ様の構造となっています。既存の手法だとヘリックスバンドル型のバインダーが多かったですが、ループデザインという観点で特異な技術です。

筆者らは毒素タンパク質に対するバインダーをこの手法でデザインし、酵母ディスプレイでスクリーニングすることで、ウェットで評価されたバインダーの同定に成功しています。

コメント

Updating cart

お買い物かご