【de novoデザイン】抗体骨格構造を生成する深層学習モデルIg-VAEを紹介

論文タイトル

Ig-VAE: Generative Modeling of Protein Structure by Direct 3D Coordinate Generation

出典

Just a moment...

確認したいこと

  • 深層学習を利用した、タンパク質デザイン手法

要旨

抗体構造を計算機でデザインする深層学習モデル、Ig-VAEを提案した論文です。

用語

GAN: Generative Adversarial Network

解説など

筆者らは、過去に距離行列表現を用いて、64残基のタンパク質骨格構造を生成するVAEモデルを報告しています。

Generative modeling for protein structures

このモデルには、以下3つの課題が存在していました。

  • 生成された距離行列はユークリッド距離として有効ではなく、完全な3D座標を生成できない
  • 距離行列表現の冗長性に起因して、ねじれ分布の信頼性が低い
  • 科学的に非現実的なデザインが散見される

そこで、Ig-VAEという、残基間距離ではなく、原子座標を直接生成するVAEモデルを開発しました。Ig-VAEにより抗体構造に特化して、信頼性の高いタンパク質構造の設計を目指しています。

VAEモデルの訓練データは、抗体構造データベースであるAbDbから取得した10,768の抗体構造です。各タンパク質構造を距離行列としてエンコードし、モデルを構築しています。

生成モデルの性能評価

無作為に生成した500の抗体構造の、ねじれ角・残基間距離・結合角などの分布を確認したところ、実データと比較して良く一致したとのことです。

また、生成された構造は広い空間に分布しており、新規のループ形状を有していました。同時に、エネルギー的にも安定で、IgG特有の構造的な特徴は保存されています。

さらに筆者らは、Ig-VAEでSARS-CoV2バインダーを創生することも試みています。スキャフォールドにはシングルドメイン抗体の構造を利用しています。デザインの流れは下記のとおりです。

  • Ig-VAEの潜在空間から5000の構造をサンプリングする
  • PatchDockを用いて、生成された構造をSARS-CoV2 RBDに対してドッキングする
  • ドッキングできる抗体構造を選抜し、FastDesignで結合界面の配列を最適化する

実験的に抗原への結合が確認されたデータは示されていないものの、計算上で結合自由エネルギーの高いクローンを選抜できたとのことです。

コメント