論文タイトル
Ig-VAE: Generative Modeling of Protein Structure by Direct 3D Coordinate Generation
出典
Just a moment...
確認したいこと
- 深層学習を利用した、タンパク質デザイン手法
要旨
抗体構造を計算機でデザインする深層学習モデル、Ig-VAEを提案した論文です。
用語
GAN: Generative Adversarial Network
解説など
筆者らは、過去に距離行列表現を用いて、64残基のタンパク質骨格構造を生成するVAEモデルを報告しています。
Generative modeling for protein structures
このモデルには、以下3つの課題が存在していました。
- 生成された距離行列はユークリッド距離として有効ではなく、完全な3D座標を生成できない
- 距離行列表現の冗長性に起因して、ねじれ分布の信頼性が低い
- 科学的に非現実的なデザインが散見される
そこで、Ig-VAEという、残基間距離ではなく、原子座標を直接生成するVAEモデルを開発しました。Ig-VAEにより抗体構造に特化して、信頼性の高いタンパク質構造の設計を目指しています。
VAEモデルの訓練データは、抗体構造データベースであるAbDbから取得した10,768の抗体構造です。各タンパク質構造を距離行列としてエンコードし、モデルを構築しています。
生成モデルの性能評価
無作為に生成した500の抗体構造の、ねじれ角・残基間距離・結合角などの分布を確認したところ、実データと比較して良く一致したとのことです。
また、生成された構造は広い空間に分布しており、新規のループ形状を有していました。同時に、エネルギー的にも安定で、IgG特有の構造的な特徴は保存されています。
さらに筆者らは、Ig-VAEでSARS-CoV2バインダーを創生することも試みています。スキャフォールドにはシングルドメイン抗体の構造を利用しています。デザインの流れは下記のとおりです。
- Ig-VAEの潜在空間から5000の構造をサンプリングする
- PatchDockを用いて、生成された構造をSARS-CoV2 RBDに対してドッキングする
- ドッキングできる抗体構造を選抜し、FastDesignで結合界面の配列を最適化する
実験的に抗原への結合が確認されたデータは示されていないものの、計算上で結合自由エネルギーの高いクローンを選抜できたとのことです。
コメント