【de novo design】DeepDreamのパターン検出・生成技術を活用して、タンパク質にも「幻覚」を。

論文タイトル

De novo protein design by deep network hallucination

出典

Nature. 2021 Dec;600(7889):547-552.

De novo protein design by deep network hallucination - PubMed
There has been considerable recent progress in protein structure prediction using deep neural networks to predict inter-residue distances from amino acid sequen...

確認したいこと

  • タンパク質のde novoデザイン手法

要旨

DeepDreamで適応された「hallucination」を活用して、タンパク質をde novoデザインした報告です。

解説など

「hallucination」とは「幻覚」という意味です。

GoogleのDeepDreamは、任意の画像の中で検出したパターンを過剰に処理することで、幻覚的な画像を生成することができます。

DeepDream - Wikipedia

このプログラムは、もともと画像内に含まれるパターンを検出するために設計されているのですが、学習後に構築したネットワークを逆方向に実行することで、信頼性スコアが高いままオリジナルの画像を少しだけ変更することができます。

これをタンパク質のデザインに応用したのが、本論文で紹介された手法です。

まずtrRosettaを利用して、特定のタンパク質ファミリーの残基間距離と配向分布を予測するモデル(Structure prediction network) を構築します。そして、このモデルにde novoでデザインする配列を与えて、その構造を予測します。

ネットワークに送り込む配列は、天然に存在するアミノ酸配列ではなく、完全にランダムな配列です。

モデルをもとに、許容できる配列を変異を導入しながらモンテカルロシミュレーションで探索していきます。

さらに詳しく

最適な配列は、Structure prediction networkとBackground networkの差分が大きいことを指標に判断しています。ネガティブコントロールとの差異が大きいことを目安に、訓練した構造の特徴を抽出しているということです。この差分にはKullback-Leibler divergenceを用いています。

Kullback–Leibler divergence - Wikipedia

シミュレーションを20,000ステップまで繰り返すと距離マップは精度を増し、望む構造に近づいていくことが示されています。

生成された構造の特徴は以下のとおりです。

  • 生成された配列と、天然のタンパク質配列との類似性は非常に低い
  • 乱数シードを変えると、異なる配列・構造ペアに収束した
  • 生成された構造は、一般的なαヘリックスやβシート構造を有した
  • 129種の生成構造のうち82種は、その配列が形成する最安定構造に近い構造を示した
  • 129種の生成構造のうち27種は、大腸菌で発現させることに成功した
  • 生成したタンパク質の多くは、溶液中でオリゴマーを形成した

オリゴマーを形成する構造が生成されやすい理由は、訓練した配列にオリゴマーを形成するタンパク質が複数含まれており、疎水性残基が表面に露出しやすかった可能性が高いと言及されています。

コメント

Updating cart

お買い物かご