【AlphaFold】深層学習によるタンパク質構造予測手法を利用した分子デザイン

論文タイトル

Using AlphaFold for Rapid and Accurate Fixed Backbone Protein Design

出典

Using AlphaFold for Rapid and Accurate Fixed Backbone Protein Design
The prediction of protein structure and the design of novel protein sequences and structures have long been intertwined. The recently released AlphaFold has her...

確認したいこと

  • AlphaFoldを用いたタンパク質のデザイン手法

要旨

AlphaFoldを利用したタンパク質デザイン手法について紹介しています。

解説など

これまで本ブログでも、数々のタンパク質デザインの手法について紹介してきました。

本論文は、深層学習を利用したタンパク質デザイン手法になります。

この分野における主要な検討の方向性は、その目的から以下の4種類に分類されます。

  • Fixed backbone design
  • Antibody design
  • De novo design
  • Stability prediction

今回紹介する論文は、このなかでもFixed backbone designにあたるものです。これは、特定のタンパク質構造のバックボーンを標的として、その骨格構造に類似するタンパク質をデザインする手法です。モデルが生成する配列が、標的の骨格構造に制限されます。

本手法では、まずAutoregressive Transformerで生成モデルから多様なアミノ酸配列を生成します。生成された各配列はAlphafoldを利用して構造情報へと変換されます。つぎに各配列から予測された構造は、Alphafold自身の予測頻度と、標的構造との差異をもとにスコア化されます。この生成と評価のサイクルが繰り返されて、最適な配列がデザインされる流れになります。

本手法をTop7(PDBID:lQYS)の骨格構造に対して適応したところ、オリジナル配列と27%の相動性がある配列がデザインされました。この配列をAlphafoldで予測した構造は、Top7から0.736ÅのCα-RMSDを示したとのことです。pLDDTスコアは91を示したとのことで、Alphafold予測自体の信頼性も高いと考えられます。

本手法は、トレーニングセットに標的構造データが存在しない他3種類のタンパク質(Peak6、Foldit1、Ferredog-Diesel)に対しても適応され、成績が紹介されています。

デザインのiterationは2000回までを目途に主鎖構造が決定され、それ以降は、わずかな改善を積み重ねている様子です。

本研究の結果から、バックボーンデザインは実用に足る精度で実現可能であると感じました。

コメント