【レビュー】深層学習を活用したタンパク質デザイン手法を総括

論文タイトル

From sequence to function through structure: deep learning for protein design

出典

https://www.biorxiv.org/content/10.1101/2022.08.31.505981v1

確認したいこと

タンパク質の計算機デザインについて、レビュー稿を作成しようと考えています。代表的なレビュー論文を参照しました。

要旨

深層学習を活用したタンパク質デザイン手法をレビューした論文です。

章立て

  1. 緒言
  2. タンパク質研究における、物理化学的な関数から深層ニューラルネットワークへの移行
  3. タンパク質配列と構造生成における深層学習の活用
  4. タンパク質生成と選抜のためのパイプライン
  5. 事例:深層学習を用いたタンパク質結合分子を選抜
  6. 結言
  7. 深層学習は、タンパク質デザイン・エンジニアリング・予測・最適化のためのツールを案内する
  8. 市場に展開できる生物学的製剤のためのエンドツーエンドのタンパク質デザイン手法
  9. 将来展望:タンパク質デザインのためのコミュニティ

解説など

深層学習に特化したタンパク質デザイン手法の総説は、過去にも紹介しました。

前回紹介した論文は、タンパク質のデザイン手法を、深層学習のアーキテクチャごとに分類して、アーキテクチャの特徴に焦点を当てて解説していました。

それに対して、本総説は、デザインの目的ごとに分類して技術開発の過程を紹介しています。その目的は以下の通りに分類されています。

  • バックボーンデザイン
  • 構造生成
  • 配列生成
  • 構造と配列の同時生成

原著表1には、様々な手法が、アーキテクチャなどの特徴を含めてリスト化されています。非常に整理されているので、参考になるでしょう。

また、本総説では、後半部にエンドツーエンドタンパク質デザインツールとして、筆者らが実装した具体的な手法を紹介しています。この手法では、ProtGPT2を用いて、10万種の配列を生成し、生成した配列に対して2次構造やオントロジーなど様々な特徴量を予測してラベルを付与しています。これを指標に目的の機能を持つ配列を探索するためのコードをjupyter notebookで公開しています。これによってフィルタリングされた配列は、ColabFoldで構造をモデリングすることができます。この手法の使用実施例も紹介されていました。

コメント