論文タイトル
From sequence to function through structure: deep learning for protein design
出典
https://www.biorxiv.org/content/10.1101/2022.08.31.505981v1
確認したいこと
タンパク質の計算機デザインについて、レビュー稿を作成しようと考えています。代表的なレビュー論文を参照しました。
要旨
深層学習を活用したタンパク質デザイン手法をレビューした論文です。
章立て
- 緒言
- タンパク質研究における、物理化学的な関数から深層ニューラルネットワークへの移行
- タンパク質配列と構造生成における深層学習の活用
- タンパク質生成と選抜のためのパイプライン
- 事例:深層学習を用いたタンパク質結合分子を選抜
- 結言
- 深層学習は、タンパク質デザイン・エンジニアリング・予測・最適化のためのツールを案内する
- 市場に展開できる生物学的製剤のためのエンドツーエンドのタンパク質デザイン手法
- 将来展望:タンパク質デザインのためのコミュニティ
解説など
深層学習に特化したタンパク質デザイン手法の総説は、過去にも紹介しました。
前回紹介した論文は、タンパク質のデザイン手法を、深層学習のアーキテクチャごとに分類して、アーキテクチャの特徴に焦点を当てて解説していました。
それに対して、本総説は、デザインの目的ごとに分類して技術開発の過程を紹介しています。その目的は以下の通りに分類されています。
- バックボーンデザイン
- 構造生成
- 配列生成
- 構造と配列の同時生成
原著表1には、様々な手法が、アーキテクチャなどの特徴を含めてリスト化されています。非常に整理されているので、参考になるでしょう。
また、本総説では、後半部にエンドツーエンドタンパク質デザインツールとして、筆者らが実装した具体的な手法を紹介しています。この手法では、ProtGPT2を用いて、10万種の配列を生成し、生成した配列に対して2次構造やオントロジーなど様々な特徴量を予測してラベルを付与しています。これを指標に目的の機能を持つ配列を探索するためのコードをjupyter notebookで公開しています。これによってフィルタリングされた配列は、ColabFoldで構造をモデリングすることができます。この手法の使用実施例も紹介されていました。
コメント