【レビュー】機械学習とタンパク質工学。

論文タイトル

Machine Learning for Protein Engineering

出典

Machine Learning for Protein Engineering
Directed evolution of proteins has been the most effective method for protein engineering. However, a new paradigm is emerging, fusing the library generation an...

確認したいこと

深層学習を用いたタンパク質デザイン手法をベンチマークしています。

要旨

タンパク質工学に機械学習を用いる価値について、レビューした総説です。

章立て

  1. 分子進化法の背景
    1. 分子進化理論
      1. タンパク質適応ランドスケープとエピスタシス
    2. 本チャプターの内容
    3. タンパク質工学と分子進化法
    4. 進化最適化法
  2. 機械学習は、分子進化法の様々な工程に役立つ
    1. 初期鋳型配列の同定
    2. 初期ライブラリーのデザイン
    3. 機械学習をタンパク質工学に適用するときの実験的な考察
      1. ライブラリデザインの方法
      2. タンパク質機能の評価
      3. 配列解析による、配列と機能データとの紐づけ
    4. タンパク質機能のモデリング
      1. タンパク質アミノ酸配列の表現
      2. 配列・機能相関のモデリング
    5. タンパク質の選抜と最適化
      1. デザイン領域の定義
      2. 獲得関数の定義
      3. 配列・機能予測モデルの更新
  3. 展望と結言
    1. モデルの信頼性
    2. タンパク質特有のデータ形式
    3. まとめ

解説など

本文は、ウェットでの分子進化的なタンパク質工学手法について、広く言及されていることが特徴です。これまでに報告のある代表的なモデルを事例として解説する形ではなく、教科書的に概念レベルで、大事なことを解説しています。

図1には、タンパク質の分子進化手順を、配列空間の絞り込みとエネルギーランドスケープの観点から、図示しています。大事な概念を1枚絵にまとめてくれているので、引用図として重宝しそうです。

各論ですが、改変探索ではなく、初期ライブラリ設計に機械学習を使う可能性についても解説しています。汎用的な用途のデザインですと、やはりタンパク質の安定性が増すように指向性をもたせる、などの方法論が事例として挙げられています。

コメント