【レビュー論文】タンパク質エンジニアリングのための深層学習手法総まとめ

論文タイトル

Protein engineering in the deep learning era

出典

Just a moment...

要旨

タンパク質デザインに関連した深層学習手法をまとめたレビュー論文です。

章立て

  • 緒言
  • プロテインエンジニアリングと深層学習
    • プロテインエンジニアリングのセントラルドグマ
    • タンパク質情報の数値化
      • 配列
      • 構造
      • 物性
  • タンパク質表現学習
    • 言語モデルを用いた配列エンコーディング
      • エンコーダーモデル
      • デコーダーモデル
      • エンコーダー・デコーダーモデル
    • 幾何学的深層学習を用いた構造エンコーディング
      • Neural message passing
      • CNNs
    • マルチモーダル・マルチスケールの統合エンコーディング
  • 下流タスク用のベンチマーク
    • 汎用ベンチマーク
    • 変異効果予測
    • 構造ホモロジー検出
    • 機能予測
      • 可溶性予測
      • 局在予測
      • アノテーション予測
    • タンパク質結合
      • リガンド-タンパク質間相互作用
      • タンパク質間相互作用
  • 結言

解説など

本レビューは網羅性に優れており、体系的に情報を収集するのに便利な内容です。タイトルにタンパク質エンジニアリングとあるように、いわゆるデノボデザインや構造予測よりも汎用的に活用できる手法を主に紹介しています。具体的には表現学習の手法と、機能予測などの下流タスクのためのベンチマークデータセットが内容の大部分を占めています。

目的(機能予測・物性予測)や対象(配列・構造)がカテゴライズの軸になっており、各目的の代表的な実装ツールを学ぶことができます。一方で時系列的な理解や、手法間の利点・欠点に対する言及が少ないので、ストーリー的な理解を望む読者には物足りないかもしれません。

Table 1に、既存のベンチマークデータが網羅的に示されていることが特に素晴らしく、目的に応じて適切なデータセット選択をすることを助けてくれるでしょう。