【タンパク質デザイン】ベイズ最適化とラボラトリーオートメーションで、タンパク質を効率的に分子進化

論文タイトル

Protein engineering via Bayesian optimization-guided evolutionary algorithm and robotic experiments

出典

500 Internal Server Error

確認したいこと

深層学習を用いたタンパク質デザイン手法をベンチマークしています。

要旨

ベイズ最適化とロボット工学を利用した、タンパク質の分子進化アルゴリズムを紹介しています。

解説など

本論文は、ベイズ最適化でタンパク質を分子進化するための手法を紹介しています。

本ブログでは、これまでにベイズ最適化を用いたタンパク質デザイン手法として、以下のような方法を紹介してきました。

本論文の特徴は、ラボラトリーオートメーションシステムを活用したウェットスクリーニングのスループットを意識して、探索効率の最適化を行っている点にあります。標準的なSBS規格に準拠したマイクロタイタープレートでは、96, 384 ,1536個などのサイズで、アッセイする検体をアレイ化することが可能です。したがってこの数であればバッチとして、1ラウンド分の探索を行うことができます。このことから、

  • どれくらいのバッチサイズで、
  • どれくらいのラウンド数の、

探索を行うのが最適かを求めることが、本論文における課題です。

さすがに、全配列空間を探索するのは非効率的なので、本論文では対象のタンパク質に対して、4つのアミノ酸残基に対する全変異(20^4 =約16万)を探索空間に設定しています。

シミュレーションの結果から、384サイズのバッチで、4~5回程度の反復数が、効率よくグローバルな最適解に到達できることを示しています。

また配列のエンベディング方法は、ワンホットエンコーディングの他、

  • UniRep
  • ESM-1v
  • ProtT5-XL-U50
  • TAPE
  • Georgiev

が比較評価されていますが、全体的に ProtT5-XL-U50、ESM-1v が優れた成績を収めたとのことです。

非常に実用的な検証結果だと思います。インシリコの予測精度とウェットのスループットが、将来的にどれくらい向上し、今回の結論がどれくらい変わり得るのか、意識したいです。

コメント