【コミュニティ】第1回タンパク質デザインコンペの結果報告!

論文タイトル

Results of the Protein Engineering Tournament: An Open Science Benchmark for Protein Modeling and Design

出典

Results of the Protein Engineering Tournament: An Open Science Benchmark for Protein Modeling and Design
The grand challenge of protein engineering is the development of computational models to characterize and generate protein sequences for arbitrary functions. Pr...

要旨

タンパク質デザインのコンペが開催され、その結果をレポートした文献になります。

解説など

Protein engineering tournament とは Align to Innovate が主催するタンパク質のデザインに特化したコンペティションイベントです。以前にその概要がリリースされた際に関連文献を紹介しました。

本レポートでは最初のイベントが実際に開催されましたので、その結果を紹介しています。トーナメントの仕組み自体は以前の記事で紹介していますので、そちらをご参照ください。

本イベントは大きく、

  • In Silico Round
  • In Vitro Round

に分かれて開催されています。”In Silico Round” では、与えられたテスト配列に対してそのタスクで対象となる評価指標(酵素活性や発現量など)を予測することに取り組みます。一方で “In Vitro Round” では対象となる評価指標を最大化するタンパク質配列の提案に取り組みます。

前回の文献では第1回コンペにおける具体的なタスクの内容が定まっていませんでした(酵素のエンジニアリングかバインダーデザインを予定しているという記載でした)が、本レポートから酵素のエンジニアリングをお題として用意したことが示されました。具体的には、以下の種類の酵素に対して、その酵素活性や熱安定性、発現量の各値を予測していきます。

  • Aminotransferase
  • α-Amylase
  • Imine Reductase
  • Alkaline Phosphatase PafA
  • β-Glucosidase B
  • Xylanase

参加チームは、アカデミアとインダストリーを合わせた 計 28 チームがコンペに登録し、うち 7 チームが実際に評価結果を提出しました。すべてのタスクに対する提出義務があるわけではなく、各タスクに対してベストなパフォーマンスを示したチームが表彰され、総合優勝は各タスクでのランキングスコアを加算して決まります。

一方 In Vitro Round では、α-Amylase の最適化エンジニアリングに絞ってお題が設定されました。発現量と熱安定性はデザインの足切りとして活用(野生型を基準に一定以上を示した改変を選抜)し、その中で酵素活性を最大化できたチームに高い評価が与えられます。ウェットの評価は、本コンペのパートナーである International Flavors and Fragrances で一括して実施されています。

結果を見てみると、In Silico、In Vitro Round ともにタスク(標的酵素の種類)や評価指標(酵素活性・発現量など)ごとに、成績の良いチームが異なるのが印象的です。それもそのはず、各チームは以下のとおり非常に多様な予測・デザインプロセスを採用しているとのことでした。

  • TUM Rostlab: fine-tuning of protein language models
  • MediumBio: a combination of greedy recombination of beneficial mutations and model-guided protein sequence space sampling
  • Nimbus; structural modeling tools like PyRosetta and AlphaFold
  • Marks Lab: natural sequence models and assay-labeled conditional generation
  • SergiR1996: structure based and genetic algorithm for multi-objective optimization

各手法の良し悪しが、標的タンパク質の種類や予測指標によってどのように変化するかは、各対象ごとにもっと多様なチームの結果を集約しないと考察が難しい印象です。

このコンペは今後も開催される予定で、徐々にバインダーデザインや、さらに複雑な機能性分子設計も視野に入れているとのことです。