論文タイトル
The protein engineering tournament: an open science benchmark for protein modeling and design
出典
https://browse.arxiv.org/pdf/2309.09955.pdf要旨
タンパク質デザインのコンペティション開催の概要を、解説した文献です。
解説など
筆者らは、Align to Innovate という非営利組織で、バイオテクノロジー研究の普及をミッションに活動しています。具体的には、研究手法にクラウドラボや公共データを最大限活用して、再現性かつ共有性の高い研究の推進を目指しています。
そんな彼らのプロジェクトの一つが、”Protein engineering tournament” です。コンペティションによって技術が普及し、情報が共有化される様子は タンパク質構造解析における CASP の役割に通じるアイデアです。彼らのコンペでは、構造や機能に着目して、目的に適したタンパク質を”デザイン”できるかで競います。
コンペティションでは、
- In Silico Round
- In Vitro Round
の2ステップに分かれて、評価・選抜されていきます。
In Silico Round では、チームが提出した予測モデルで、どれだけ精度高くアミノ酸配列から対象の機能を予測できるかを競い合います。一方で、In Vitro Roundでは、特性から配列を生成するモデルの精度を、実際のデザインをウェットの試験で評価することで、ランキング化します。ここでは、デザインした配列群すべての総合評価値として、normalized discounted cumulative gain (NDCG) が採用されます。
Discounted cumulative gain とは、順位を含めて正解データのランキングをどれだけ再現できるのか表す指標です。

最優秀チームには、具体的な褒章は決まっていないものの表彰され、そのデータセットやプロトコルは全て公開されることになります。
一人以上、誰でも参加可能で、In Silico Round の参加には登録費が不要です。
In Vitro Round ではウェットの試験が必要なので、運営側が主体的にマネジメントするのは、このステップになります。従って参加には登録費が必要ですが、In Silico Winner のチームには、振興費が与えられます。
In Vitro Round の参加者は、以下に示すいずれかの参加手順を満たしたチームで構成されます。
- In Silico Winner:In Silico Round での成績優秀チーム
- Application System:In Vitro Round からの参加(生成モデル構築にフォーカスしたチームの参加)
- Paid Entry:参加費を支払って参加
実際の実験は、以下のクラウドラボを主体に遂行されます。
- Emerald Cloud Labs(https://www.emeraldcloudlab.com/)
- アカデミア(Boston University, Carnegie Mellonなど)
コンペ最初のタスクは、単一の機能デザイン(バインダーデザイン、もしくは酵素のエンジニアリング)になる予定とのことです。