ML設計ミニプロテインを加速する ― mRNAディスプレイと酵母ディスプレイの正面比較

論文タイトル

Enhancing ML-based binder design with high-throughput screening: a comparison of mRNA and yeast display technologies

出典

Enhancing ML-based binder design with high-throughput screening: a comparison of mRNA and yeast display technologies
Recent advances in machine learning (ML)-based protein design methods have enabled the rapid in silico generation of large libraries of miniprotein binders with...

要旨

機械学習で設計したミニプロテインバインダーの大規模ライブラリを、mRNAディスプレイと酵母ディスプレイで並列にスクリーニングし、その性能と選択バイアスを比較した論文です。

解説など

本研究では、

  • B7-H3(免疫チェックポイント分子)
  • TLT-1(血小板受容体)

を標的として、機械学習設計 → 大規模ディスプレイスクリーニングまでを一気通貫で実行しています。そして、

  • mRNAディスプレイ(無細胞系)
  • 酵母ディスプレイ(細胞表面提示系)

同一DNAライブラリから並列比較している点が大きな特徴です 。

計算設計パイプライン

論文本文によると、各標的に対して以下の手順で配列を設計しています。

  • RFdiffusionで約10,000個のバックボーン構造を生成
  • 幾何学条件で約1,250に絞り込み
  • ProteinMPNNで各スキャフォールドに4–7配列を設計
  • 合計約8,000配列を作成

さらに、

  • pLDDT(構造信頼度)
  • interface PAE(界面予測誤差)
  • RMSD

といった複数指標でフィルタリングし、

  • TLT-1標的:2,009配列
  • B7-H3標的:3,149配列

を最終ライブラリとしています 。

スクリーニング

同一オリゴライブラリを用いて、

  • mRNAディスプレイ(1ラウンド、約6日で完了)
  • 酵母ディスプレイ(FACS selection 2ラウンド、約19日で完了)

を実施しています 。

濃縮度はlog₂ fold change > 3.5をヒット基準としています 。各ヒット候補はSPRで結合活性を評価しています。

結果

1. ライブラリカバレッジ

次世代シーケンスによる事前解析では、

  • mRNAディスプレイ:83–86%検出
  • 酵母ディスプレイ:59–63%検出

と報告されています 。これは、細胞内発現に依存しないmRNAディスプレイが、不安定配列も拾える可能性を示唆しています。

2. キネティクスバイアス

特に重要なのは、

  • mRNAディスプレイは「遅い解離速度(slow off-rate)」を持つバインダーを優先的に濃縮
  • 酵母ディスプレイは「速い解離速度」でも多価効果により拾われ得る

という差異です 。これは、治療用途で重要な「解離速度」の観点から非常に興味深い知見です。

ヒット候補と判定しSPR評価に進めた検体数が各ディスプレイで10個前後で、予測精度やディスプレイ比較の優劣に有意差があるとまではいえない結果にみえます。結論としては原理から自然に思えます。