GPT-5駆動・自律型クラウドラボが実証したCFPSコスト40%削減

論文タイトル

Using a GPT-5-driven autonomous lab to optimize the cost and titer of cell-free protein synthesis

出典

Using a GPT-5-driven autonomous lab to optimize the cost and titer of cell-free protein synthesis
We used an autonomous lab, comprising a large language model (LLM) and a fully automated cloud laboratory, to optimize the cost efficiency of cell-free protein ...

要旨

GPT-5と自動化クラウドラボを統合した自律型実験システムにより、無細胞タンパク質合成(CFPS)の特異コスト($/g)を40%削減し、同時にタンパク質生産量(titer)を27%向上しています。

解説など

近年、自律型ラボやアクティブラーニングによる材料探索・酵素設計の研究は増えています。しかし多くはベイズ最適化などの数理最適化手法が中心でした。

本研究では、大規模言語モデル(LLM)であるGPT-5と、Ginkgo Bioworksの自動化クラウドラボ(RACシステム)を統合し、無細胞タンパク質合成(CFPS: Cell-Free Protein Synthesis)のコストと生産量を同時に最適化しています。

  • LLMが仮説生成と文献参照を行う点
  • 実験ノートを自然言語で生成する点

が本研究の特徴です。

どうやってやったのか?

1. 自律型ループの構成

以下のループで実験が回されました。

  1. GPT-5が384ウェルプレート用の反応設計を生成
  2. Pydanticスキーマで妥当性検証
  3. Catalystソフトウェア(ワークフロー実行とオーケストレーションを担う)でプロトコル化
  4. RAC (装置種ごとのカートを組み合わせてプレートを搬送する仕組み)ベースのクラウドラボで実行
  5. タンパク質titerデータをJSONでGPT-5に返却
  6. GPT-5が解析・仮説生成・次ラウンド設計
2. 実験スケール

6ステップにわたり:

  • 480枚の384ウェルプレート
  • 29,527種類のユニーク反応条件
  • 約6か月間

を実行したと記載されています。

3. スキーマによる安全設計

Pydantic(Pythonのデータバリデーションライブラリ)を使い、

  • 反応体積制限(20 µL)
  • 試薬濃度範囲
  • プレートレイアウト
  • 使用可能試薬

などを厳密に定義しました。このスキーマ自体は筆者らが独自に定義したものです。

これにより、LLMの「幻覚(hallucination)」による不正設計は480プレート中2件未満だったと記載されています。

何が得られたのか?

SOTA(Olsen et al., 2025)と比較して

  • 特異コスト40%削減
  • titer 27%向上

と本文に記載されています。

本試験では、単一タンパク質 (sfGFP) の発現量しか最適化していません。LLMが既存の方法論を置き換えたというよりも、大規模実験と推論モデルを統合した実証例を示した側面が強いと思います。