論文タイトル
The Virtual Lab: AI Agents Design New SARS-CoV-2 Nanobodies with Experimental Validation
出典
要旨
大規模言語モデル(LLM)を用いた多エージェントAIシステム「Virtual Lab」により、新型コロナウイルス(SARS-CoV-2)の新規ナノボディ(抗体)の設計と実験検証を実現した実施例です。
解説など
先日 Nature に報告された論文のプレプリント版です。

これまでは、下記のような AI scientist が過去に公開されていました。
- ChemCrow:化学合成研究の計画立案、反応予測
- Coscientist:文献検索、手法洗濯
- AI Scientist:機械学習研究の自動化
これらに対して、筆者らが開発した「Virtual Lab」は科学研究に汎用的に利用可能なシステムですが、本論文ではタンパク質の設計をトピックにその性能が実証されています。
本手法の一番の特徴は、研究方針の立案に異なる役割をもつ複数のエージェントが利用されていることです。
- PIエージェントが初期意見と問いを提示
- Scientist エージェントたちが意見を述べる
- Scientific Critic が各意見を批判的に評価
主にこの3エージェントが相互連携して結論を導きます。Scientist エージェントはさらに、Immunologist, Machine Learning Specialist, Computational Biologist などに分かれます。これらの専門エージェントは、問題設定に応じて PI エージェント自らによって作成されます。
筆者らは、SARS-CoV-2 に対する抗体バインダーの取得に本手法を適用しました。この際の手順は主に次のようなプロセスで進行します。
ステップ概要:
- チーム構成決定
- PIが、Machine Learning Specialist、Computational Biologist、Immunologist を選定。
- 研究方針の決定
- 「従来のナノボディ(Ty1, H11-D4, Nb21, VHH-72)」を修飾する方式を選択
- nanobody の方が抗体よりもサイズが小さく安定性・組換え生産性に優れるため選択
- ツール選定
- 以下の3つを採用:
- ESM(Evolutionary Scale Modeling): 配列ベースの変異候補スクリーニング
- AlphaFold-Multimer: nanobody-RBD 複合体の構造予測
- Rosetta: 結合エネルギー評価
- 以下の3つを採用:
- ツール実装
- 各エージェントが Python コードを自動生成してタスクを実行(例:ESM LLRのスコア計算、ipLDDT・Rosetta エネルギー評価)
- ワークフロー設計
- 各ナノボディに20個の1点変異体を生成し、3指標(ESM LLR / AF ipLDDT / Rosetta dG)を統合した重み付きスコアで評価
- このプロセスを4ラウンド繰り返し、最終的に23候補/ナノボディ × 4 = 92種類の変異ナノボディを選出
設計された分子は、実際にヒトの手により実験的に検証され、多くの変異体が元のWuhan株スパイクRBDへの結合性を維持することが示されました。また特に2つの変異体が新型変異株(JN.1やKP.3)に対して新たな結合性を獲得したとのことです。
このプロセスでは、人間の入力は全体の1.3%(1,596語)であり、ほとんどがLLMエージェントによって自動実行されました。
このプレプリントでは、具体的な実装技術(LangChainやAutoGenなど)は言及されていません。またウェット実験基盤との連携はシステムに含まれていないようです。
コードはこちら。


