論文タイトル
Lab-in-the-loop therapeutic antibody design with deep learning
出典
要旨
抗体の最適化パイプライン Lab-in-the-loop を紹介した論文です。
解説など
Genentech から抗体最適化プラットフォームの紹介です。彼らは Prescient Design のチームと共同して計算科学を活用した配列設計手法の開発に取り組んでいます。過去には以下のような要素技術の開発を報告していました。
- Walk-Jump Sampling
- LBSTER
- Cortex
- PropEn
本論文はこれらを組み合わせた抗体最適化用のパイプラインとしての紹介です。このパイプラインを Lab-in-the-loop (LitL)と呼んでいます。
LitLは大きく、以下の4つで構成されています。
- Generative models
- Property Prediction Oracles
- Ranking and Candidate selection
- Experiment workflows
Generative model は、評価候補の配列を生成するプロセスを担います。彼らは複数の生成モデルを活用して、各モデルから独立して候補配列を提案します。すべて合わせると 30,000 デザインほどになるそうです。モデルはいずれも配列ベース(構造生成ではない)のものになります。
提案された配列は、Property Prediction Oraclesで多面的にその性質が評価されます。バインダーの2値分類や、抗原親和性や発現量に対する回帰モデルなどが備わっています。Chemical liabilities もここで検出されます。
Ranking プロセスでは、Chemical liabilities のフィルタリングを通過した候補配列がその特性にしたがって順位付けされます。発現量や抗原親和性など多指標を考慮し、結果的にパレート境界を目指して配列が優先付けされます。配列の選抜には active learning が活用され探索と活用を効率的に行うことができます。Noisy Expected Hypervolume Improvement (NEHVI) acquisition function を利用することで実測値の誤差も考慮した配列選抜を心がけているようです。
実験プロセスにおいて、抗体の可変領域の遺伝子断片は Twist Bioscience で全合成しているそうです。ギブソンアセンブリでリニアな発現用遺伝子断片を準備して、HEK293で1mL発現してタンパクを調製しています。
実施例においては、ラウンドが進むにしたがってより強い親和性増強改変が見出されていることや各デザインの予測と実測値との相関も良いことが示されています。多目的最適化を目的とした実施例では、各デザインについて Therapeutic Antibody Profiler (TAP) を評価し、ほぼすべてのデザインが治療抗体医薬品として適した developability であることを示しています。
要素技術には様々な方法論が考えられますが、それらを組み合わせたパイプラインとしては非常に王道かつ洗練された印象を持ちました。各要素技術のコードが公開されているので、参考にできる点も多そうです。