論文タイトル
Generative Humanization for Therapeutic Antibodies
出典
要旨
逐次的に進行する最適化プロセスの中で抗体をヒト化する手法を報告した論文です。
解説など
BigHat からのヒト化手法の開発報告です。
本ヒト化手法の特徴は、逐次的に進行する最適化プロセスの中で humaness を考慮することで免疫原性の低い配列を選んでいることです。
既存のヒト化手法は基本的に、最適化前のプロセスで少数の候補配列から1配列選ぶアプローチがほとんどです。これらの手法では、候補配列数が少なく、親抗体のもつ抗原結合特性や熱安定性が失われることがあり、またその改善策を提案できないことが課題でした。そこで筆者らはヒト化を最適化のプロセスに組み込んで、ヒト化と活性・物性面双方から最適な配列を逐次的に設計する多目的最適化アプローチを採用しています。
具体的には、Product of Experts (PoE, 複数のエキスパートモデルの確率分布を掛け合わせた分布)から配列をサンプリングすることで多目的最適化を実現しています。そしてエキスパートモデルとして、humanness は BERT スタイルのマスク言語モデル (MLM) を、活性・物性予測には 1D CNN のアンサンブルモデル (oracle) を採用しています。MLM は OAS のデータセットで訓練されています。一方 oracle は、 in-house の 50,000 ~ 1,000,000 ほどの NGS データで事前学習した後、8,000 ほどの活性・物性データでファインチューニングすることでモデルが構築されています。
配列のサンプリングには、Unmasked Sampling という戦略を採用しています。これは、以下のプロセスで配列を生成する手法です。
- 各変異位置ごとに
- MLM出力を取得
- oracle スコアを取得
- PoEで統合
- PoE分布から1アミノ酸をサンプリング
- 次の変異位置で同様のプロセスを実行し、すべての指定位置を埋める
本手法では それぞれ affinity と Tm を対象とした oracle を用意することで、humanness, affinity, Tm を同時最適化した配列を生成することに成功しています。
本手法の課題は、oracle の準備に数千レコードの活性・物性データが必要であることです。最適化初期に安定して、各性質を最適化できるかどうかは多くのケースで実証していかなければならないでしょう。