機械学習でナノボディの親和性成熟を高速化する新手法とは？

Machine learning enables efficient and effective affinity maturation of nanobodies

単一ラウンドのシーケンスデータと機械学習を用いて、抗体（ナノボディ）の親和性成熟を効率化する手法が提案されています。特に線形モデルが有効であり、高親和性バインダーの設計に成功したと本文に記載があります。

本研究は、「抗体の親和性成熟（affinity maturation）」をどのように効率化できるか、という課題に取り組んでいます。

抗体は標的に強く結合するために最適化が必要ですが、従来は多数の実験ラウンド（FACSなど）を繰り返す必要があり、時間とコストがかかる点が問題でした。

本研究では、

を組み合わせることで、後続ラウンドで有利になる変異を予測できるかを検証しています。

従来は「最終ラウンドのデータ」を使うことが多かったのに対し、本研究は初期ラウンドのデータだけで予測する点が大きな特徴です。

実験・解析の流れは以下の通りです。

モデルとしては以下が比較されています：

また、以下の方法で有望改変を選抜しています。

① 実験ライブラリからの選抜

② モデルによる新規設計（Gibbs sampling）

本研究では、3つのナノボディが使われています：

① AT110：標的 = AT1R（アンジオテンシンII受容体）

② B7：標的 = β2AR（β2アドレナリン受容体）

③ RX002（主に詳細検証に使用）：標的 = RXFP1（relaxin family peptide receptor 1）

結果

① 単一ラウンドのデータでも予測可能

FACS1のデータだけで、FACS2でのエンリッチメントを予測できることが示されています。

② 線形モデルが意外に強い

本文では、

と記載されています。

理由としては下記が挙げられます。

③ 単一変異の予測精度が高い

検証された有効変異を高順位にランク付けできることが示されています。

つまり、「どの1アミノ酸変異が効くか」をかなり正確に当てられる、ということです。

④ 実験的検証でも成功

RXFP1に結合するナノボディで検証した結果：

と本文に記載があります。

⑤ 複数変異の設計も可能

さらに、

することで、サブナノモル（0.18 nMなど）の高親和性バインダーを獲得しています。