論文タイトル
Computational counterselection identifies nonspecific therapeutic biologic candidates
出典
Cell Rep Methods. 2022 Jul 11;2(7):100254.

確認したいこと
深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。
要旨
ファージディスプレイから取得した配列データをもとに、深層学習モデルを用いて、非特異結合抗体を分類する手法を提案しています。
解説など
標的抗原に結合するバインダーの選抜と違って、非特異的に結合するバインダーは、その定義の難しさに基づく困難があります。理想的には標的抗原以外の数ある分子に結合しないことを確認する必要がありますが、それを実験的に精査するのは非現実的です。また、ある程度非特異結合性を確認するための分子を絞ったとしても、それらに対して結合を確認するには手間がかかります。
本論文の提案は、ルーチンワークとして様々な標的分子に対してバインダーセレクションをおこなっている組織において役に立つ方法論です。これまで蓄積された、特定の標的分子「以外」を対象とした「target binder」の情報は、非特異結合性の評価において「non-specific binder」のデータとして活用できます。
筆者らは、ファージディスプレイパニングにより、各配列に対して「binder」と「non-binder」のラベルを付与したデータを作成しています。そのデータセットをもとに、深層学習によるbinder分類モデルを構築して、「target binder」「non-specific binder」「non-binder」の分類を試みています。デザインする対象は、抗体のHCDR3です。
本手法の検証として、オマリズマブ(抗IgE抗体)と、トラスツズマブ(抗HER2抗体)を抗原としたファージディスプレイパニングを実施しています。抗体として定常領域が共通の構造を有しているため、標的特異的なエピトープと非特異的なエピトープを容易に定義することができ、検証用として十分なデータセットです。
6種類の深層学習モデルアーキテクチャ(5種のCNNと1種のLinear) からアンサンブルモデルを構築して、学習・予測を試みています。どちらか一方に特異的に結合するクローンは「target binder」として、双方に結合するクローンは「non-specific binder」として分類したところ、優れた分類精度を示したとのことです。
訓練するデータ数や、充てるライブラリーの種類がどれくらいモデルの精度に依存するのか気になるところです。文献通りのデータ数を確保するにはHiseqでのデータ取得が必要ですが、H3より外側の予測やデザインに制限を受けてしまいます。
コメント