【抗体】機械学習を活用した、抗体の開発適性評価手法まとめ

論文タイトル

Progress and challenges for the machine learning-based design of fit-for-purpose monoclonal antibodies

出典

MAbs. Jan-Dec 2022;14(1):2008790.

Progress and challenges for the machine learning-based design of fit-for-purpose monoclonal antibodies - PubMed
Although the therapeutic efficacy and commercial success of monoclonal antibodies (mAbs) are tremendous, the design and discovery of new candidates remain a tim...

確認したいこと

  • 抗体のde novoデザイン手法

要旨

機械学習を活用した抗体デザイン手法をまとめたレビュー論文です。

章立て

  1. 緒言
    1. モノクローナル抗体のスクリーニングは、依然として過去の技術に固執している
    2. 抗体のMLベースデザインにおける3つの技術:学習可能性・モジュール性・新規配列生成
    3. 抗体デザインにおける生体複雑性を、自然から学ぶ
    4. 抗体・抗原複合体に関する実験データの充実
  2. 抗体・抗原結合の学習可能性
    1. 抗体・抗原結合の予測問題
    2. エピトープ予測
      1. “antibody-agonistic”エピトープ予測
      2. “antibody-aware”エピトープ予測
    3. パラトープ予測
      1. 配列ベースの”antigen-agonistic”パラトープ予測
      2. 構造ベースの”antigen-agonistic”パラトープ予測
      3. 配列ベースの”antigen-aware”パラトープ予測
      4. 構造ベースの”antigen-aware”パラトープ予測
    4. 単一のパラトープ・エピトープ予測から、多対多の結合パートナー予測へ
    5. 配列ベースの親和性増強に関する学習可能性
    6. MLベース抗体・抗原結合予測のための効率的な実験データ生成
    7. 合成データの活用
  3. モジュール性は抗体デザインに関わるパラメータを学習する
    1. 抗体のモジュール性と、医薬開発のためのパラメータ
    2. 医療用抗体医薬の背景
    3. 抗体医薬の血中半減期
    4. 抗体の安定性向上
    5. 抗体の免疫原性低減
    6. 望ましい薬効と開発適性を有する抗体のデザインはいまだに困難である
  4. 無制約のインシリコ抗体配列生成
    1. 深層生成モデルによる抗体配列生成
    2. GANベースの抗体デザインアプローチ
      1. 特徴を抽出した抗体配列の生成におけるGANの性能の評価
      2. GANベースの一般的なタンパクデザインアプローチ
    3. VAEベースの抗体デザインアプローチ
      1. 抗体骨格構造の生成モデリング
      2. ガウス混合モデルをVAEの潜在空間に適用することによる、抗体配列クラスタリング
    4. VAEベースの一般的なタンパクデザインアプローチ
    5. ARベースの抗体デザインアプローチ
      1. LSTM-RNNによる抗体親和性増強
      2. CDRH3配列の分布の学習に関するLSTM-RNNの実証
      3. ARベースのナノボディーデザイン
      4. 構造の同時推定によるARモデルの改善
    6. ARベースの一般的なタンパクデザインアプローチ
      1. 単純なARベースモデルの非実用性
      2. 発展的なARベースの一般的なタンパクデザインアプローチ-配列の埋め込み
      3. 一般的なタンパクデザインのためのトランスフォーマーネットワーク
    7. 抗体デザインの残された課題
  5. 総括

解説など

雑感

ボリュームのあるレビュー論文です。パラトープ・エピトープ予測、配列生成、開発適性評価など、目的別に開発された技術をまとめています。特に配列生成に関しては、深層学習かつ抗体への適用まで限定すると実施例は多くなく、1例ごとに章立てされて、丁寧に解説されていました。また、機械学習によるデザイン手法中心の総説の中では、物性を含めた開発適性の評価について、まとめられていることも重宝する点だと思いました。

エピトープ・パラトープ予測

この分野では、以下の2つの単語が印象的でした。

  • antibody-agonistic:特定の抗体を対象としない、純粋に抗原性の高いエピトープを予測する
  • antibody-aware:特定の抗体のパラトープに相補的なエピトープを予測する

ワクチン開発など、ポリクローナルな抗体レパトアを対象とする場合は前者の、モノクローナル抗体の開発には後者の手法、がそれぞれ重要になってきます。これらには、パラトープ予測に対応する、antigen-agonistic, antigen-awareという語も存在します。

geometric deep learning (GDL)が、分子表現に活用される手法として、近年で最も有望な技術といえます。以前の記事で紹介したMaSIFはその代表的な成果です。抗体・抗原結合予測に最適化されていることから、パラトープ・エピトープ予測手法の開発において、ベンチマークとなる技術であると、言及されています。

抗体配列・構造データベース

抗体関連のデータベースに関しても数多く紹介されています。

特に合成データ(in silicoで生成した抗体配列・構造のデータ)について数多く説明されています。

筆者らはAbsolut!という抗原・抗体相互作用をシミュレートする計算手法を開発しています。詳しくはこちらの記事をご参照ください。

その他、純粋に合成抗体配列を生成するツールにIGORやiimuneSIMなどがあることが知られています。

コメント