【抗体構造予測】AF2 と言語モデルを融合! H3-OPTの構造予測成績を紹介

論文タイトル

H3-OPT: Accurate prediction of CDR-H3 loop structures of antibodies with deep learning

出典

https://www.biorxiv.org/content/10.1101/2023.08.19.553933v1

確認したいこと

深層学習を用いたタンパク質デザイン手法をベンチマークしています。

要旨

抗体のH3構造予測の新手法 H3-OPT について報告した論文です。

解説など

本ブログでも、これまで様々な抗体構造予測手法について紹介してきました。

AF2 は MSA による進化情報の活用から短いループ長(10残基未満)の H3 予測では高精度が出せますが、アミノ酸長が長い場合には、予測精度が落ちてしまいます。この問題を解決するために、従来言語モデル (PLM) を用いた構造予測手法が開発されてきました。

筆者らは、このAF2の長所と PLM ベースのモデリングを組み合わせることで両者のメリットを生かすことを試みています。本論文で公開された手法は H3-OPT と呼ぶメソッドです。アーキテクチャは図1に示されています。

H3-OPT には、以下に示す2つのモジュールで構成されています。

  • Template module
  • PLM-based structure prediction module

まずは、”Template module”から説明しましょう。ここでは、予測モデルを AF2 / テンプレートグラフティング / PLMベース予測 のいずれのモデルを採用するかを判断するためのモジュールです。短いH3長でAF2 の予測精度が高い場合は、AF2を採用します。一方で AF2モデルの信頼度が低い場合は、配列の類似したテンプレートがあるかどうかで判断します。存在する場合は、テンプレートグラフティングに基づく予測を、そうでない場合は、PLMベースの予測をおこないます。

H3-OPTにおける、”PLM-based structure prediction module”のポイントは以下のとおりです。

  • 訓練時にESM2の隠れ層のパラメータを微調整する
  • 汎化能を改善するために、Evoformer アーキテクチャを簡素化
  • アライメントはループフォールディングへの残基の寄与を効果的に捕捉するように設計

本手法により、試験されたデータセット上では、デフォルトの AF2 を超える予測精度を示すことに成功しています。

コメント