論文タイトル
In silico evolution of protein binders with deep learning models for structure prediction and sequence design
出典
確認したいこと
深層学習を用いたタンパク質デザイン手法をベンチマークしています。
要旨
AF2とProteinMPNNの反復実行でタンパク質性のバインダーを生成するパイプラインEvoProを紹介した論文です。
解説など
バインダーのデノボデザインに関する最新の論文報告です。筆者らは EvoPro というパイプラインを構築して、タンパク質のバインダーデザインに取り組んでいます。
EvoProでは、配列生成とそのスクリーニングの2段階のステップに大きく分かれます。
配列生成においては、まず出発構造として、多様なトポロジーを示すスキャフォールドデータセットを利用しています。具体的には、以下の論文で報告された RifDock/RifGen 手法で利用された miniprotein 型のスキャフォールドです。
これらの鋳型スキャフォールドから、ランダムな突然変異誘発、交差、ProteinMPNNで配列プールを生成しています。
次は、EvoPro の配列スクリーニング手順です。各配列は、以下に示す3つの要素が考慮されたフィットネススコアで評価されます。
- Placement Confidence:結合界面の形状相補性。AF2のPAEから算出。
- Fold Confidence:単体構造の信頼性。AF2のpLDDTから算出。
- Conformational Stability:複合体形成時の構造変化の少なさ。complex/apo間のRMSDで算出。
筆者らはこの AF2 を用いた配列スクリーニングと、ProteinMPNN を用いた配列最適化を反復的に利用してしてタンパク質の分子進化を行っています。
本文ではこの手法を用いて、PDL1バインダーのデザインをおこなっています。実際にサイクルを繰り返すごとにフィットネススコアの各要素が最適化されているのが、掲載されている図から見て取れます。
本結果から得られたファクトは次の通りです。
- 様々なトポロジー構造から出発したが、選抜された構造は3ヘリックスバンドルが多かった
- 設計されたバインダーの多くは、結合ポケットにチロシンやロイシンを含む
- 実験に供されたタンパク質のうち、最小のKDは0.9 nMであった
EvoProのコードは下記のリンクに公開されています。AF2のインストールが必要なため、ローカルでの実装にはハードルがありますが、ご興味のある方はぜひお試しください。
コメント