【バインダーデザイン】構造いらずのペプチドバインダーデザイン手法 PepPrCLIP とは

論文タイトル

De novo design of peptide binders to conformationally diverse targets with contrastive language modeling

出典

要旨

従来の構造依存的なアプローチを必要とせずに、配列情報のみから新規ペプチド結合分子（binder）を設計するためのフレームワーク「PepPrCLIP」を提案・検証した論文です。

解説など

バインダーデザインの新規手法の紹介です。本論文ではリニアペプチド型のバインダー設計手法を提案しています。本手法の特徴は、入力情報に標的抗原の構造情報が不要なことです。デザインの内部でモデリングして構造を起こすのではなく、純粋に配列情報のみから適したペプチド配列を生成することができます。

この目的のために、活用したのが “Contrastive Language-Image Pretraining” CLIPモデルです。これは異なるモダリティ（たとえば画像とテキスト）を共通の埋め込み空間にマッピングするための自己教師あり学習手法です。この論文ではその概念をタンパク質配列とペプチド配列のペアに応用しています。

CLIPを活用した筆者らのバインダーデザインパイプライン「PepPrCLIP」は、以下２つのステップで構成されています。

生成フェーズ（ペプチドの生成）
- ESM-2（650M）を使用し、既知ペプチドの埋め込み空間をガウスノイズで摂動
  - 「既知ペプチド」は既往の報告から何らかのタンパク質に結合していることが明らかなペプチド
  - 標的抗原に適した鋳型配列を選ぶわけではなく、既知ペプチド群から完全にランダムに選択
- 摂動後の埋め込みから、再び配列を復元することで、自然なバリエーションのペプチドを得る