【バインダーデザイン】構造柔軟性の高いモチーフにも結合できるペプチドバインダーをデザインするには

論文タイトル

moPPIt: De Novo Generation of Motif-Specific Binders with Protein Language Models

出典

moPPIt: De Novo Generation of Motif-Specific Binders with Protein Language Models
The ability to precisely target specific motifs on disease-related proteins, whether conserved epitopes on viral proteins, intrinsically disordered regions with...

要旨

標的エピトープモチーフに結合するペプチドバインダーを設計する手法 moPPIt を紹介した論文です。

解説など

現在バインダーデザインの主流は、RFDiffusion を筆頭に、タンパク質構造を特徴づけして生成する技術です。これらの手法は、安定したタンパク質構造に対して強固な成績を示しますが、構造柔軟性の低い IDPs に対しては精度に課題があります。そこで筆者らは、大規模な配列データで訓練されたタンパク質言語モデルを活用して、バインダーのデザインを試みました。特に IDPs に対するバインダーデザインへの取り組みは、言語モデルを用いた既報の応用事例がまだ少なく、本論文の特徴といえます。

筆者らはまず BindEvaluator と呼ばれる、ペプチドバインダーと標的抗原のアミノ酸配列から標的抗原のエピトープを同定する手法を開発しました。これは ESM-2 をベースに、マルチヘッドアテンションレイヤによって全体的な相互作用情報を抽出、最終的にフィードフォワードネットワークと線形層を用いて結合サイトを予測する仕組みとなっています。また、標的タンパク質配列の入力側には、dilated CNN モジュールを追加することで、より局所的な構造特徴を積極的に抽出する工夫もなされています。

これを用いて、設計した候補ペプチドバインダーが望みのエピトープに結合するか評価することによって、バインダーデザインの成功率を上げることができると期待されます。

また筆者らは、過去に PepMLM というペプチドバインダー配列の生成手法を開発しています。

PepMLM: Target Sequence-Conditioned Generation of Therapeutic Peptide Binders via Span Masked Language Modeling
Target proteins that lack accessible binding pockets and conformational stability have posed increasing challenges for drug development. Induced proximity strat...

ランダムに配列をサンプリングするよりも、効率的にバインダーを設計できるとのことで、これを用いて初期候補配列のプールを生成します。この PepMLM により生成した配列を BindEvaluator でスクリーニングする、という流れでバインダーデザインは行われます。

バインダーのスクリーニングでは具体的に、PepMLM から算出される各配列ごとの perplexity と、BindEvaluator から算出される標的エピトープへの結合妥当性を加味したペナルティスコアの2つを指標に、候補配列を選抜していきます。

最終的に、AlphaFold-Multimer の ipTM/pTM 値と、PepDerive(Rosettaベースの相互作用残基を同定するアルゴリズム)から算出される relative interface score を指標にバインダーであるかどうかを計算機で判定しています。

既報の手法との比較や、ウェットでの生成配列の検証などはありませんが、IDPs バインダー生成の実例として貴重で、重要なベンチマークデータとなり得ると感じます。