論文タイトル
AF2BIND: Predicting ligand-binding sites using the pair representation of AlphaFold2
出典
要旨
AlphaFold2(AF2)のペア表現を利用して、新しいモデルAF2BINDを訓練し、ターゲットとなるタンパク質だけを与えられた場合に、小分子の結合部位を正確に予測することを試みています。
解説など
標的抗原のリガンド結合部位を予測する方法は、このブログでも紹介してきました。
これ以外にも、ESM-IFやProteinMPNNなどの既存ツールを用いて、リガンドが結合しやすい疎水性・極性クラスターを探索する方法があります。
コラム タンパク質が結合しやすいフラストレーション領域とは
この論文内では、”frustrated regions”(フラストレーション領域)と呼ばれるタンパク質領域の特徴について、紹介されていました。”frustrated regions” は、タンパク質の特定の領域を指し、これらの領域は通常、タンパク質の構造や機能において特別な振る舞いを示します。具体的には、これらの領域は結合部位の予測において、重要な役割を果たし、リガンドとの相互作用を持つ可能性があります。
frustrated regions は、タンパク質の特定の領域で、構造的なコンフリクトやエネルギーの不一致が存在する場合にしばしば観察されます。これらの領域は、タンパク質の他の領域とは異なり、局所的なエネルギーの最小値に捉われず、異なる構造的状態を取ることができます。これにより、リガンド結合や他のタンパク質との相互作用において、重要な役割を果たすことができます。
筆者らは、AF2を用いて、リガンド結合部位を予測することを試みました。彼らが開発したツールは、AF2BINDと命名されています。これを実現するためのコンセプトは下記の3つです。
AlphaFold2のペア表現の利用
AF2BINDは、AF2の内部ペア表現を利用して訓練されており、これによりターゲットとなるタンパク質のみを与えられた場合に、小分子の結合部位を正確に予測することができます。
20の「Bait」アミノ酸の使用
AF2BINDは、小分子リガンドが存在しない場合に結合信号を最適に抽出するために、20の「Bait」となるアミノ酸を使用します。これらの餌アミノ酸のユニークな組み合わせは、リガンドの化学的性質と相関しています。
シンプルなロジスティック回帰モデルの使用
AF2BINDのロジスティック回帰モデルは、意図的にシンプルに保たれており、これによりモデルの解釈が容易になっています。しかし、これによりモデルの改善の余地が残されています。
実際にAF2BINDを活用すると、下記に示す他のモデルに比べて優れた予測能を示していました。
- AlphaFold2
- ESM2
- ESM-IF
モデルには、シンプルなロジスティック回帰モデルを使用しており、まだ改善の余地が残されていそうです。今後の発展に期待しましょう。
コードは、こちら。