論文タイトル
Deep learning molecular interaction motifs from Receptor structure alone
出典
要旨
受容体に結合するペプチドモチーフを予測する手法 MotifGen を紹介した論文です。
解説など
タンパク質間相互作用を予測する手法は世の中に多数存在しますが、筆者らが提案する MotifGen という手法は、実施例や文章表現から受容体や細胞内タンパク質の相互作用にフォーカスを当てた手法のように見受けられます。
MotifGen では、まず標的タンパク質表面をグリッドポイントとしてエンベディングします。タンパク質表面の情報を重点的に特徴量化するアプローチは、MaSIF に近いです。このエンベディングをもとに標的エピトープに対して適合する配列を生成します。このデコーダーでは、生成されるアミノ酸配列を14種のタイプと6つのクラスに分けて分類してそれぞれの生成確率が計算されます。14種のタイプとは20種類の天然アミノ酸を少し丸めたもので、例えば Asp と Glu は同じカルボキシル基を有しているため”ASP”という同一タイプとして認識されます。6つのクラスとは次に示すとおりで、より局所的な相互作用を意識した分類です。
- none
- donor
- acceptor
- donor and acceptor
- aliphatic
- aromatic
このようなアミノ酸の側鎖に応じた特徴量化法は、本手法に特徴的な方法です。
モデルの訓練は PDB に登録された PPI モチーフを使用しています。はじめはタンパク質間相互作用のみのデータを対象に訓練した後、さらに予測精度を高めるためにタンパク質-ペプチド間の相互作用情報のデータを用いてファインチューニングしています。
この MotifGen を利用して、標的タンパク質の構造情報を入力として、そのタンパク質表面に結合するモチーフ配列の傾向を確率として生成することができます。
筆者らは MotifGen のアーキテクチャを利用して、さらに以下の2つのダウンストリームタスク用の予測モデルを構築しました。
- MotifPepScore:ペプチドバインダーの結合判定予測モデル
- MotifSite:低分子リガンドの結合サイト予測モデル
MotifPepScore では、AlphaFold2 の confidence score (plDDT と PAE)とともに MotifGen から独自に計算される MotifGen agreement score に基づいてバインダーの判定が行われます。AF2 はタンパク質全体のグローバルな情報が PPI の判定に活用されるのに対して、MotifGen agreement score はローカルな相互作用様式が積極的に活用されるため、両者が相補的な役割として機能するとのことです。実際に AF2 confidence score 単独で予測した場合と比較して、MotifPepScore は検証データに対して優れた予測成績を示すことが明らかとなっています。
受容体-細胞内タンパク質間の相互作用は、モチーフと呼ぶように強固な高次構造を取らずに、その配列的な特徴が相互作用に重要な役割を果たすことが知られています。したがって局所的な特徴を予測することに適した本手法は、このような相互作用を予測するのに適していると考えられます。