論文タイトル
Rapid and Sensitive Protein Complex Alignment with Foldseek-Multimer
出典
Just a moment...
要旨
タンパク質複合体の構造アライメントを高速に行えるツール Foldseek-Multimer を公開した論文です。
解説など
タンパク質間のホモロジーを探索するには、1次構造(アミノ酸配列)の情報に基づいて探索する手法と、高次構造に基づいて探索する手法があります。本論文では、後者の高次構造に基づいて探索する手法の紹介です。これまでは、US-align というアライメント手法がこの目的におけるゴールドスタンダードの手法でした。また QSalign は、US-align に対して計算速度の高速化に主眼をおいた新法として知られています。
AlphaFold の成功も相まってこれまでに多数のタンパク質構造が公開されています。またその構造多様性も増しており、単鎖タンパク質だけでなく、タンパク質複合体の構造解析も盛んにおこなわれています。このような状況下で、US-align や QSalign では、大規模の構造データセットに対してその構造アライメントを全探索で行うのが計算資源的に現実的ではない、という課題がありました。
この論文では、過去に公開された構造アライメントツールである Foldseek をマルチマータンパク質に対して適応できるように改良し、既存のアライメントツールと同精度ながら超高速で解析することを実現しました。この”Foldseek-Multimer”の特徴をまとめると、以下のようになります。
- US-alignと同等の精度
- 低い配列類似度の構造にも対応可能
- “billions of complex-pairs”の探索を24時間で可能
Foldseekのコードは、既報のツールに実装されています。
GitHub - steineggerlab/foldseek: Foldseek enables fast and sensitive comparisons of large structure sets.
Foldseek enables fast and sensitive comparisons of large structure sets. - steineggerlab/foldseek