【タンパク質デザイン】AF3 から RFDiffusion まで HPC で扱えるコンテナを紹介

論文タイトル

Protein structure prediction and design for high-throughput computing

出典

Just a moment...

要旨

AlphaFold3 や RFdiffusion といった最新のタンパク質構造予測・設計アルゴリズムの実用化・スケーラビリティの向上を目的とした、コンテナ化とマルチモデル統合プラットフォーム(OmniFold)の開発について解説しています。

解説など

本研究の主な貢献は、下記2つです。

  1. 主要アルゴリズムの Singularity コンテナ化
  2. OmniFold:マルチモデル統合ラッパープラットフォーム

1.に関しては、次のアルゴリズムそれぞれのビルドイメージを提供しています。

  • AlphaFold3
  • Chai-1
  • Boltz-2
  • RFdiffusion

それぞれ x86 および ARM アーキテクチャに対応しています。各コンテナは Sylabs の Cloud Library 上に公開されており、singularity pull コマンドでダウンロード可能です。

2.の OmniFold とは、複数の構造予測モデル(AlphaFold3, Chai-1, Boltz-2)を並列実行し、統一的に品質管理するプラットフォームです。OmniFold には次のような特徴があります。

  • 入力ファイルを標準化して各モデルに適応
  • MSAを共有キャッシュして重複計算を削減
  • 出力構造をまとめてHTMLレポートに自動可視化
    • pLDDT(構造信頼度)
    • ipSAE / pDockQ(複合体の相互作用信頼度)

コードはこちらから。

GitHub - EpiGenomicsCode/ProteinDesign-Containers
Contribute to EpiGenomicsCode/ProteinDesign-Containers development by creating an account on GitHub.