AlphaFlow:構造アンサンブルを予測できる新手法を紹介

論文タイトル

AlphaFold Meets Flow Matching for Generating Protein Ensembles

出典

AlphaFold Meets Flow Matching for Generating Protein Ensembles
The biological functions of proteins often depend on dynamic structural ensembles. In this work, we develop a flow-based generative modeling approach for learni...

要旨

Flow matching を利用して、構造アンサンブルを予測する手法を紹介した論文です。

用語

Inference-time interventions:推論時介入(推論時にモデルの動作を制御・改善する方法)

解説など

本論文は、タンパク質のアンサンブル構造(タンパク質の柔軟性に基づく多様な構造)を予測する手法です。本ブログでもこれまで、AF2とMSAクラスタリングを活用したアプローチを紹介しました。

以前の記事でも言及した通り、この目的でのデファクトスタンダードは MSA をサブサンプリングしたり、変異導入したり、クラスタリングする方法になります。このような方法論は、”inference-time interventions” (推論時介入)と呼ばれ、推論時に予測モデルを最適化する手法です。

これに対して、筆者らは flow matching を利用して、”training-time” アプローチで構造予測をする方法を開発しています。diffusion や flow matching のようなノイズ除去フレームワークは、回帰モデルを生成モデルとして扱うことができますので、これを AlphaFold や ESMFold のモデルと結合することで、それぞれのネットワークを利用した生成モデルを作成することができます。これを本論文では AlphaFlow、ESMFlow と呼んでいます。

これにより筆者らは、ATLAS データセット由来の構造アンサンブルを学習したモデルを作成することに成功しています。また予測成績について、AlphaFlow・ESMFlowは、MSA サブサンプリングの手法に比べて、多様性の高い構造をサンプリングできることが示されています。今後は、予測精度の高い MSAサブサンプリングと、構造多様性の高い AlphaFlow を目的やバランスを考えて、使い分けていくことになるでしょう。