【AlphaFold】AlphaFold-multimer の予測精度を高める AFProfile の威力

論文タイトル

Improved protein complex prediction with AlphaFold-multimer by denoising the MSA profile

出典

Improved protein complex prediction with AlphaFold-multimer by denoising the MSA profile
Structure prediction of protein complexes has improved significantly with AlphaFold2 and AlphaFold-multimer (AFM), but only 60% of dimers are accurately predict...

確認したいこと

深層学習を用いたタンパク質デザイン手法をベンチマークしています。

要旨

AlphaFold の複合体構造を予測するモードである AlphaFold-multimer の予測精度を高めるための方法について紹介しています。

解説など

背景として、AFM の予測精度は、MSA の品質を高めることがカギであると考えられています。それができれば、他のアルゴリズムの進歩は必要ないとまで言われているくらい MSA は重要な役割をもっています。MSA の品質を高めるために AF では、リサイクルと呼ばれる方法を利用しています。

リサイクルでは、入力する MSA をサンプリングして、入力情報の特徴量を作成し、ネットワーク内に多くの情報を埋め込みます。この MSA プロファイルにノイズを加えることで、精度を上げることができます。実際に CASP15 でもこの方法で、最良の成績を示すことに成功しています。一方でこの手法の問題点は、計算コストが高く、大規模な構造予測計算に適用することができないことです。

筆者らは、これらの問題を改善したプロセス AFProfile を開発しました。

AFProfile では、補正項として、MSA プロファイルにバイアスを加えています。このバイアスは、AFMのネットワークを通して、勾配降下法を実行することで生成される要素です。

筆者らは、本手法を CASP15 で扱った標的に対して適用し、既存の手法に対して予測精度が改善していることを示しています。本論文の結果から得られた重要な示唆としては、MSA のサイズよりも MSA の質が大事ということです。MSA に十分な情報が含まれていなければ、AFProfile は有効に機能しません。

マルチマー予測はバインダーデザインにおいて重要な要素技術ですので、引き続き関連技術を注視していきたいと思っています。

コメント