【バインダーデザイン】非天然アミノ酸を有するペプチドバインダーを設計できる EvoBindRare を紹介!

論文タイトル

RareFold: Structure prediction and design of proteins with noncanonical amino acids

出典

Just a moment...

要旨

非天然アミノ酸(noncanonical amino acids, NCAAs)を含むタンパク質の構造予測とデザインを目的とした深層学習モデル「RareFold」を開発し、その有用性を実験的にも示した最先端の研究です。

解説など

RareFold は、非天然アミノ酸を含む線形・環状ペプチドの構造を予測するモデルです。

RareFoldは、AlphaFold2 の EvoFormer アーキテクチャを拡張し、

  • 20の標準アミノ酸
  • 29種のNCAA

をユニークなトークンとして扱い、それぞれに特化した構造パターンを学習します。

論文では RareFold を AlphaFold3 と比較し、以下のような結果が得られています。

  • 精度:RareFoldは、NCAA を含む構造でも高精度に構造予測可能(side chain RMSD も良好)。
  • 速度とメモリ効率:AF3 が OOM(メモリ不足)で失敗した例も RareFold は40GBで処理可能。
  • MSE や SAH など特定 NCAA で AF3 を上回る性能(AF3 は原子の重なりなどのアーティファクトが多く、現実的構造を予測できない場合がある)。

筆者らはさらに、この RareFold を用いて、線状および環状のペプチドバインダーをデザインするフレームワーク「EvoBindRare」を開発しています。これは EvoBind を参照したペプチドバインダー設計モデルです。

RareFold は各アミノ酸を「ユニークなトークン」として扱うため、新しいアミノ酸をトークンとして登録し、それに対応する構造情報(原子座標・局所フレーム)を追加するだけで拡張可能です。論文では29種類のNCAAを定義するためにAlphaFold2の既存アミノ酸フレームを拡張する方法が明示されています(Githubコード参照)。このコードによりユーザーがカスタマイズして任意の非天然アミノ酸を扱うことができます。

実施例では、RNaseAを対象に、32種のアミノ酸から10-20残基のペプチドを設計し、26万の配列を探索しながら、最終的にμMレベルの結合親和性(Kd = 2.13, 8.77 μM)をもつペプチドを同定することに成功しています。

コードはこちら。

GitHub - patrickbryant1/RareFold: Structure prediction and design of proteins with noncanonical amino acids
Structure prediction and design of proteins with noncanonical amino acids - patrickbryant1/RareFold