【de novoデザイン】拡散モデルを利用したタンパク質デザイン手法を紹介

Protein Structure and Sequence Generation with Equivariant Denoising Diffusion Probabilistic Models

“Diffusion Probabilistic Models”をタンパク質デザインに応用した手法を提案した論文です。

画像解析において、ここまで活躍している深層学習が、タンパク質構造予測や設計においては、いまだ課題の多い状況であるのは、以下の理由が挙げられると、筆者らは述べています。

特に３番目は納得の理由と感じます。同じ複雑さを有していたとしても、1本の鎖で結ばれていることによる非独立性は考慮に入れる必要があります。

筆者らは、数あるタンパク質設計におけるモデルの中で、拡散モデルを活用しています。モデルの訓練はPDBに登録されたCATH4.2データセットを使用しています。筆者らは、訓練したモデルで、

の2種類のデザインを検討しています。

デノボデザインの結果からは、以下の結果が示されました。

これに対して、inpaintingの検討結果は、次のとおりでした。

拡散モデルの利用は、既往の手法と比較しても珍しいアプローチです。これまで提唱されたモデルをベンチマークとした比較検証が期待されます。