論文タイトル
HelixDiff, a Score-Based Diffusion Model for Generating All-Atom α-Helical Structures
出典
要旨
HelixDiff という拡散モデルで、ヘリックス構造を生成する手法を紹介した論文です。
解説など
αヘリカル構造に特化した構造生成モデルの紹介です。筆者らは同じくヘリックスペプチドを生成するモデルとして、過去に HelixGAN という手法を構築しています。同種の課題を拡散生成モデルで解決したのが、本ブログで紹介する HelixDiff という手法です。
このモデルでは、score-based 拡散モデルを採用し、全原子を生成します。エンコーディングは、画像生成における特徴量抽出のアプローチを参考にしていて、ワンホットエンコーディングで処理された配列情報とともに、ねじれ角、結合角、平面角、側鎖情報などからなる構造情報を取り扱います。
訓練データは、HelixGAN と同じとのことですが、HelixGAN 側の原著論文にも詳細は記載されていないように見受けられます。筆者らが独自に準備したおよそ300万のヘリックスペプチドが使われているとのことですので、モデルも含む構造データであることが想像されます。
HelixDiff の性能評価として、HelixGAN と比較したところ、HelixDiff は訓練構造の尤度分布をより正確に再現しているとのことで、拡散生成モデルの有用性を強く示しています。
筆者らは HelixDiff を活用した実施例として、GLP-1 アナログのデザインを試みています。native GLP-1 と GLP-1 受容体の複合体構造を入力情報として、コンディショナルにGLP-1アナログを生成することで、GLP-1 を機能を阻害するアンタゴニスト分子をデザインできたことが示されています。またデザインされたペプチドはプロテアーゼに対する耐性も持っているとのことです。
公開されたコードには、unconditional, conditional 両方の訓練コードとサンプリングコードが含まれています。