論文タイトル
Learning from Protein Structure with Geometric Vector Perceptrons
出典
Learning from Protein Structure with Geometric Vector Perceptrons
Learning on 3D structures of large biomolecules is emerging as a distinct area in machine learning, but there has yet to emerge a unifying network architecture ...
確認したいこと
- 深層学習を利用した、タンパク質デザイン手法
要旨
Geometric Vector Perceptornsを活用したGNNモデル”GNN-GVP”でタンパク質の計算機デザインをする手法を紹介した論文です。
用語
- CNN: Convolutional Neural Network
- GNN: Graph Neural Network
- GVP: Geometric Vector Perceptrons
- CPD: Computational Protein Design
- MQA: Model Quality Assessment
解説など
背景
先日の記事でGNNを利用した初期のタンパク質デザイン手法”Structured Transformer”について解説しました。
GNNは、残基間相互作用に着目して、残基間の関係性を学習することに活用されます。
深層学習を活用したタンパク質の構造予測・デザインには、CNNも活用されていました。このモデルでは、タンパク質をアミノ酸残基の座標や向きで表現し、その幾何学的な性質を直接取り扱うことが一般的です。
筆者らは、新たにGeometric Vector Perceptorns(GVP)を導入することで、この幾何学的な性質とリレーショナルな性質の両方を、情報量を落とすことなく学習したモデルGVP-GNNを提案しています。
本論文では、構築したモデルを、タンパク質のデザイン(CPD)とその構造予測(MQA)に適用しています。
モデルの性能評価
GNN-GVPは、下記の基準において、あらゆるベンチマーク技術と比較して優れた成績を示していました。
CPD
- 比較対象:Structured GNN / Structured Transformer
- 評価指標:配列の回収率
QSA
- 比較対象:SASHAN / FaeNNz / VoroMQA / ProQ3D etc.
- 評価指標:GDT-TSの予測値と、真値との相関
コメント