論文タイトル
Iterative Refinement Graph Neural Network for Antibody Sequence-Structure Co-design
出典
Iterative Refinement Graph Neural Network for Antibody Sequence-Structure Co-design
Antibodies are versatile proteins that bind to pathogens like viruses and stimulate the adaptive immune system. The specificity of antibody binding is determine...
確認したいこと
深層学習を利用した、タンパク質構造予測・デザイン手法をベンチマークしています。
要旨
抗体の構造・配列生成を反復的に精緻化する手法、RefineGNNを提案しています。
用語
- PPL:パープレキシティ
解説など
筆者らはグラフニューラルネットワークを使って、繰り返し修正しながら3次元構造と配列の生成を行う手法を開発しています。既往のGNNを用いた生成モデルには、下記の手法が知られていました。
- G-SchNet:連続的にエッジを生成、以前に生成されたサブグラフを修正できない
- Graphite:エッジのみを予測
これらに対して、筆者らが提案するRefineGNNでは、ノードとエッジをもつ完全なグラフを、不完全な情報から生成することができます。
実施例としては、以下の3種類の課題にRefineGNNを適用していました。
① 配列類似性に基づき作成したデータセットで、抗体の分類問題を解く
モデル構築に使用したデータセットは、SAbDabに登録された4,994の抗体構造です。これをMMseqs2でクラスタリング分類しています。RefineGNNモデルがこの分類に従って、抗体構造を定義できるか検証しています。
② 特定の抗原に結合するHCDR3を生成する
既知の抗原抗体複合体を出発点として、その抗原に結合する抗体のHCDR3を再設計できるか検証しています。
③ 抗コロナウイルス抗体配列を最適化する
CoVAbDabに含まれる抗コロナウイルス抗体2,411個の情報をもとに、モデルを構築しています。
HCDR3配列を生成する際には、以下の4つの制約条件を設定しています。
- 正電荷は-2~2
- グリコシル化モチーフを含まない
- 同じアミノ酸の5回繰り返さない
- 生成配列のパープレキシティを10未満にする
いずれの課題も、比較対象のモデルは、
- LSTM
- AR-GNN
の2つ、評価指標は、
- PPL
- RMSD
を利用しています。既存もモデルに比べて精度の高い予測やデザインができていると主張しています。
コメント