論文タイトル
Antibody structure prediction using interpretable deep learning
出典
Patterns (N Y). 2021 Dec 9;3(2):100406.

確認したいこと
先日の記事で、FvHallucinatorという抗体のde novoデザイン手法について取り上げました。
ここには、DeepAbという抗体構造を予測する手法が利用されています。本手法の詳細な原理を理解するために、引用論文を確認してみました。
要旨
抗体構造を予測するための深層学習手法である、DeepAbを紹介した論文です。
解説など
メソッド
DeepAbは、①残基間の距離と方向を予測するためのディープニューラルネットワークと、②ネットワーク予測から構造を生成するためのロゼッタベースのプロトコルで構成されています。
最初のステップは、FV構造を予測するディープニューラルネットワークです。トランスフォーマーモデルは、タンパク質配列の教師なし学習でますます人気が高まっていますが、本手法では、利用可能な限られたデータからの訓練を容易にするために、リカレントニューラルネットワーク(RNN)モデルを選択しています。
モデルは、
- Observed Antibody Space(OAS)データベースからの、118,386ペアの重鎖および軽鎖配列
- Structural Antibody Database(SAbDab)からの、1,692 FV構造の非冗長(99%の配列同一性)セット
を使用して訓練されます。
このモデルは、入力として重鎖と軽鎖の配列のみを必要とし、出力構造はアミノ酸残基ペア間の相対距離と方向として表されます。
一般的なCPUで、5つの候補構造を10分で予測できるため、グラフティングのみのアプローチ(シーケンスあたり数秒から数分)よりは遅くなりますが、大規模なループサンプリング(シーケンスあたり数時間)よりも大幅に高速に生成することができます。
結果
ベンチマーク用に以下のデータセットが活用されました。
- RosettaAntibodyベンチマークセット(47ターゲット)
- 抗体の開発適性を評価するために用意されたの臨床試験の治療用抗体(45ターゲット)
このデータセットを使い、DeepAbのパフォーマンスを以下の既往のメソッドと比較しています。
- RosettaAntibody-G
- RepertoireBuilder
- ABodyBuilder
比較結果から、DeepAbは、解析されたすべての測定基準で、いずれのグラフティングベースの手法よりも高い予測精度を示しました。一般に、すべてのメソッドは、H3ループが長くなるとパフォーマンスが低下するのですが、DeepAbはパフォーマンス低下の程度が低く、いずれのループ長に対しても最も正確なモデルを作成しています。
モデルの解釈性
ネットワークの各出力ブランチは、主にCDRループを取り巻く各残基に対応します。またCDR3ループの場合、ネットワークは、ループのコンフォメーションと全体的な方向との相互依存性を反映しているとのことです。
H3ループ内においては、C末端のねじれを形成する残基に最も注意が向けられていることがわかりました。この構造的特徴の重要性は、既往の報告からも指摘されていましたが、このモデルでもそれに着目していたとのことです。
抗体設計
DeepAbを抗体のデザインに利用できるか検証するために、対象となる抗体において抗原結合に有益な変異を同定できるか評価しています。
筆者らが抗リゾチーム抗体に対して適応したところ、抗原についての明確な知識がないにもかかわらず、ネットワークは酵母ディスプレイパニングによる実験的な結合濃縮を予測していました。
DeepAbのコードは以下にあります。RNNを用いた代表的な抗体デザインツールとして、一度お試しに利用してみてはいかがでしょうか。
コメント