論文タイトル
AB-Bind: Antibody binding mutational database for computational affinity predictions
出典
要旨
32種類の抗原抗体複合体、1101個の変異体のデータが格納されたデータベースである AB-Bind を利用して、抗体の変異デザインと活性の関係性について考察した論文です。
解説など
本日は、抗体の変異体に関連する公知データを探していて、見つけた論文を紹介します。
タンパク質の変異体がその活性にどれくらい影響を与えるかを予測することは、非常に難度の高い課題です。抗体抗原相互作用の親和性を予測することは、その中でもニーズの面から、最も価値のある課題ですが、やはり既存の手法で精度高く予測することはできていないのが現状です。
筆者らは、今後も継続的な技術検討が続いていくこの分野において、ベンチマークとなる変異体解析データをデータセットとして公開しています。その名も”AB-Bind”データベースです。
このデータの中には、32種類の抗原抗体複合体における、1101個の変異体のデータが格納されています。これ以外にも世の中には、様々な変異体解析データはありますが、データの統一感を重要視して、なるべく同じラボの同じ実験系で測定されたデータを優先しているとのことです。
変異体の中には、単一変異のデザインと複数変異が導入されたデザインが、およそ半分ずつくらい登録されています。また、アラニンスキャンの実施例が他のアミノ酸に比べて多いといった特徴があります。
このデータベースは、参照先のPDBIDなど、サマリーデータはまとめられていますが、実験データを含む全データとしてはパブリックに公開されておらず、簡単には利用できませんので、ご注意ください。
筆者らは、このデータベースを活用して、既存のタンパク質解析ツールを用いた活性予測の精度を評価しています。ベンチマークされたツールのリストは以下のとおりです。
- bASA
- Rosetta
- dDFIRE
- DFIRE
- STATIUM
- FoldX
- Discovery Studio
相対的に、FoldXやDiscovery Studioで算出されたΔΔGの値が、最も実験値と相関が良かったと報告されていますが、その成績にはまだ改善の余地があることがわかります。