論文タイトル
One-sided design of protein-protein interaction motifs using deep learning
出典

確認したいこと
- 結合分子のde novoデザイン手法
要旨
タンパク質間相互作用モチーフをデザインための、イメージキャプションアルゴリズムを利用した深層学習手法iNNterfaceDesignを開発した。
解説など
画像キャプション生成
これまで、深層学習を活用したタンパク質のデザインには、タンパク質骨格を構築する手法は存在しましたが、タンパク質間相互作用モチーフをデザインした事例はありませんでした。
本論文では、それをイメージキャプションアルゴリズムを利用することで達成しています。
イメージキャプションについての解説は、以下のリンクに詳しく記載されていました。

画像キャプション生成(Image Captioning)とは,1枚の画像を入力として,その画像中で行われている出来事や人物・動物などの振る舞いなどを説明するキャプション(caption)の文章を生成する問題である.
タンパク質複合体の3次構造から、結合モチーフとなるアミノ酸配列を生成する、というイメージでしょうか。
iNNterfaceDesign
筆者らが結合モチーフデザインのために開発した、iNNterfaceDesignと呼ばれるパイプラインは、以下の3つのモデルが組み合わさったフレームワークです。
- PepBB:エピトープに結合する6残基の構造骨格を生成
- PepBBE:生成された主鎖骨格を延長
- pepSeP:アミノ酸配列を生成
PepBBによる骨格デザインには、さらに以下の3つのモデルを利用しておこなわれます。
- Positioning Model:おおよそのモチーフの位置と配向を予測
- Secondary Structure Predicting Model:モチーフの2次構造を予測
- Pose Designing Model:主鎖原子の座標位置を予測
ところどころ、Rosettaの構造解析ツールを利用しています。
結果
生成したペプチドの2次構造の種類ごとに予測成績が表でまとめられています。予測精度を評価するうえで、様々な見慣れない指標を算出している点が印象的です。
やはり、ヘリックスフラグメントにおける予測精度が最も高く、ループ様の構造が低い結果です。しかし数値上の差はそこまで大きくないように感じます。程度の詳細を理解するには、指標の意味を理解する必要がありそうです。
本論文では、この手法を用いてHAとSARS-CoV-2のRBDに対する結合分子のデザインを行っているものの、ウェットでの検証はありませんでした。考察においてはモノクローナル抗体のデザインについても言及されており、生成したモチーフはCDR3への移植も可能とのことです。
以下にコードが公開されています。ぜひご覧ください。
追加調査したいこと
- イメージキャプションについて
- 公開コードの仕様
コメント