【de novo design】ついにバインダーデザインが深層学習でも可能に

論文タイトル

One-sided design of protein-protein interaction motifs using deep learning

出典

One-sided design of protein-protein interaction motifs using deep learning
Protein-protein interactions are part of most processes in life and thereby the ability to generate new ones to either control, detect or inhibit them has unive...

確認したいこと

  • 結合分子のde novoデザイン手法

要旨

タンパク質間相互作用モチーフをデザインための、イメージキャプションアルゴリズムを利用した深層学習手法iNNterfaceDesignを開発した。

解説など

画像キャプション生成

これまで、深層学習を活用したタンパク質のデザインには、タンパク質骨格を構築する手法は存在しましたが、タンパク質間相互作用モチーフをデザインした事例はありませんでした。

本論文では、それをイメージキャプションアルゴリズムを利用することで達成しています。

イメージキャプションについての解説は、以下のリンクに詳しく記載されていました。

画像キャプション生成 (Image Captioning): (1) 基本編 | CVMLエキスパートガイド
Image Captioning (画像キャプション生成) とは,1枚の画像を入力としてその画像全他の様子を表す説明文(キャプション,字幕)を1文生成する問題である.この「基本編(1)」では,そのうち2018年頃までに確立されていく基礎的な手法を,歴史順に4つに分けて紹介する.

画像キャプション生成(Image Captioning)とは,1枚の画像を入力として,その画像中で行われている出来事や人物・動物などの振る舞いなどを説明するキャプション(caption)の文章を生成する問題である.

タンパク質複合体の3次構造から、結合モチーフとなるアミノ酸配列を生成する、というイメージでしょうか。

iNNterfaceDesign

筆者らが結合モチーフデザインのために開発した、iNNterfaceDesignと呼ばれるパイプラインは、以下の3つのモデルが組み合わさったフレームワークです。

  • PepBB:エピトープに結合する6残基の構造骨格を生成
  • PepBBE:生成された主鎖骨格を延長
  • pepSeP:アミノ酸配列を生成

PepBBによる骨格デザインには、さらに以下の3つのモデルを利用しておこなわれます。

  • Positioning Model:おおよそのモチーフの位置と配向を予測
  • Secondary Structure Predicting Model:モチーフの2次構造を予測
  • Pose Designing Model:主鎖原子の座標位置を予測

ところどころ、Rosettaの構造解析ツールを利用しています。

結果

生成したペプチドの2次構造の種類ごとに予測成績が表でまとめられています。予測精度を評価するうえで、様々な見慣れない指標を算出している点が印象的です。

やはり、ヘリックスフラグメントにおける予測精度が最も高く、ループ様の構造が低い結果です。しかし数値上の差はそこまで大きくないように感じます。程度の詳細を理解するには、指標の意味を理解する必要がありそうです。

本論文では、この手法を用いてHAとSARS-CoV-2のRBDに対する結合分子のデザインを行っているものの、ウェットでの検証はありませんでした。考察においてはモノクローナル抗体のデザインについても言及されており、生成したモチーフはCDR3への移植も可能とのことです。

以下にコードが公開されています。ぜひご覧ください。

GitHub - strauchlab/iNNterfaceDesign
Contribute to strauchlab/iNNterfaceDesign development by creating an account on GitHub.

追加調査したいこと

  • イメージキャプションについて
  • 公開コードの仕様

コメント