【配列デザイン】CNNでタンパク質の主鎖構造から配列をデザイン

論文タイトル

Protein sequence design with a learned potential

出典

Nat Commun. 2022 Feb 8;13(1):746.

Protein sequence design with a learned potential - PubMed
The task of protein sequence design is central to nearly all rational protein engineering problems, and enormous effort has gone into the development of energy ...

確認したいこと

先日の記事で、バインダーデザイン手法について紹介しました。

【230117】

この論文で引用されていた配列デザイン手法について、その詳細を確認してみたいと思います。

要旨

タンパク質の主鎖構造から、深層学習を利用して、配列をデザインする手法について紹介します。

解説など

これまで紹介した配列デザイン手法の代表格は、ProteinMPNNと呼ばれる手法です。

紹介記事を公開した後、この手法はScienceにも掲載されました。

Robust deep learning-based protein sequence design using ProteinMPNN - PubMed
Although deep learning has revolutionized protein structure prediction, almost all experimentally characterized de novo protein designs have been generated usin...

対して今回紹介する手法は、これより早く、2022.02にNat Commun.に公開された論文です(2020.01にbioRxivにも公開)。筆者らはタンパク質構造をCNNを用いて、モデルを構築しています。ネットワークは自己回帰的にアミノ酸の種類と側鎖のロータマー角を予測して、配列をデザインしていく流れです。訓練用のX線結晶構造データには、CATHのデータベースから取得したデータを利用しています。

この手法を用いて、筆者らはデノボでデザインしたTIMバレル構造の配列設計を試みています。

これまで紹介した文献と比べると出自が古く(2020なのに…)、様々な角度からデザインしたタンパク質の評価結果が解析された丁寧な論文です。

コメント