論文タイトル
ProteinChat: Towards Enabling ChatGPT-Like Capabilities on Protein 3D Structures
出典

Build software better, together
GitHub is where people build software. More than 100 million people use GitHub to discover, fork, and contribute to over 420 million projects.
確認したいこと
深層学習を用いたタンパク質デザイン手法をベンチマークしています。
要旨
ChatGPTのように、タンパク質情報に関する問い合わせを受け付けて回答を返すモデル ProteinChat のコンセプトについて紹介した論文です。
解説など
本文献では、ChatGPTのように、プロンプトからの自然言語を用いた問い合わせによって、タンパク質の構造情報を入手することができるツールである ProteinChat について紹介されています。
モデルは以下の3つのコンポーネントで構成されています。
- GVP-トランスフォーマーブロック:タンパク質構造情報の表現学習
- プロジェクション層:続く言語モデルに情報を渡すためのアライメントとエンベディングを取得
- 大規模言語モデル:入力に対する回答を出力
これにより、ProteinChat では、PDB ファイルなどの構造情報をアップロードした後に、質問を文章で入力すると、アップロードした構造情報に関連する回答をしてくれます。
具体的な質問と回答例が文献上に示されています。
PDB に直接入力されている、もしくはそこから読み取れる情報は、正しく出力できている印象です(鎖の数や分子量、アミノ酸残基数など)。
さらに、そのタンパク質の物理学的性質や生物学的な機能についての質問にも、回答を用意できることが素晴らしいと感じました。具体的な質問例は以下のとおりです。
- Describe this protein in a short paragraph.
- What physiological processes does the protein participate in?
- Can the protein serve as a drug target?
- If so, are there any drugs currently available that target this protein?
- What is the dynamic of this protein?
現状ウェブインターフェースはなさそうですが、コードは公開されているため、実装することはできます。
コメント