【バイオインフォ】”descriptor” とは

論文タイトル

Recent applications of deep learning and machine intelligence on in silico drug discovery: methods, tools and databases

出典

Brief Bioinform. 2019 Sep 27;20(5):1878-1912.

Recent applications of deep learning and machine intelligence on in silico drug discovery: methods, tools and databases - PubMed
The identification of interactions between drugs/compounds and their targets is crucial for the development of new drugs. In vitro screening experiments (i.e. b...

確認したいこと

タンパク質情報を記述するための”descriptor”について

要旨

低分子化合物(drug)と標的タンパク質(target)の関係を、in silicoで予測するための方法論について、広く解説されています。

用語

  • VS: virtual screening
  • ATCコード: 解剖治療化学分類法(医薬品の分類)
  • DTI: drug-target interaction

章立て

  1. 緒言
  2. バーチャルスクリーニングのための記述子と、その特徴
    1. 化合物のための記述子
    2. 標的タンパク質のための記述子
  3. バーチャルスクリーニングのためのライブラリとツールキット
  4. データベースとデータセット
    1. 化合物、生物活性、標的タンパク質のためのデータベース
    2. 信頼性の高いデータセット
  5. 機械学習アプリケーション
    1. 類似性ベースアプローチ
    2. 特徴情報ベースアプローチ
    3. 深層学習
    4. 評価指標、性能比較
  6. 考察・結言

考察など

低分子化合物に関わる情報が主題ですので、タンパク質工学に関する情報は少ない印象です。

標的タンパク質の記述子は、以下の6種類に分類されます。

  • 配列組成(アミノ酸残基)
  • 物理化学的特性(親水性、極性、電荷、2次構造など)
  • タンパク質間の類似性
  • トポロジー(分子グラフから作成された、原子間の結合を指標)
  • 幾何学的特性(形状、サイズ、原子位置、ねじれ角など)
  • 機能特性

各機械学習予測モデル(サポートベクターマシン、ランダムフォレストなど)において、どのdescriptor が適しているか、評価された報告が複数あります。基本的に、各指標を組み合わせたdescriptor でよい成績を残しており、クリティカルな単一の指標があるわけではないとのことでした。

コメント