抗ウイルス薬の包括的データベースを機械学習で分析

論文タイトル

VDDB: a comprehensive resource and machine learning platform for antiviral drug discovery

出典

VDDB: a comprehensive resource and machine learning platform for antiviral drug discovery
Virus infection is one of the major diseases that seriously threaten human health. To meet the growing demand for mining and sharing data resources related to a...

確認したいこと

抗ウイルス薬に関連するデータを統合化し、機械学習で分析した論文が紹介されていました。具体的にどのような特徴量から、何を推論しているのか、詳細を確認してみました。

要旨

ウイルスに対するワクチン・抗体・化合物の情報を、vitroの活性から知見情報まで、多面的かつ網羅的に格納したデータベースを紹介した論文です。

解説など

本報告は、華南理工大学(South China University of Technology)からです。治療標的となり得る低分子・抗体・ワクチンと、そのウイルスへの項かとの関係を明らかにするために、既存のデータを統合したデータベース(VDDB)が公開されています。

https://vddb.idruglab.cn/

具体的なデータセットは、下記のとおりです。

臨床データベース
  • ClinicalTrial.gov
治療標的データベース
  • TTD
低分子化合物・生物学的活性データベース
  • ChEMBL
  • PubChem
標的分類、遺伝子、配列、機能、構造、疾患などのデータベース
  • Uniprot
  • TDD
  • PDB
  • Reactome

筆者らは、上記リンクの通り、これらのデータにアクセスできるUIの整備にも取り組んでいます。またこれらのデータを活用した予測モデルの構築し、公開されています。データベースに登録された化合物が、どのウイルスに対して活性があるかを予測するモデルを構築しています。様々な機械学習・深層学習ネットワークモデルを作成し、その性能を比較評価しています。

VDDBの作成には、かなりな部分を手動でアノテートされているそうで、持続的な拡張性に関しては課題が残っていると感じました。

コメント