遺伝子・タンパク質の部位変異予測手法まとめ

論文タイトル

Guidelines for releasing a variant effect predictor

出典

Guidelines for releasing a variant effect predictor
Computational methods for assessing the likely impacts of mutations, known as variant effect predictors (VEPs), are widely used in the assessment and interpreta...

要旨

遺伝子の部位変異予測効果を予測する手法を情報整理し、新たに手法を開発する際の公開ガイドラインをまとめた文献です。

解説など

今回は少し毛色の変わったレポートを紹介します。世の中にはバイオロジー関連だけでも、日々とてつもない数のインシリコ予測手法やツールが公開されています。そのような手法を公開する際のガイドラインを提言したのが本文献です。この文献の中では、遺伝子またはタンパク質の部位変異効果を予測する手法(variant effect predictors, VEPs) に特化した内容を解説しています。

インシリコツールは、その性能を評価するために既存の同目的のツールと比較することが必要となってきますので、ベンチマークの難度を下げるためにも環境整備は重要です。

本文に書かれている内容は、VEPsに限らず様々な分野に通じる一般的な内容が多い印象です。代表的なコメントを挙げると下記のとおりになります。

  • コードをオープンソースにすること
  • モデルのパラメータやデータセットを共有すること
  • コンテナイメージを共有すること
  • 推論に必要な計算コストの見積もりを知らせること
  • 予測結果をスコアとして表現する場合は 0 (least) to 1 (damaging) で表すこと
  • 遺伝子とタンパク質の配列を対応付けするときには、UniProt や MANE Select transcript set を使うべき

またこちらのサイトでは、さまざまなVEPsのリストが公開されています。

Variant Effect Predictors — Atlas of Variant Effects Alliance

実際に公開されている手法の数から比べると、リスト化されている数は少ないので注意が必要です。

インシリコツールは、ウェブサーバーに公開されているものも多いですが、そのほとんどがバッチ解析に適さなかったり、時間が経ってサポートされなくなったりで、手法の認知に効果的ではないことが多いので、このような環境整備は重要なことと思います。一方で、このようなコミュニティの維持にも大きな労力がかかり、同じく不確実なものであることもまた、課題であるといえます。