論文タイトル
A new clustering of antibody CDR loop conformations
出典
J Mol Biol. 2011 Feb 18;406(2):228-56.

確認したいこと
RosettaAntibodyで活用される抗体構造データセットPyIgClassifyにアノテートされた、構造分類の特徴について確認しました。
要旨
抗体(CDR)の新規な分類データセットを紹介した論文です。
解説など
Rosettaの抗体デザインアルゴリズムRAbDにおいては、探索対象の抗体構造データベースに、PylgClassifyが利用されています。PylgClassifyでは、多様な抗体配列のCDRが、構造に基づきクラスタリングされた形で整理されています。そのクラスタリング手法や分類結果の詳細な解説が、本記事で紹介する論文に記載されています。
抗体構造の分類の歴史を先に述べると、まず、Chothia・Lesk・Thorntonらが提案したカノニカル構造が、先駆的な分類になります。この分類においては、ループ長に大きく依存せず、少数の重要な残基をもとに構造分類をおこなわれています。これに続く研究において、Al-Lazikani・Martinらは、ループ長に基づく構造分類を定義しました。
次第に利用可能な抗体構造が蓄積されるにつれ、構造に着目した分類手法も提案されるようになります。構造に基づく分類の主要課題はH3の分類です。Moreaらは、H3をtorso領域と、head領域に分けて解釈することで、抗体の構造がある程度制限されることを見出しました。
本論文においては、時が経ち利用可能な抗体構造の数が大幅に増加したことを契機に、分類定義の更新を試みています。
クラスタリングに利用したデータセットとしては、PDBに登録されたユニークな337種の重鎖と、311種の軽鎖を用いています。十分なデータ量を活用できることから、低分解能の構造や、高いB-factor、またはエネルギー的に不安定なループを示す抗体は対象から厳しく除外しています。本手法ではChothiaの分類手法とは異なり、ループ長ごとに分類する方法を採用しています。
本手法で分類されたクラスを例を挙げると、各クラスタは「L1-12-3」のように示されます。これは「LCDR1」におけるループ長12merのメインカテゴリにおける、3番目のサブカテゴリであることを表しています。例えば、「L1-12」には12種類の抗体構造が登録されており、それらが3種類のサブカテゴリに分類されています。
実際に分類を試みると、分類の難度が、CDR領域またはループ長ごとに以下の3種類にわかれるとのことでした。
- Type I: 大部分が1つの立体構造を占めている
- Type II : カテゴリ内で複数の構造をもつが、各クラスタ間は厳密に定義できる
- Type III: 構造予測が困難または統計的に不確実な分類になってしまう
H3を除いた領域(L1, L2, L3, H1, H2)ではそれぞれの割合が、TypeI: 50%、TypeII: 43%、TypeIII : 7%で存在します。これは、非H3において、その8割以上が構造予測可能であることを示しています。
原著では、カテゴリごとの特徴について詳細に言及しています。各論となるので、本記事では割愛させてください。汎化できそうな原理を見出すことは難しそうな印象を受けました。
大要としては、やはり本結果の方がデータ量が多いため、既往のクラスタリングでは同定されなかった新しいクラスタを見出せていることが強く主張されていました。
コメント