【抗体デザイン】多様な Ig ドメインライブラリを計算機で生成してみたところ・・・

論文タイトル

The structural landscape of the immunoglobulin fold by large-scale de novo design

出典

https://www.biorxiv.org/content/10.1101/2023.10.03.560637v1

要旨

安定で構造多様性のある、イムノグロブリンスキャフォールドライブラリを計算機でデザインし、その構造的特徴について考察しています。

解説など

βシート構造のデザインは、以下の理由から一般的に難しい課題であると認識されてきました。

  • 表面に位置するβストランド間の相互作用が、モノマー形成を妨げる
  • フォールディング速度が遅く、最安定構造を取ることが難しい

この問題を解決するため、フラグメントアセンブリ手法が現れましたが、これによって生成されるデザインの構造的多様性は、折り畳みに有利なループ構造を列挙する必要があるため、実用が制限されているのが現状です。

筆者らがデザインを試みているイムノグロブリンフォールドも、典型的なβサンドイッチ構造を示すタンパク質です。抗体は、7つのβシートが重なって形成される構造になります。筆者らは以前の研究で、向かい合うβシート間を結ぶループ構造が、全体構造の配向のカギになっていることを突き止めました。このことを応用して、彼らはこれまでに、特定のループ構造をもつβシートの組み合わせを使用した、フラグメントアセンブリベースの計算手法で、Igドメインを新規に設計できることを示しています。

このような背景を踏まえてこの論文では、多様な方法でIgドメインを生成して、構造的に安定かつ多様なIgドメインライブラリを構築することを試みています。筆者らがライブラリをデザインするためにとったアプローチは、下記のとおりです。

  • パラメトリックデザイン
  • ProteinMPNN + RFDesign (inpainting)
  • RFDiffusion (Fold conditioning or Motif scaffolding)

全てのデザインを合わせると、およそ50,000個のライブラリになります。生成過程を含めると計400万(パラメトリックデザインから約250万、ProteinMPNNから約145,000、Inpaintingから310,000、RFDiffusionから100万)もの配列をデザインしたことになります。この400万の構造はAF2で予測されて、その特徴が解析されています。

具体的には、AF2 の出力結果(RMSDやplDDT)やABEGO分類をもとに、天然構造と配列群の分布パターンを比較しています。また一貫して、βシート間のねじれ角について観察していることも本研究の特徴です。既存の生成手法は RFDiffusion まで含めていずれも、正の回転角をもつ構造を生成することが難しいとのことです。

このような研究が、実応用における機能ドメイン(CDRループなど)のデザインにどのように還元されるか興味深いところです。