Masked Language Modelをどう使いこなすか？抗体設計におけるサンプリング戦略の重要性

How to make the most of your masked language model for protein engineering

本研究では、タンパク質工学におけるマスク付き言語モデル（MLM）の活用方法として、新しいサンプリング手法を提案し、その有効性をin silicoおよびin vitro実験で検証しています。

本研究は、「タンパク質言語モデルをどう使うか？」という実務的な課題に焦点を当てています。特に抗体設計において、モデルそのものだけでなく「サンプリング方法」が重要である点を明確にしています。

従来は「mutation-centric（変異中心）」のサンプリングが主流でした。

これは以下のような方法です：

しかし本文では、これらの手法について、

と指摘されています。

本研究のコアはここです。

という発想に切り替えています。

具体的には：

この方法により：

とされています。

抗体設計では1つの指標だけでは不十分です。

本研究では：

といった方法を用いて、複数の目的（例：結合・安定性）を統合しています。

本手法を採用した実験評価から以下の結果が得られています。

in silico（計算評価）

in vitro（実験）