ANARCIとは
抗体の可変領域の構造は、IMGT, Kabat, AHo, Chothiaなどアミノ酸残基のナンバリングスキームにより定義されています。ANARCIはナンバリングのアノテーションがないアミノ酸配列の文字列を、各ナンバリングスキームにアサインすることができるオープンソースのソフトウェアです。
ANARCIはブラウザ上で入力フォームに配列を渡し実行することもできますが、この方法ではバッチ処理できる配列数に限界があります。一方で、ANARCIはPythonに実装されモジュールが公開されているため、これを使えば、配列の前処理やナンバリング後のデータ解析をシームレスに実行することができます。ここではこのツールの実行方法について解析します。
インストール手順
ANARCIの実行に必要な環境は以下のとおりです。
• OS: Linux (検証済み Ubuntu 16.04)
• Python 2.7+
• HMMER3 (version 3.1+ recommended)
下2つはサイトにも記載されているのですが、大事なのはWindows OSにはインストールできないことです。Docker Desktop for Windowsからubuntuイメージ上でインストールしてみたり、仮想環境での実行を試みたのですがうまくいきませんでした。Macでは検証したことがありません。
Linux, Python のインストール方法については、他に譲るとしてHMMERのインストール手順について触れておきます。以下のリンクにHMMERの.tar.gzファイルがありますので、ターミナルから下記のコードを実行しインストールします。
wget http://eddylab.org/software/hmmer/hmmer-3.3.tar.gz \
&& tar zxf hmmer-3.3.tar.gz \
&& cd hmmer-3.3 \
&& ./configure --prefix /build \
&& make \
&& make check \
&& make install \
&& cd .. \
&& rm -rf hmmer-3.3.tar.gz \
最後にANARCIをインストールしましょう。以下のURLからgit cloneして.pyファイルをインストールすれば完了です。
git clone http://github.com/oxpig/ANARCI.git
cd ANARCI && python setup.py install
実行手順
READMEにコマンドや引数について説明されています。
ANARCI -i <配列> で渡した配列に対する抗体構造を出力することができます。
利用できる引数は以下のとおりです。
-i | 入力する配列またはfastaファイルを指定 |
-o | 出力先のファイル名を指定 |
–csv | csv形式で出力 |
-s | ナンバリングスキームを指定 (kabat, aho, wolfguy, imgt, a, c, chothia, i, k, m, w, martin) |
-r | 解析する抗体鎖型を指定 (ig, tr, heavy, light, H, K, L, A, B) |
–assign_germline | 各配列に対してv/j ジャームラインを出力 |
–use_species | ジャームラインのアサインに使用する動物種を指定 |
コメント