ANARCIとは
抗体の可変領域の構造は、IMGT, Kabat, AHo, Chothiaなどアミノ酸残基のナンバリングスキームにより定義されています。ANARCIはナンバリングのアノテーションがないアミノ酸配列の文字列を、各ナンバリングスキームにアサインすることができるオープンソースのソフトウェアです。
ANARCIはブラウザ上で入力フォームに配列を渡し実行することもできますが、この方法ではバッチ処理できる配列数に限界があります。一方で、ANARCIはPythonに実装されモジュールが公開されているため、これを使えば、配列の前処理やナンバリング後のデータ解析をシームレスに実行することができます。ここではこのツールの実行方法について解析します。
インストール手順
ANARCIの実行に必要な環境は以下のとおりです。
• OS: Linux (検証済み Ubuntu 16.04)
• Python 2.7+
• HMMER3 (version 3.1+ recommended)
下2つはサイトにも記載されているのですが、大事なのはWindows OSにはインストールできないことです。Docker Desktop for Windowsからubuntuイメージ上でインストールしてみたり、仮想環境での実行を試みたのですがうまくいきませんでした。Macでは検証したことがありません。
Linux, Python のインストール方法については、他に譲るとしてHMMERのインストール手順について触れておきます。以下のリンクにHMMERの.tar.gzファイルがありますので、ターミナルから下記のコードを実行しインストールします。
wget http://eddylab.org/software/hmmer/hmmer-3.3.tar.gz \
    && tar zxf hmmer-3.3.tar.gz \
    && cd hmmer-3.3 \
    && ./configure --prefix /build \
    && make \
    && make check \
    && make install \
    && cd .. \
    && rm -rf hmmer-3.3.tar.gz \
最後にANARCIをインストールしましょう。以下のURLからgit cloneして.pyファイルをインストールすれば完了です。
git clone http://github.com/oxpig/ANARCI.git
cd ANARCI && python setup.py install
実行手順
READMEにコマンドや引数について説明されています。
ANARCI -i <配列> で渡した配列に対する抗体構造を出力することができます。
利用できる引数は以下のとおりです。
| -i | 入力する配列またはfastaファイルを指定 | 
| -o | 出力先のファイル名を指定 | 
| –csv | csv形式で出力 | 
| -s | ナンバリングスキームを指定 (kabat, aho, wolfguy, imgt, a, c, chothia, i, k, m, w, martin)  | 
| -r | 解析する抗体鎖型を指定 (ig, tr, heavy, light, H, K, L, A, B)  | 
| –assign_germline | 各配列に対してv/j ジャームラインを出力 | 
| –use_species | ジャームラインのアサインに使用する動物種を指定 | 

  
  
  
  

コメント