佐川急便所属のサンタさんがPCを持ってきてくれました。
PCとディスプレイを眺めてニヤニヤしてました。ラボメンバーはさぞかし気味悪がっていたことでしょうが、うれしいので仕方ないです。
さて、ネット、メール、ウイルス対策ソフトなど一通り必要なものを入れたので、いよいよUNIXの仮想化と次世代シーケンサーに必要なアプリケーションのインストールです。
以下に手順をまとめます。
1. VMware player
をダウンロードしてインストールします。
2. Ubuntu
をダウンロードします(リンク先はISO fileのダウンロードページです。VMware用仮想マシンのダウンロードをしてしまうと、容量などの設定ができずに後々困るかもしれませんのでご注意を)。
3. VMWare Playerを起動して、新規仮想マシンの作成→インストーラ ディスク イメージ ファイル (M) (iso)でダウンロードしたiso fileを選択し、好みの設定をしてください。(次世代シーケンサのデータサイズは大きいので、この時容量を大きめに設定したほうが何かと便利です。私はPCに十分余裕もあるので100GBとしました。)
4. Ubuntuのネットワーク設定をします。仮想マシン→仮想マシン設定→ネットワークアダプタで環境に合わせていろいろいじってください。
5. Applications→Accessories→Terminalで端末を起動します
6. sudo apt-get updateでまずapt-getをアップデートします。
7. sudo apt-get install maqでmaqをインストールします。いちいちmakeしなくて良いので簡単ですね!
これでmaqが使えるようになりました。
次回は前回断念した論文の追試をやってみたいと思います。
今回はいよいよmaqを使って次世代ーシーケンサーのデータを解析してみたいと思います。
といっても自前のデータはまだないので、まずは既に論文になったデータを使って試してみます。
参考にする論文は以下のものです。
この論文では、次世代シーケンサーを使ってショウジョウバエの変異体の原因遺伝子を特定しています。
より具体的には、変異原(EMSという化学薬剤)を与える前のハエ(野生型)と与えた後のハエ(変異型)の遺伝子を全部読んで、彼らの間での遺伝子の違い(SNP)を見つける、ということをしています。
彼らと同じことを自分でもできるのか(できなきゃまずいんですが)、試してみたいと思います
注意:以後の操作はすべてUbuntu上で行っています。
まず、この論文のデータをpubMedのSRAというデータベースから入手します。
このページ から野生型と変異体のシーケンスデータ(sra-lite file)をダウンロードします(重たいですが頑張ってください)。
昔は直接fastq形式のファイルを落とせたらしいんですが、現在はsra形式のものを落とした後に自分で変換せねばなりません。
そのために、SRA Toolkit なるものをダウンロードします(私の場合はUbuntu Linux 32 bit architecture )。
解凍した後、とりあえずhome/ユーザー名フォルダに置いて使ってみます。
Ubuntuの端末上で、
としてsra_resultというフォルダ(新しく生成されます)内に変換されたfastq fileが生成されます。
この件については以下のブログなどを参考にしました。
WALF EARS
ショートリードの憂鬱
で、続けていくつもりが、容量オーバーとなりエラーorz
一回作成した後に容量を変えるのはどうも面倒なようで、、、もう一回インストールしなおしますかね。
といっても自前のデータはまだないので、まずは既に論文になったデータを使って試してみます。
参考にする論文は以下のものです。
Identification of EMS-induced mutations in Drosophila melanogaster by whole-genome sequencing.
Blumenstiel JP, Noll AC, Griffiths JA, Perera AG, Walton KN, Gilliland WD, Hawley RS, Staehling-Hampton K.
Genetics. 2009 May;182(1):25-32. Epub 2009 Mar 23.この論文では、次世代シーケンサーを使ってショウジョウバエの変異体の原因遺伝子を特定しています。
より具体的には、変異原(EMSという化学薬剤)を与える前のハエ(野生型)と与えた後のハエ(変異型)の遺伝子を全部読んで、彼らの間での遺伝子の違い(SNP)を見つける、ということをしています。
彼らと同じことを自分でもできるのか(できなきゃまずいんですが)、試してみたいと思います
注意:以後の操作はすべてUbuntu上で行っています。
まず、この論文のデータをpubMedのSRAというデータベースから入手します。
このページ から野生型と変異体のシーケンスデータ(sra-lite file)をダウンロードします(重たいですが頑張ってください)。
昔は直接fastq形式のファイルを落とせたらしいんですが、現在はsra形式のものを落とした後に自分で変換せねばなりません。
そのために、SRA Toolkit なるものをダウンロードします(私の場合はUbuntu Linux 32 bit architecture )。
解凍した後、とりあえずhome/ユーザー名フォルダに置いて使ってみます。
Ubuntuの端末上で、
sratoolkit.2.0b6-ubuntu32/fastq-dump -A SRR014532 -D SRR014532.lite.sra -O sra_result
としてsra_resultというフォルダ(新しく生成されます)内に変換されたfastq fileが生成されます。
この件については以下のブログなどを参考にしました。
WALF EARS
ショートリードの憂鬱
で、続けていくつもりが、容量オーバーとなりエラーorz
一回作成した後に容量を変えるのはどうも面倒なようで、、、もう一回インストールしなおしますかね。
cygwinやらMingwで次世代シーケンサの解析をしようと(具体的にはMaq
をインストールしようと)四苦八苦していたのですが、諦めました。
bowtieにはWindows用があったのに、maqのバカァウワァァ━━━━━。゚(゚´Д`゚)゚。━━━━━ン!!!
結局drand48というUNIXの乱数発生関数がWindowsに対応していないためにうまくインストールできなかったのが諦めた一番の理由です。
なのでいっそのことWindows上にUNIXを仮想化してしまおうことにしました。
研究費で買ったPCがまだ届かないので家のPC(OSはWindows7)を仮想化してみました。
以下はその手順のまとめです。
VMWare Player をダウンロード(登録が必要です)&インストール
UbuntuをダウンロードしUbuntu(VMWare構成ファイル)をダブルクリック(自動的にVMWareに入ります)
これでとりあえずはUNIX環境ができたわけです。
まあなんと簡単!
で、Ubuntuからインターネットに接続して、 maq-0.7.1.tar.bz2 をダウンロードして適当なフォルダ(今回はhome/ユーザー名)に解凍します(コマンドを覚えていなかったので右クリックで展開してしまいましたw)。
Ubuntuツールバーのアプリケーション→端末でコマンドラインを開き、 maqのフォルダまで移動して、
bowtieにはWindows用があったのに、maqのバカァウワァァ━━━━━。゚(゚´Д`゚)゚。━━━━━ン!!!
結局drand48というUNIXの乱数発生関数がWindowsに対応していないためにうまくインストールできなかったのが諦めた一番の理由です。
なのでいっそのことWindows上にUNIXを仮想化してしまおうことにしました。
研究費で買ったPCがまだ届かないので家のPC(OSはWindows7)を仮想化してみました。
以下はその手順のまとめです。
VMWare Player をダウンロード(登録が必要です)&インストール
UbuntuをダウンロードしUbuntu(VMWare構成ファイル)をダブルクリック(自動的にVMWareに入ります)
これでとりあえずはUNIX環境ができたわけです。
まあなんと簡単!
で、Ubuntuからインターネットに接続して、 maq-0.7.1.tar.bz2 をダウンロードして適当なフォルダ(今回はhome/ユーザー名)に解凍します(コマンドを覚えていなかったので右クリックで展開してしまいましたw)。
Ubuntuツールバーのアプリケーション→端末でコマンドラインを開き、 maqのフォルダまで移動して、
./configure; make; make install
とすればok!!のはずが。。。。。
/usr/include/gnu/stubs.h:9:27: error: gnu/stubs-64.h: No such file or directory
と怒られました。ググった ところ、Makefile.genericを開いてCFLAGSの行の-m64を-m32に書き換えれば良いとのこと。
自分のマシンは32bitだから当たり前か(´Д`。)
make clean
とした後、Makefile.genericを開いて編集。そして
make -f Makefile.generic
とすればok!!のはずがまたエラーorz
今度はzlib.hがないと怒られた。
これもググって みるとzlib1g-devというパッケージをインストールすれば良いらしいので、
sudo apt-get install apt-file
sudo apt-file update
とした後、
sudo apt-get install zlib1g-dev
としてインストールして再度挑戦!
make -f Makefile.generic
としたところ、、、、ついにインストールできました!
いやあ長かったですがうれしいですね。
次はmaqを実際に使ってみたいと思います。
追記: 実はもっと簡単に、apt-getでインストールできます。
詳しくは、Windows上でUNIXを仮想化してmaqをインストールする(更新) をご覧ください。