raxml前解析　modeltest

最尤法で系統樹を作成する際のモデル選択決定について

modeltest-ng

を使う。

modeltest-ng -i test.fasta -o test_res -T raxml -t ml -r 123413 -p 12 -d nt

-i インプットファイル

-o　アウトプットファイル

-T　後解析で用いるsoftware（指定しなくても良い）

-t ml 最尤法

-r　random seed

-p thread

-d nt ヌクレオチド

ASCcorrectionを用いるためには

modeltest-ng -i test.fasta -o test_res -T raxml -t ml -r 123413 -p 12 -d nｔ \

-h ugｒ -a lewis

Macにおけるjavaのversion切り替え

https://qiita.com/seijikohara/items/56cc4ac83ef9d686fab2

参照

brew tap homebrew/cask-versions

brew cask install java11

brew cask install java8。。。ライセンスの関係で不可

インストール済みjava確認

/usr/libexec/java_home -V

jEnvを導入するこで、Javaのバージョンを切り替えが簡単になる。

brew install jenv

PATHを設定
- 使用するシェルにより異なるので注意

# Shell: bash
$ echo 'export PATH="$HOME/.jenv/bin:$PATH"' >> ~/.bash_profile
$ echo 'eval "$(jenv init -)"' >> ~/.bash_profile
# Shell: zsh
$ echo 'export PATH="$HOME/.jenv/bin:$PATH"' >> ~/.zshrc
$ echo 'eval "$(jenv init -)"' >> ~/.zshrc

ディレクトリを作成

$ cd ~
$ mkdir ~/.jenv/versions

- インストールしたJDKをjEnvに追加する。

Java8の追加

$ jenv add `/usr/libexec/java_home -v "11"`

先頭に*が表示されているJDKが有効化されている。

$ jenv versions
* system (set by /Users/[ユーザ名]/.jenv/version)
  1.8
  1.8.0.222
  openjdk64-1.8.0.222

jenv versionsで出力される任意のバージョンへ切り替えられる。

$ jenv global 1.8.0.222
$ jenv versions
  system
  1.8
* 1.8.0.222 (set by /Users/[ユーザ名]/.jenv/version)
  openjdk64-1.8.0.222
$ java -version
openjdk version "1.8.0_222"
OpenJDK Runtime Environment (AdoptOpenJDK)(build 1.8.0_222-b10)
OpenJDK 64-Bit Server VM (AdoptOpenJDK)(build 25.222-b10, mixed mode)

ローカルもある。

brew使い方まとめ

最新バージョン以外のインストールに必要

brew tap homebrew/cask-versions

brew install java11

conda

環境構築で右往左往している。

結局環境依存の問題が発生して、condaで仮装環境を用いて様々なソフトウェアをインストールする事にした。

まず

https://qiita.com/snow67675476/items/c537fcb65ed2cbe5507a

を参考に、homebrew＋pyenv＋anacondaをインストールした。ディレクトリを一つ作って、そこをanaconda環境に適応させたが、これに意味があったのかは不明。。。

仮装環境の確認

conda info -e

モジュールがあるか確認

conda search ***

conda search -c bioconda ***

仮装環境にソフトをインストール

conda create -n ***_env -c bioconda ***=2.6.0(などのversionを入力)

ここでのversionは事前にconda searchでどのバージョンをインストールできるか確認しておく

仮装環境の切り替え

source activate ***_envとすると、pyenvとの兼ね合いでうまくいかない。

この問題の解決のためには、activateをfull pathで書くのが良い。full pathは

find / -name activate

でどこにPath/to/.pyenv/versions/anaconda3-5.3.0/bin/activateがあるのかを探して、その上で、

source Path/to/.pyenv/versions/anaconda3-5.3.0/bin/activate ***_envとすれば良い。

仮装環境をoffにするときには同様に

source Path/to/.pyenv/versions/anaconda3-5.3.0/bin/deactivate ***_env

毎回、full pathを書くのは面倒なので、aliasを作っておくと良い。

vi .bash_profile

alias activate 'source Path/to/.pyenv/versions/anaconda3-5.3.0/bin/activate'

alias deactivate 'source Path/to/.pyenv/versions/anaconda3-5.3.0/bin/deactivate'

ただし、aliasは確かシェルスクリプト内では使用できないので、シェルスクリプトに記載するには長文を書くしかないのだろう。

最後に

conda remove -n ***_env --all

で仮装環境を消せる。

https://qiita.com/ozaki_physics/items/985188feb92570e5b82d

に仮装環境の作り方等々まとまっている。

enaダウンロード

アメンバー限定記事です

限定記事を読む

アメンバー限定記事を読むには

prokkaのmincedエラーでどハマり

突然prokkaが動かなくなった。

原因はmincedが動いていない。

re-installしたらうまくいった。

まず動いていないmincedをアンインストール。

今回は

$conda uninstall minced

次に

https://github.com/ctSkennerton/minced

でzipファイルをダウンロード。

で説明通りにインストール。

めでたし、めでたし。

snp-siteでSNP抽出

説明より抜粋

For the given input file:

>sample1
AGACACAGTCAC
>sample1
AGACAC----AC
>sample1
AAACGCATTCAN

the output is:

>sample1
GAG
>sample1
GA-
>sample1
AGT

snp-sites my_alignment.aln
snp-sites my_gzipped_alignment.aln.gz

snp-sites -vm -o SNP ./core_gene_alignment.aln

https://github.com/sanger-pathogens/snp-sites#example-usage

からインストールできる。

MACでもインストール可能。

Treeannotator memory 増やすぞ

java -Xms4096m -Xmx128g -Djava.library.path=/home/＊ak＊＊＊/＊ak＊＊＊/bin/BEASTv1.10.4/lib -cp /home/＊ak＊＊＊/＊ak＊＊＊/bin/BEASTv1.10.4/lib/beast.jar dr.app.tools.TreeAnnotator

java -Xms4096m -Xmx128g -Djava.library.path=/home/＊ak＊＊＊/＊ak＊＊＊/bin/beast/lib -cp /home/＊ak＊＊＊/＊ak＊＊＊/bin/beast/lib/launcher.jar beast.app.treeannotator.TreeAnnotatorLauncher

pathsamplingについて

xmlファイルの編集はやり方が分からんかった。

BEAST1.8だったら簡単にできたのに、BEAST2以降は何やらパスの設定がややこしい。。。

しかし、BEAST2以降はbeautiでPSができる！

まず

①Package magagerでmodel-selectionをインストールする。

（File→manage package）

②一回beautiを終了して、再度立ち上げる。

③File→Launch Apps

④Pass sampler

⑤Model1のところに解析したいxmlファイルを選ぶ

あとはparameterを設定してOK!

なぜかBEAST2.5.1だとmojaveでは上手くPSが走らない。一回アンインストールしてBEAST2.4.8をインストールし直したら上手くいった。

ちなみにwindowsでも上手くいく。（2.4.8しか確認していない）

GUIでPSするとsingle coreで動いている様なので、12threadのmacbook proよりも4thread、i7のwindowsデスクトップの方が速かった。

GUIでもmulticoreでPS解析する方法あるのかな？？？

hierBAPS in MAC

以前にBAPSを取り上げたが、その後全く使わず。

気づけばMACuserに転向し、WindowsでBAPSを使うことの無意味さを次第に感じる今日この頃。

というわけで、特段使う予定もないが、いつかはきっと役に立つBAPSを改めて参照してみた。

Installはクソ簡単。websiteに書いてある通りにやってください。

MATLABはBAPS5.4のzip.パッケージ内に含まれています。

以下に、hierBAPSのreadme.txtを添付します。

まだやってないけど、このままやればできるはず。

1. Launch X11 terminal app, go to the folder containing hierBAPS files and type

./run_exData.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ seqs.fa fasta

This will produce an input file called "seqs.mat" from your alignment file. The example file seqs.fa is provided with this readme file.

2. Type

./run_hierBAPS.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ seqs.mat L maxK results

注意！ここのLどうやって決めるんや!?

(http://onlinelibrary.wiley.com/doi/10.1111/j.1365-294X.2005.02553.x/full)

によるとSTRUCTUREというソフトで推定できる。

This will launch hierBAPS. Clustering is performed with L levels in the hierarchy and maxK is the prior upper bound for number of clusters. As in BAPS, hierBAPS will estimate the maximum a posteriori partition (MAP) with the number of clusters in the interval 1 to maxK. hierBAPS will save an output file named results.mat (binary format) and a partition file "results.partition.txt", where each column represents the MAP partion of that layer.

3. (optional) Assume you did use

./run_hierBAPS.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ seqs.mat 2 20 results

In the previous step. You can continue the clustering from the previous result to a deeper level (here L=4) by typing

./run_hierBAPS.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ results.mat 4 20 results2nd

4. Type

./run_drawSnpMat.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ results.mat shuffle

This will draw a SNP matrix with rows and columns shuffled as shown in BAPS 6.0 manual. Without the "shuffle" parameter, the columns will not be shuffled. Consequtive rows between horizontal black lines represent a 1st layer cluster.

A tab delimited file "figInfo.txt" will also be produced.

<< 前ページ次ページ >>

今日から、俺は、遺伝子解析、始めます。

自分の解析の備忘録。