今日から、俺は、遺伝子解析、始めます。 -11ページ目

最尤法で系統樹を作成する際のモデル選択決定について

modeltest-ng

を使う。

modeltest-ng -i test.fasta -o test_res -T raxml -t ml -r 123413 -p 12 -d nt

 

-i インプットファイル

-o アウトプットファイル

-T 後解析で用いるsoftware(指定しなくても良い)

-t ml 最尤法

-r random seed

-p thread

-d nt ヌクレオチド

 

ASCcorrectionを用いるためには

modeltest-ng -i test.fasta -o test_res -T raxml -t ml -r 123413 -p 12 -d nt \

-h ugr -a lewis

https://qiita.com/seijikohara/items/56cc4ac83ef9d686fab2

参照

 

brew tap homebrew/cask-versions
brew cask install java11
brew cask install java8。。。ライセンスの関係で不可
インストール済みjava確認
/usr/libexec/java_home -V


jEnvを導入するこで、Javaのバージョンを切り替えが簡単になる。
brew install jenv
  • PATHを設定
    • 使用するシェルにより異なるので注意
# Shell: bash
$ echo 'export PATH="$HOME/.jenv/bin:$PATH"' >> ~/.bash_profile
$ echo 'eval "$(jenv init -)"' >> ~/.bash_profile
# Shell: zsh
$ echo 'export PATH="$HOME/.jenv/bin:$PATH"' >> ~/.zshrc
$ echo 'eval "$(jenv init -)"' >> ~/.zshrc


  • ディレクトリを作成
$ cd ~
$ mkdir ~/.jenv/versions


    • インストールしたJDKをjEnvに追加する。

Java8の追加

$ jenv add `/usr/libexec/java_home -v "11"`


  • 先頭に*が表示されているJDKが有効化されている。
$ jenv versions
* system (set by /Users/[ユーザ名]/.jenv/version)
  1.8
  1.8.0.222
  openjdk64-1.8.0.222


  • jenv versionsで出力される任意のバージョンへ切り替えられる。
 
$ jenv global 1.8.0.222
$ jenv versions
  system
  1.8
* 1.8.0.222 (set by /Users/[ユーザ名]/.jenv/version)
  openjdk64-1.8.0.222
$ java -version
openjdk version "1.8.0_222"
OpenJDK Runtime Environment (AdoptOpenJDK)(build 1.8.0_222-b10)
OpenJDK 64-Bit Server VM (AdoptOpenJDK)(build 25.222-b10, mixed mode)


ローカルもある。
最新バージョン以外のインストールに必要
brew tap homebrew/cask-versions
brew install java11

環境構築で右往左往している。

結局環境依存の問題が発生して、condaで仮装環境を用いて様々なソフトウェアをインストールする事にした。

 

まず

https://qiita.com/snow67675476/items/c537fcb65ed2cbe5507a

を参考に、homebrew+pyenv+anacondaをインストールした。ディレクトリを一つ作って、そこをanaconda環境に適応させたが、これに意味があったのかは不明。。。

 

仮装環境の確認

conda info -e

モジュールがあるか確認

conda search ***

conda search -c bioconda ***

仮装環境にソフトをインストール

conda create -n ***_env -c bioconda ***=2.6.0(などのversionを入力)

ここでのversionは事前にconda searchでどのバージョンをインストールできるか確認しておく

 

仮装環境の切り替え

source activate ***_envとすると、pyenvとの兼ね合いでうまくいかない。

この問題の解決のためには、activateをfull pathで書くのが良い。full pathは

find / -name activate

でどこにPath/to/.pyenv/versions/anaconda3-5.3.0/bin/activateがあるのかを探して、その上で、

source Path/to/.pyenv/versions/anaconda3-5.3.0/bin/activate ***_envとすれば良い。

 

仮装環境をoffにするときには同様に

source Path/to/.pyenv/versions/anaconda3-5.3.0/bin/deactivate ***_env

 

毎回、full pathを書くのは面倒なので、aliasを作っておくと良い。

vi .bash_profile

alias activate 'source Path/to/.pyenv/versions/anaconda3-5.3.0/bin/activate'

alias deactivate 'source Path/to/.pyenv/versions/anaconda3-5.3.0/bin/deactivate'

 

ただし、aliasは確かシェルスクリプト内では使用できないので、シェルスクリプトに記載するには長文を書くしかないのだろう。

 

最後に

conda remove -n ***_env --all

で仮装環境を消せる。

 

https://qiita.com/ozaki_physics/items/985188feb92570e5b82d

に仮装環境の作り方等々まとまっている。

 

突然prokkaが動かなくなった。

原因はmincedが動いていない。

re-installしたらうまくいった。

 

まず動いていないmincedをアンインストール。

今回は

$conda uninstall minced

 

次に

https://github.com/ctSkennerton/minced

でzipファイルをダウンロード。

 

で説明通りにインストール。

 

めでたし、めでたし。

 

説明より抜粋

 

For the given input file:

>sample1
AGACACAGTCAC
>sample1
AGACAC----AC
>sample1
AAACGCATTCAN

the output is:

>sample1
GAG
>sample1
GA-
>sample1
AGT


snp-sites my_alignment.aln
snp-sites my_gzipped_alignment.aln.gz
snp-sites -vm -o SNP ./core_gene_alignment.aln
https://github.com/sanger-pathogens/snp-sites#example-usage
からインストールできる。
MACでもインストール可能。

java -Xms4096m -Xmx128g -Djava.library.path=/home/*ak***/*ak***/bin/BEASTv1.10.4/lib -cp /home/*ak***/*ak***/bin/BEASTv1.10.4/lib/beast.jar dr.app.tools.TreeAnnotator

 

java -Xms4096m -Xmx128g -Djava.library.path=/home/*ak***/*ak***/bin/beast/lib -cp /home/*ak***/*ak***/bin/beast/lib/launcher.jar beast.app.treeannotator.TreeAnnotatorLauncher

xmlファイルの編集はやり方が分からんかった。

BEAST1.8だったら簡単にできたのに、BEAST2以降は何やらパスの設定がややこしい。。。

 

しかし、BEAST2以降はbeautiでPSができる!

まず

①Package magagerでmodel-selectionをインストールする。

(File→manage package)

②一回beautiを終了して、再度立ち上げる。

③File→Launch Apps

④Pass sampler

⑤Model1のところに解析したいxmlファイルを選ぶ

 

あとはparameterを設定してOK!

 

なぜかBEAST2.5.1だとmojaveでは上手くPSが走らない。一回アンインストールしてBEAST2.4.8をインストールし直したら上手くいった。

ちなみにwindowsでも上手くいく。(2.4.8しか確認していない)

GUIでPSするとsingle coreで動いている様なので、12threadのmacbook proよりも4thread、i7のwindowsデスクトップの方が速かった。

GUIでもmulticoreでPS解析する方法あるのかな???

以前にBAPSを取り上げたが、その後全く使わず。

気づけばMACuserに転向し、WindowsでBAPSを使うことの無意味さを次第に感じる今日この頃。

というわけで、特段使う予定もないが、いつかはきっと役に立つBAPSを改めて参照してみた。

 

Installはクソ簡単。websiteに書いてある通りにやってください。

MATLABはBAPS5.4のzip.パッケージ内に含まれています。

 

以下に、hierBAPSのreadme.txtを添付します。

まだやってないけど、このままやればできるはず。

 

1. Launch X11 terminal app, go to the folder containing hierBAPS files and type

./run_exData.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ seqs.fa fasta

This will produce an input file called "seqs.mat" from your alignment file. The example file seqs.fa is provided with this readme file.

2. Type

./run_hierBAPS.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ seqs.mat L maxK results

 

注意!ここのLどうやって決めるんや!?

(http://onlinelibrary.wiley.com/doi/10.1111/j.1365-294X.2005.02553.x/full)

によるとSTRUCTUREというソフトで推定できる。



This will launch hierBAPS. Clustering is performed with L levels in the hierarchy and maxK is the prior upper bound for number of clusters. As in BAPS, hierBAPS will estimate the maximum a posteriori partition (MAP) with the number of clusters in the interval 1 to maxK. hierBAPS will save an output file named results.mat (binary format) and a partition file "results.partition.txt", where each column represents the MAP partion of that layer.

3. (optional) Assume you did use

./run_hierBAPS.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ seqs.mat 2 20 results

In the previous step. You can continue the clustering from the previous result to a deeper level (here L=4) by typing

./run_hierBAPS.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ results.mat 4 20 results2nd


4. Type

./run_drawSnpMat.sh /Applications/MATLAB/MATLAB_Compiler_Runtime/v713/ results.mat shuffle

This will draw a SNP matrix with rows and columns shuffled as shown in BAPS 6.0 manual. Without the "shuffle" parameter, the columns will not be shuffled. Consequtive rows between horizontal black lines represent a 1st layer cluster.

A tab delimited file "figInfo.txt" will also be produced.