Adapter trimming

Adapter trimmingができていないと感じたので再確認。

Adapter情報は

Illumina Adapter SequencesOligonucleotide (oligo) sequences of Illumina adapters used in AmpliSeq, Nextera, TruSeq, and TruSight library prep kits.

support.illumina.com

に記載されている。

Nexteraの配列はfastpでdefaultでしっかりトリミングできていた。

しかし、TruseqのIDT adapterはfastpのdefaultセッティングでは

トリミングしきれていない。

fastpでオプション指定すれば

--adapter_sequence AGATCGGAAGAGCACACGTCTGAACTCCAGTCA

--adapter_sequence_r2

AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT

完全にトリミングできていた。

https://jp.illumina.com/content/dam/illumina-marketing/apac/japan/documents/pdf/2013_illumina_techsupport_session17.pdf

も参考になる。（13枚目）

IDT for Illumina–TruSeq DNA and RNA UD Indexes

のadapter trimming

Read 1

AGATCGGAAGAGCACACGTCTGAACTCCAGTCA

Read 2

AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT

のRead１についてはi7直前の「C」が省略されている点に注意。

これは簡便さのためで、Cを加えて

AGATCGGAAGAGCACACGTCTGAACTCCAGTCA「C」

でトリミングして問題なし。

Truseq系のアダプターはinsertにadapter ligateする際に

P5の3'末端に「T」、P7の5'末端に「A」が付加される。

treeannotator memory 2(BEAST2)

アメンバー限定記事です

限定記事を読む

アメンバー限定記事を読むには

mascot_BEAST

アメンバー限定記事です

限定記事を読む

アメンバー限定記事を読むには

Spread3

アメンバー限定記事です

限定記事を読む

アメンバー限定記事を読むには

tree_annotator_memory_up

アメンバー限定記事です

限定記事を読む

アメンバー限定記事を読むには

figtree_memory

アメンバー限定記事です

限定記事を読む

アメンバー限定記事を読むには

BEAST_input Nについて

-やNをinput fastaに含めるときにはxmlファイルに

以下を追記する。

Tempest_train_input

Tempestでyearを入力するtextファイルは

UTF-8,改行コードLFでないとだめ。

変換にはnkfコマンドを用いる。

cat test.txt | nkf -wd > input.txt

input.txtをtempestの入力ファイルとする。

gffreadの使い方

今更感はあるが、gffreadなるものをcondaでインストールした。

gffファイルを利用した便利ソフト。想像しやすい事はたいていできるのでしょう。

gffread input.gff -g ref.fasta -x output_CDS.fasta

-xオプションでCDSがnuc配列に変換されたmaultifastaファイルが作成される。

ディレクトリサイズを調べる

du -sh ./*/

sudo df -BG

今日から、俺は、遺伝子解析、始めます。

自分の解析の備忘録。

Adapter trimming

treeannotator memory 2(BEAST2)

mascot_BEAST

Spread3

tree_annotator_memory_up

figtree_memory

BEAST_input Nについて

Tempest_train_input

gffreadの使い方

ディレクトリサイズを調べる