功能如下:
1、View
主要功能讲sam文件转位bam文件。
涉及的参数:
-b 输出bam格式。。默认是sam文件
-h 输出的sam文件带header。。默认不带
-H 仅仅输出header
-S 输入sam文件。。默认bam文件
-u 输出bam文件不进行压缩。。必须有-b参数
-c 输出比对上的数
-f 输出含有所有flag都reads
-F 输出没有flag的reads。。数字4代表改reads没有比对上,数字8表示mate序列没有比对上
-q 比对的最低质量值。。一般20就可以
例子:
1⃣️ sam文件转位bam文件:samtools view -bS file.sam > file.bam
bam转sam:samtools view -h -o file.sam file.bam
2⃣️ 提取比对到参考基因组上的reads:samtools view -bF 4 file.bam > file.F.bam。。若提取两条reads都比对上,则F值设计为12。 4+8
3⃣️ 提取bam文件中比对到chr3的结果,并以sam文件保存:samtools view file.bam chr3 > chr.sam
2、sort
用法:samtools sort [-n] [-m] <in.bam> <out.bam>
-m 内存参数默认下500,000,000 即500M(不支持M,G等缩写)
-n 设定排序方式按short reads 的ID排。默认按照fasta在文件中的顺序
例子:samtools sort accepted.bam accepted.sort.accepted.sort.bam
3、merge
将2个或者2个以上已经sort过的bam文件进行合并。
samtools merge <out.bam> <in1.bam> <in2.bam> [....]
4、index
必须对bam文件sort后在可以进行index。建立索引后生成.bai的文件。用于快速的随机处理。如tview等。
samtools index <in.bam> <out.index>
以下两种都可以:
samtools index file.sort.bam
samtools index file.sort.bam file.sort.bam.bai
5、faidx
对fasta文件建立索引,生成.fai文件。可以快速提取fasta文件中的某一序列
samtools faidx genome.fasta
提取序列:
samtools faidx genome.fasta scafold10 > scafold10.fasta
6、tview
smatools tview <file.bam> [ref.fasta]
第一排位参考基因组序列,否则为N。按下g可以输入要到达基因组的某一位点,如:“chr3:1000” 3号人色体1000位。”.“切换显示碱基和点号,用“r”显示read name 等
7、flagstat
samtools flagstat <in.bam>
待续。。。。。
https://blog.csdn.net/sinat_38163598/article/details/72910115
关注下方公众号可获得更多精彩