一 建立索引
比对之前,需要对fasta文件构建FM-index索引:bwa index -a bwtsw hg19.fasta
生成 hg19.fasta.amb、hg19.fasta.ann、hg19.fasta.bwt、hg19.fasta.pac、hg19.fasta.sa四个文件。
起可参数 -a 有两种构建index算法: bwtsw 大的基因组数据,必须大于10MB,比如人的全基因组. is 默认的算法,速度较快,需要较大的内存,不能构建大于2GB的数据库
-P str 输出数据库的前缀,默认和输入的文件名一致。
二 比对
- aln: bwa aln hg19.fasta fq1.gz > aln_sa1.sai
bwa aln hg19.fasta fq2.gz > aln_sa2.sai
bwa sampe hg19.fasta aln_sa1.sa aln_sa2.sai fq1.gz fq2.gz > aln.sam
http://starsyi.github.io/2016/05/24/BWA-%E5%91%BD%E4%BB%A4%E8%AF%A6%E8%A7%A3/