seqtk 是一款针对fasta/fastq 文件进行处理的小程序,有很多的功能,速度很快,很方便;

源代码:https://github.com/lh3/seqtk

安装:

    git clone https://github.com/lh3/seqtk

    cd seqtk

    make

测试:

    seqtk seq : 用途:

    1)将fastq 文件转换成fasta 文件

    seqtk seq -A input.fastq  > output.fasta

    input.fastq的内容:

@NB001
ATGCACAAAACCCC
+
//////////////

    output.fasta 的内容:

>NB001
ATGCACAAAACCCC

    2)得到反向互补序列

    seqtk seq -Ar input.fastq > output.fasta

output.fasta的内容为:

>NB001
GGGGTTTTGTGCAT

   seqtk comp: 得到fastq/fasta 文件的碱基组成

   seqtk comp input.fastq > out.txt

   out.txt 的内容为:

NB001                                                

     第一列为序列的name; 第二列为长度,3-6列代表在该序列中A, C, G ,T 4中碱基的数目

     用这个程序可以快速得到每条序列的长度

  

05-25 17:23