kmer分析其实是非常耗费计算资源的,如果我们自己写脚本来分析kmer的话,首先要将所有的序列打断成一定长度的kmer,然后将所有的kmer存储起来,最后统计每个kmer出现的频率,或者统计出现指定次数的kmer一共有多少个。
为了节省资源,我们可以使用 Jellyfish 这个现成的软件来分析。
JELLYFISH - Fast, Parallel k-mer Counting for DNA
Jellyfish mer counter (原来和MaSuRCA是一个开发单位,我说怎么这么眼熟呢)