我想知道您是否可以告诉我在一个包含这些字符a,C,G,T并且长度是3的倍数的txt文件中查找子字符串的命令是什么
我的命令是
egrep "[ACGT]" dna.txt
但我仍然坚持三部分的倍数。我想我得用
{}
但我不知道怎么用。 最佳答案
要重新表述您的需求,您需要对三个匹配项的序列进行一次或多次重复。
grep -E -x '([ACGT]{3})+' dna.txt
更详细地说,括号用于分组,以便最后的
+
(一个或多个)应用于整个组;在组内,简单表达式[ACGT]{3}
匹配三个相邻字符,其中每个字符都可以是character类中枚举的任意字符。grep
默认情况下打印出包含匹配子字符串的任何行;-x
要求整行匹配。egrep
的同义词是过时的,应该避免继续使用。关于linux - egrep命令查找长度为3的倍数的子字符串,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/58497316/