TGAGGTAGTAGGTTGTATGGTT

TGAGGTAGTAGGTTGTATGGTT

我想重新格式化下面的行。请参阅输入示例和所需的输出。我一直在找awk,却找不到正确的解决方案

输入:

>1-672762
TGAGGTAGTAGGTTGTATGGTT
>2-240457
TGAGGTAGTAGGTTGTGTGGTT
>3-130231
TAGCAGCACGTAAATATTGGCG
>4-116485
TGAGGTAGTAGGTTGTATAGTT

输出(需要用制表符分隔):
TGAGGTAGTAGGTTGTATGGTT  672762
TGAGGTAGTAGGTTGTGTGGTT  240457
TAGCAGCACGTAAATATTGGCG  130231
TGAGGTAGTAGGTTGTATAGTT  116485

最佳答案

perl:

$ perl -lne '/^>\d+-(\d+)/ or print "$_\t$1"' file

输出:
TGAGGTAGTAGGTTGTATGGTT    672762
TGAGGTAGTAGGTTGTGTGGTT    240457
TAGCAGCACGTAAATATTGGCG    130231
TGAGGTAGTAGGTTGTATAGTT    116485

10-07 15:06