我是数据分析领域的新手。
我有一个非常大的数据文件,其中包含数百万行,但重复相同的模式(100步时间)。我需要每10000行抽取100行组成的块。这样我就会丢弃同样无用的数据。
提前谢谢你

最佳答案

去营救!

$ awk '(NR-1)%10000<100'

07-26 08:09