我正在 unix 系统上进行一些文本处理。我可以访问这台机器上的命令行,它安装了 Python、Perl 和默认的文本处理程序,awk 等。
我有一个如下所示的文本文件:
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717 1232453488239 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488302 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488365 Tue Mar 3 10:47:44 2009
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009
它基本上是 3 行: ID ID 日期
我希望删除所有没有 2 个 ID 和一个日期的行。所以最后的结果会是这样:
2029754527851451717 1232453488239 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488302 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488365 Tue Mar 3 10:47:44 2009
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009
你们怎么建议这样做?文本文件总共有大约 30,000 行。
干杯
埃夫
最佳答案
使用 awk
:
awk 'NF > 2' input_file > output_file
关于python - 从文件中删除行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/793759/