我正在 unix 系统上进行一些文本处理。我可以访问这台机器上的命令行,它安装了 Python、Perl 和默认的文本处理程序,awk 等。

我有一个如下所示的文本文件:

2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717 1232453488239 Tue Mar  3 10:47:44 2009
2029754527851451717 1232453488302 Tue Mar  3 10:47:44 2009
2029754527851451717 1232453488365 Tue Mar  3 10:47:44 2009
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009

它基本上是 3 行: ID ID 日期

我希望删除所有没有 2 个 ID 和一个日期的行。所以最后的结果会是这样:
2029754527851451717 1232453488239 Tue Mar  3 10:47:44 2009
2029754527851451717 1232453488302 Tue Mar  3 10:47:44 2009
2029754527851451717 1232453488365 Tue Mar  3 10:47:44 2009
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009

你们怎么建议这样做?文本文件总共有大约 30,000 行。

干杯

埃夫

最佳答案

使用 awk :

awk 'NF > 2' input_file > output_file

关于python - 从文件中删除行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/793759/

10-13 02:35