我有一个根据时间戳排序的csv文件。如下所示:

DCR_Path,翻译方向,日期和时间

数据1,发送到CTM的翻译​​,2014年9月30日03:22

data2,发送到CTM的翻译​​,2014年9月30日03:21

数据1,发送到CTM的翻译​​,2014年9月30日03:12

data3,发送到CTM的翻译​​,2014年9月30日03:10

data2,发送到CTM的翻译​​,2014年9月30日02:22

数据1,发送到CTM的翻译​​,2014年9月30日02:20



我需要采取最新的并删除其他重复项,输出应为:

DCR_Path,翻译方向,日期和时间

数据1,发送到CTM的翻译​​,2014年9月30日03:22

data2,发送到CTM的翻译​​,2014年9月30日03:21

data3,发送到CTM的翻译​​,2014年9月30日03:10



我尝试了一些排序命令,但无法获得结果。如何获得所需的输出?

最佳答案

尝试:

sort -u -t, -k1,2 test.txt



-u是获得唯一记录
-t,使用逗号作为分隔符来分隔字段
-k1,2选择字段1和2进行比较并选择uniq

关于linux - Linux命令保留最新数据并删除csv文件中的其他重复项,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26798317/

10-16 11:06
查看更多