我有一个根据时间戳排序的csv文件。如下所示:
DCR_Path,翻译方向,日期和时间
数据1,发送到CTM的翻译,2014年9月30日03:22
data2,发送到CTM的翻译,2014年9月30日03:21
数据1,发送到CTM的翻译,2014年9月30日03:12
data3,发送到CTM的翻译,2014年9月30日03:10
data2,发送到CTM的翻译,2014年9月30日02:22
数据1,发送到CTM的翻译,2014年9月30日02:20
我需要采取最新的并删除其他重复项,输出应为:
DCR_Path,翻译方向,日期和时间
数据1,发送到CTM的翻译,2014年9月30日03:22
data2,发送到CTM的翻译,2014年9月30日03:21
data3,发送到CTM的翻译,2014年9月30日03:10
我尝试了一些排序命令,但无法获得结果。如何获得所需的输出?
最佳答案
尝试:
sort -u -t, -k1,2 test.txt
-u是获得唯一记录
-t,使用逗号作为分隔符来分隔字段
-k1,2选择字段1和2进行比较并选择uniq
关于linux - Linux命令保留最新数据并删除csv文件中的其他重复项,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/26798317/