我有一个包含以下数据的输入文件:

AUD 100 20
USD 200 30
INR 10  20
AUD 100 30
USD 200 40
EUR 50  60
EUR 50  70
AUD 100 11
USD 200 55
INR 10  35


我跑:

cat filename | sort -u -k1,2


它给我的输出如下:

AUD 100 20
EUR 50  60
INR 10  20
USD 200 30


所以我了解的是sort -u k1,2
根据列#1和#2中值的唯一组合对数据进行排序并给出输出。现在基于此理解,我运行:

  cat filename |  sort -u -k1


以获得基于列#1中唯一值的输出。所以我期望这个输出:

AUD 100 20
EUR 50  60
INR 10  20
USD 200 30


但是实际输出是:

AUD 100 11
AUD 100 20
AUD 100 30
EUR 50  60
EUR 50  70
INR 10  20
INR 10  35
USD 200 55
USD 200 30
USD 200 40


有人可以解释sort -u -km,n选项的情况吗?

最佳答案

密钥字段号用-k <start>,<end>指定。如果未指定<end>,则默认为行尾。所以:

sort -u -k 1 filename


将基于整行对唯一值进行排序和打印。如果您只考虑第一个关键(您的预期结果),则必须:

sort -u -k 1,1 filename


附言您实际上不必将cat输出通过管道传输到sort ...

10-01 13:06