我有一个制表符分隔的文件,如下所示:

ABCA2   chr9    139021506   139043195
ABCA2   chr9    139021506   139042561
ABCC1   chr16   15950934    16144431
ABCC1   chr16   15950934    16144431
ABCC1   chr16   15950934    16144431
ABCC1   chr16   15950934    16144431

我想根据column提取值,就像第2、3和4列中ABCA2的值应该只提取一次,这是名称第一次出现在column1中。
理想的产出是:
ABCA2   chr9    139021506   139043195
ABCC1   chr16   15950934    16144431

谢谢你

最佳答案

您的问题陈述不明确,但我将其解释为您只希望在第一列中的条目尚未被看到时输出一行。我不知道为什么会标记为python,因为awk显然是正确的工具:

awk '{if( !seen[$1]++ ) print }' input-file

或者,更简单地说
awk '! a[$1]++' input-file

09-11 19:35