我有一个制表符分隔的文件,如下所示:
ABCA2 chr9 139021506 139043195
ABCA2 chr9 139021506 139042561
ABCC1 chr16 15950934 16144431
ABCC1 chr16 15950934 16144431
ABCC1 chr16 15950934 16144431
ABCC1 chr16 15950934 16144431
我想根据column提取值,就像第2、3和4列中
ABCA2
的值应该只提取一次,这是名称第一次出现在column1中。理想的产出是:
ABCA2 chr9 139021506 139043195
ABCC1 chr16 15950934 16144431
谢谢你
最佳答案
您的问题陈述不明确,但我将其解释为您只希望在第一列中的条目尚未被看到时输出一行。我不知道为什么会标记为python
,因为awk显然是正确的工具:
awk '{if( !seen[$1]++ ) print }' input-file
或者,更简单地说
awk '! a[$1]++' input-file