我有一个这样的文件:

readA    chr1    229665946 229666155 +  ABCB10  NM_012089   exon6
readA    chr1    229667383 229667478 +  ABCB10  NM_012089   exon7
readA    chr1    229675203 229675338 +  ABCB10  NM_012089   exon8
readB    chr2    229675000 229675888 +  KGB09   NM_022158   exon2

我想按第一列合并,如下所示:
readA    chr1    229665946 229675338 +  ABCB10  NM_012089   exon6,exon7,exon8
readB    chr2    229675000 229675888 +  KGB09   NM_022158   exon2

所以第一列和染色体位置合并了,我试图用awk或bedtool合并来解决这个问题,但是失败了。有人能帮我吗?谢谢!

最佳答案

以下内容可能对您有所帮助。

awk '{a[$1]=a[$1]?a[$1] OFS $NF:$0} END{for(i in a){print a[i]}}' OFS=,   Input_file

09-11 10:46