我有一个这样的文件:
readA chr1 229665946 229666155 + ABCB10 NM_012089 exon6
readA chr1 229667383 229667478 + ABCB10 NM_012089 exon7
readA chr1 229675203 229675338 + ABCB10 NM_012089 exon8
readB chr2 229675000 229675888 + KGB09 NM_022158 exon2
我想按第一列合并,如下所示:
readA chr1 229665946 229675338 + ABCB10 NM_012089 exon6,exon7,exon8
readB chr2 229675000 229675888 + KGB09 NM_022158 exon2
所以第一列和染色体位置合并了,我试图用awk或bedtool合并来解决这个问题,但是失败了。有人能帮我吗?谢谢!
最佳答案
以下内容可能对您有所帮助。
awk '{a[$1]=a[$1]?a[$1] OFS $NF:$0} END{for(i in a){print a[i]}}' OFS=, Input_file