我有一百个带有.bed文件的基因组。我想更改每个带有Species_ID(3个字符)的基因组的染色体名称(出现在第一列中),并更改MscanX程序的序号以比较同位区域。
当前的床文件格式多种多样……而且染色体数目也各不相同。
例如,CP006020.1 or gi|1002316256|dbj|BCGA01000001.1| or Scaffold_1
知道如何自动更改所有这些,而不是一个接一个地更改吗?
里
谢谢
编辑:很抱歉忘记上传文件。例如我的输入是
CP006020.1 Ashbya_aceri.g2.t1 4928 6961
CP006020.1 Ashbya_aceri.g3.t1 9344 9862
CP006020.1 Ashbya_aceri.g4.t1 10744 13401
CP006020.1 Ashbya_aceri.g5.t1 16466 16807
CP006020.1 Ashbya_aceri.g6.t1 18381 21437
CP006020.1 Ashbya_aceri.g7.t1 21754 22092
CP006020.1 Ashbya_aceri.g8.t1 22562 23695
CP006020.1 Ashbya_aceri.g9.t1 24921 28616
CP006020.1 Ashbya_aceri.g10.t1 28815 32498
要么
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g1.t1 3762 4427
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g2.t1 5216 5500
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g3.t1 10276 12591
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g4.t1 12621 13423
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g5.t1 23064 23738
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g6.t1 26600 27292
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g7.t1 27601 28044
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g8.t1 33199 33741
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g9.t1 33912 34990
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g10.t1 41641 44574
我只想更改第一列中的染色体名称。将原始的一个更改为Chr1,将Chr2更改为Chr ...取决于文件中有多少个支架。
最佳答案
抱歉,忘记上传文件。例如我的输入是
CP006020.1 Ashbya_aceri.g2.t1 4928 6961
CP006020.1 Ashbya_aceri.g3.t1 9344 9862
CP006020.1 Ashbya_aceri.g4.t1 10744 13401
CP006020.1 Ashbya_aceri.g5.t1 16466 16807
CP006020.1 Ashbya_aceri.g6.t1 18381 21437
CP006020.1 Ashbya_aceri.g7.t1 21754 22092
CP006020.1 Ashbya_aceri.g8.t1 22562 23695
CP006020.1 Ashbya_aceri.g9.t1 24921 28616
CP006020.1 Ashbya_aceri.g10.t1 28815 32498
要么
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g1.t1 3762 4427
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g2.t1 5216 5500
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g3.t1 10276 12591
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g4.t1 12621 13423
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g5.t1 23064 23738
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g6.t1 26600 27292
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g7.t1 27601 28044
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g8.t1 33199 33741
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g9.t1 33912 34990
gi|1002316735|dbj|BCKQ01000001.1| Ascoidea_asiatica.g10.t1 41641 44574
我只想更改第一列中的染色体名称。将原始的一个更改为Chr1,将Chr2更改为Chr ...取决于文件中有多少个支架。