我有一百个带有.bed文件的基因组。我想更改每个带有Species_ID(3个字符)的基因组的染色体名称(出现在第一列中),并更改MscanX程序的序号以比较同位区域。

当前的床文件格式多种多样……而且染色体数目也各不相同。

例如,

CP006020.1 or gi|1002316256|dbj|BCGA01000001.1| or Scaffold_1

知道如何自动更改所有这些,而不是一个接一个地更改吗?


谢谢



编辑:很抱歉忘记上传文件。例如我的输入是

CP006020.1  Ashbya_aceri.g2.t1  4928    6961
CP006020.1  Ashbya_aceri.g3.t1  9344    9862
CP006020.1  Ashbya_aceri.g4.t1  10744   13401
CP006020.1  Ashbya_aceri.g5.t1  16466   16807
CP006020.1  Ashbya_aceri.g6.t1  18381   21437
CP006020.1  Ashbya_aceri.g7.t1  21754   22092
CP006020.1  Ashbya_aceri.g8.t1  22562   23695
CP006020.1  Ashbya_aceri.g9.t1  24921   28616
CP006020.1  Ashbya_aceri.g10.t1 28815   32498


要么

gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g1.t1 3762    4427
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g2.t1 5216    5500
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g3.t1 10276   12591
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g4.t1 12621   13423
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g5.t1 23064   23738
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g6.t1 26600   27292
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g7.t1 27601   28044
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g8.t1 33199   33741
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g9.t1 33912   34990
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g10.t1    41641   44574


我只想更改第一列中的染色体名称。将原始的一个更改为Chr1,将Chr2更改为Chr ...取决于文件中有多少个支架。

最佳答案

抱歉,忘记上传文件。例如我的输入是

CP006020.1  Ashbya_aceri.g2.t1  4928    6961
CP006020.1  Ashbya_aceri.g3.t1  9344    9862
CP006020.1  Ashbya_aceri.g4.t1  10744   13401
CP006020.1  Ashbya_aceri.g5.t1  16466   16807
CP006020.1  Ashbya_aceri.g6.t1  18381   21437
CP006020.1  Ashbya_aceri.g7.t1  21754   22092
CP006020.1  Ashbya_aceri.g8.t1  22562   23695
CP006020.1  Ashbya_aceri.g9.t1  24921   28616
CP006020.1  Ashbya_aceri.g10.t1 28815   32498


要么

gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g1.t1 3762    4427
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g2.t1 5216    5500
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g3.t1 10276   12591
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g4.t1 12621   13423
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g5.t1 23064   23738
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g6.t1 26600   27292
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g7.t1 27601   28044
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g8.t1 33199   33741
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g9.t1 33912   34990
gi|1002316735|dbj|BCKQ01000001.1|   Ascoidea_asiatica.g10.t1    41641   44574


我只想更改第一列中的染色体名称。将原始的一个更改为Chr1,将Chr2更改为Chr ...取决于文件中有多少个支架。

10-05 18:33