我正在处理具有如下数字列的数据集:
icd9code
285.21
593.9
285.21
v04.81
为了运行R
comorbidities
程序包,我需要将它们更改为5位数字,没有小数点。所以他们需要看起来像这样:
icd9code
28521
59390
28521
v0481
我可以使用什么功能?特别是,如果只有4位数字,我怎么能在数字的末尾显示0。另外,我如何转移以“ v”开头的号码?
最佳答案
这是向量化的解决方案:
x <- c("285.21", "593.9", "285.21", "v04.81")
substr(gsub("\\.", "", paste0(x, "00000")), 1, 5)
# [1] "28521" "59390" "28521" "v0481"