我进行了搜索,发现了类似的内容,但没有完全正确的内容。希望这还没有得到解决。
可以说我有一列Y,N,有时还有其他信息
df<-data.frame(Names=c("Patient1","patient2","Patient3","Patient4","patient5"),Surgery=c("Y","N","Y-this kind of surgery","See note","Y"))
我正在尝试将Y或N分成一列,并将其他所有内容从该列中分开。
我试过了
df%>%separate('Surgery',c("Surgery","Notes"), sep=" ")
最终将出现一列“看到”,下一列有“注释”
df%>%separate('Surgery',c("Surgery","Notes"), sep = '^Y|^N')
变得奇怪
df%>%separate('Surgery',c("Surgery","Notes), sep= "^[YN]?")
正确拆分音符,删除Y和N。
有人知道如何分开吗?我要查找的结果将在手术列中仅包含Y或N,而将其他任何内容推送到其他列。
最佳答案
我们可以使用extract
中的tidyr
library(tidyr)
library(dplyr)
df %>%
extract(Surgery, into = c("Surgery", "Notes"), "^([YN]*)[[:punct:]]*(.*)")
# Names Surgery Notes
#1 Patient1 Y
#2 patient2 N
#3 Patient3 Y this kind of surgery
#4 Patient4 See note
#5 patient5 Y