这个问题在这里已经有了答案:





Difference of two character vectors with substring

(3 个回答)


4年前关闭。




我有两个字符向量:

x = {"a", "b", "c", "kt"}
y = {"abs", "kot", "ccf", "okt", "kk", "y"}

我需要使用 x 从 y 中删除条目,以便只保留不包含任何 x 条目的字符串,如下所示:
y = {"kot", "kk", "y"}

该代码应该适用于任何大小的向量 x 和 y。

到目前为止,我已尝试使用 gsub 和 grepl,但这些仅适用于单个字符串。我试图创建一个循环来执行此操作,但问题似乎比我想象的要困难。当然,解决方案越复杂越好,但您可以假设在这种情况下向量 x 和 y 最多有 200 个条目。

最佳答案

我们可以使用 grep 找出 y 中的哪些值与 x 中的模式匹配,并使用 !%in% 排除它们

y[!y %in% grep(paste0(x, collapse = "|"), y, value = T)]

#[1] "kot" "kk"  "y"

或者使用 grepl 更好,因为它返回 bool 向量
y[!grepl(paste0(x, collapse = "|"), y)]

使用 grepinvert 参数的 value 的简洁版本
grep(paste0(x, collapse = "|"), y, invert = TRUE, value = TRUE)
#[1] "kot" "kk"  "y"

关于从包含 R 中特定字符的字符串向量中删除条目,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40885360/

10-13 07:01
查看更多