我想找到并提取一个字符串的最长单词,如果可能的话,使用tidyverse包。

library(tidyverse)

tbl <- tibble(a=c("ab cde", "bcde f", "cde fg"), b=c("cde", "bcde", "cde"))
tbl
# A tibble: 3 x 1
   a
<chr>
1 ab cde
2 bcde f
3 cde fg

我正在寻找的结果是:
# A tibble: 3 x 2
   a     b
  <chr> <chr>
1 ab cde   cde
2 bcde f  bcde
3 cde fg   cde

我发现的最接近问题的帖子是:longest word in a string。有没有人想过一种更简单的方法?

最佳答案

使用基数R的解决方案:

# Using OPs provided data
tbl$b <- sapply(strsplit(tbl$a, " "), function(x) x[which.max(nchar(x))])

解释:
  • 将每一行拆分成单词(strsplit)
  • 确定单词长度(nchar)
  • 选择行中最长的单词(which.max)
  • 关于r - 提取字符串中最长的单词,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/47132629/

    10-12 18:56