我正在寻找解决方案。我只是可以通过手动重新安排解决。

Example code:

  library(dplyr)

    set.seed(1)
    Data <- data.frame(
      W = sample(1:10),
      X = sample(1:10),
      Y = sample(c("yes", "no"), 10, replace = TRUE),
      Z = sample(c("cat", "dog"), 10, replace = TRUE)
    )
    #
    summarized <- Data %>% group_by(Z) %>% summarise_if(is.numeric,funs(mean,median),na.rm=T)

print(Data)

r - 汇总旁边的变量-LMLPHP

我希望输出如下所示,将每个函数应用于第一个col,然后将每个函数应用于第二个col,依此类推。我的代码反之亦然。

当然,我可以重新排列列,但这不是Data Science的意思。我有数百个列,想应用多个功能。

这就是我要的:
summarized <- summarized[,c(1,2,4,3,5)] #best solution yet

r - 汇总旁边的变量-LMLPHP

我有什么想念的吗?我敢打赌,有一个简单的解决方案或其他功能可以胜任。
伙计们,谢谢!

最佳答案

一种选择是使用足够的select_helpers后处理

library(dplyr)
summarized %>%
    select(Z, starts_with('W'), everything())
# A tibble: 2 x 5
#  Z     W_mean W_median X_mean X_median
#  <fct>  <dbl>    <dbl>  <dbl>    <dbl>
#1 cat     5.25      5.5   3.75      3.5
#2 dog     5.67      5.5   6.67      7

如果有100列,则一种方法是获取列名称的子字符串,并进行排序
library(stringr)
summarized %>%
         select(Z, order(str_remove(names(.), "_.*")))
# A tibble: 2 x 5
#  Z     W_mean W_median X_mean X_median
#  <fct>  <dbl>    <dbl>  <dbl>    <dbl>
#1 cat     5.25      5.5   3.75      3.5
#2 dog     5.67      5.5   6.67      7

关于r - 汇总旁边的变量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/59251881/

10-12 16:33