什么是“零均值和单位方差”,以及如何为R中的单列文件计算/归一化?我也想将归一化的值分为两类:

  • 标准化值至少比平均
  • 高0.5标准偏差(SD)
  • 归一化值比平均
  • 低至少0.5个标准偏差(SD)

    谢谢

    最佳答案

    引用“零均值和单位方差”表示标准化变量的平均值为0,标准偏差(和方差)为1。在R中标准化变量的一种方法是使用scale函数。这是一个例子:

    # create vector
    set.seed(1234)
    temp <- rnorm(20, 3, 7)
    
    # take a look
    > mean(temp)
    [1] 1.245352
    > sd(temp)
    [1] 7.096653
    
    # scale vector
    tempScaled <- c(scale(temp))
    
    # take a look
    > mean(tempScaled)
    [1] 1.112391e-17
    > sd(tempScaled)
    [1] 1
    
    # find values below 0.5 standard deviation in scaled vector
    tempScaled[tempScaled < -0.5]
    # find values above 0.5 standard deviation in scaled vector
    tempScaled[tempScaled > 0.5]
    

    您还可以很容易地手动缩放变量:
    tempScaled2 <- (temp - mean(temp)) / sd(temp)
    
    > all.equal(tempScaled, tempScaled2)
    [1] TRUE
    

    关于r - 如何计算/归一化零均值和单位方差,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/37730926/

    10-09 03:43