Python中是否有任何可进行数据转换的软件包:缩放,居中和Box-Cox转换以消除数据偏斜?
在R中,可以使用caret包完成此操作:

set.seed(1)
predictors = data.frame(x1 = rnorm(1000,
                                   mean = 5,
                                   sd = 2),
                        x2 = rexp(1000,
                                  rate=10))

require(caret)

trans = preProcess(predictors,
                   c("BoxCox", "center", "scale"))
predictorsTrans = data.frame(
      trans = predict(trans, predictors))

我知道sklearn,但是找不到上述处理功能。

最佳答案

为了缩放和居中,您可以使用preprocessing中的sklearn:

from sklearn import preprocessing
centered_scaled_data = preprocessing.scale(original_data)

对于Box-Cox,您可以使用boxcox中的scipy:
from scipy.stats import boxcox
boxcox_transformed_data = boxcox(original_data)

为了计算偏度,您可以使用skew中的scipy:
from scipy.stats import skew
skness = skew(original_data)

您可以阅读有关Resolving Skewness in this post的更多详细信息。另外,您可以找到有关Centering & Scaling here的更多详细信息。

关于python - 用于数据缩放,居中和Box-Cox转换的Python库,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33944129/

10-11 22:03
查看更多