Python中是否有任何可进行数据转换的软件包:缩放,居中和Box-Cox转换以消除数据偏斜?
在R中,可以使用caret
包完成此操作:
set.seed(1)
predictors = data.frame(x1 = rnorm(1000,
mean = 5,
sd = 2),
x2 = rexp(1000,
rate=10))
require(caret)
trans = preProcess(predictors,
c("BoxCox", "center", "scale"))
predictorsTrans = data.frame(
trans = predict(trans, predictors))
我知道
sklearn
,但是找不到上述处理功能。 最佳答案
为了缩放和居中,您可以使用preprocessing
中的sklearn
:
from sklearn import preprocessing
centered_scaled_data = preprocessing.scale(original_data)
对于Box-Cox,您可以使用
boxcox
中的scipy
:from scipy.stats import boxcox
boxcox_transformed_data = boxcox(original_data)
为了计算偏度,您可以使用
skew
中的scipy
:from scipy.stats import skew
skness = skew(original_data)
您可以阅读有关Resolving Skewness in this post的更多详细信息。另外,您可以找到有关Centering & Scaling here的更多详细信息。
关于python - 用于数据缩放,居中和Box-Cox转换的Python库,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33944129/