我使用onehotencoder.pkl文件以便按如下所示解码新数据:

my_encoder = joblib.load('onehotencoder.pkl')
X = pd.DataFrame(my_encoder.transform(X).toarray())


但是,新数据包含一些看不见的值。我知道可以使用handle_unknown='ignore'忽略这些值,但是如何在我的情况下传递此参数?我如何正确处理此类情况以避免运行时错误?

最佳答案

您从与此类似的东西开始

OneHotEncoder(categorical_features='all', dtype=<class 'numpy.float64'>,
       handle_unknown='error', n_values='auto', sparse=True)


现在做

my_encoder.handle_unknown = 'ignore'


你会得到

OneHotEncoder(categorical_features='all', dtype=<class 'numpy.float64'>,
       handle_unknown='ignore', n_values='auto', sparse=True)

10-08 04:23