我使用onehotencoder.pkl
文件以便按如下所示解码新数据:
my_encoder = joblib.load('onehotencoder.pkl')
X = pd.DataFrame(my_encoder.transform(X).toarray())
但是,新数据包含一些看不见的值。我知道可以使用
handle_unknown='ignore'
忽略这些值,但是如何在我的情况下传递此参数?我如何正确处理此类情况以避免运行时错误? 最佳答案
您从与此类似的东西开始
OneHotEncoder(categorical_features='all', dtype=<class 'numpy.float64'>,
handle_unknown='error', n_values='auto', sparse=True)
现在做
my_encoder.handle_unknown = 'ignore'
你会得到
OneHotEncoder(categorical_features='all', dtype=<class 'numpy.float64'>,
handle_unknown='ignore', n_values='auto', sparse=True)