我是Windows上第一次运行R
的python3.7 64bit
用户。
我试图使用包PermutationImportance
中的eli5
从混合效果随机森林中获得排列重要性。
可重复性的数据集可以找到here。
适合:
merf = MERF(n_estimators= 500, max_iterations= 100)
np.random.seed(100)
merf.fit(X_train_merf, Z_train, clusters_train, y_train)
功能重要性:
perimp = PermutationImportance(merf, cv = None, refit = False, n_iter = 50).fit(X_train, Z_train, clusters_train, y_train)
上面的代码产生此错误
TypeError: fit() takes from 3 to 4 positional arguments but 5 were given
但是
fit()
仅包含4个参数...是否可以从
merf
对象完全获得功能重要性? 最佳答案
我不知道merf或eli5模块,但是我可以告诉您为什么发生这种异常。
如果查看PermutationImportance Module及其API的文档,则可以看到以下fit()方法的定义:
fit(X, y, groups=None, **fit_params)
最后一个参数之前的两颗星表示它是keyword argument。因此,实际上该方法可以采用3个位置参数和许多关键字参数。但这也意味着您需要命名第四个参数。在方法内部,您将获得此参数的字典,并且该方法需要知道如何处理它。
例:
def my_fit(X, **fit_params):
print(fit_params)
my_fit("positional argument", x=1,y=2,z=3)
>>> {'x': 1, 'y': 2, 'z': 3}
我不使用eli5,所以我无法告诉您使用什么关键字,或者根本不可能从merf对象获得功能的重要性,但是通过仅给您的最后一个参数命名即可解决错误:
perimp = PermutationImportance(merf, cv = None, refit = False, n_iter = 50).fit(X_train, Z_train, clusters_train, y_train=y_train)
希望该方法知道如何处理像这样的参数。