我正在研究多类分类(10个类)。我正在使用sklearn.linear_model.SGDClassifier。我看到该模型使用了一种“所有人对所有人”的方法。 SGDClassifier有一个参数class_weight:“与类关联的权重。如果未给出,则所有类都应具有权重1。

“平衡”模式使用y的值自动将权重与输入数据中的类频率成反比地调整为n_samples /(n_classes * np.bincount(y))。”例如,在训练期间如何使用class_weight?拥有标签A-5个样本,标签B-15个样本和标签C-100个样本。假设模型A与B和C正在训练。损失函数的计算中是否包含class_weights?“计分”怎么样?SGDClassifier具有“准确性”作为默认评分选项。

最佳答案

这是我的理解。
分类器优化以下目标函数:
machine-learning - sklearn.linear_model.SGDClassifier如何用于多类分类?-LMLPHP

L是损失函数,w是类权重。损失函数是用户定义的参数。

关于machine-learning - sklearn.linear_model.SGDClassifier如何用于多类分类?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54189634/

10-10 07:11