apache-spark - 如何使用Spark决策树调整分类阈值 | Spark

Spark

python - 使用Boost Python从python调用C++:介绍性示例不起作用

c++ - 从编译器的角度来看，如何处理数组的引用，以及为什么不允许按值传递(而不是衰减)？

javascript - 难以理解如何避免JavaScript中的跨域污染

c++ - C++禁用C1061错误-嵌套到深处的块？

java - 当使用2个不同的HashMaps时，我能够使用第一个而不是第二个创建keySet

c - 我想将我的输入文件复制到我的输出文件中。

numpy - 如何在Python/numpy中将3D数组结果保存到4D数组中？

c++ - Windows中无法解析的外部符号

c++ - 使用输入参数初始化结构

c - union 会支持灵活的数组成员吗？

air - 获取我的串行端口以与我的Adobe Air应用程序对话

c++ - 将类型转换为int时，是否始终保证C/C++ bool类型为0或1？

c++ - 格式化project.pbxproj

assembly - 在 RISC-V 上在大端和小端之间转换

c++ - 为什么在初始化期间应用用户定义的转换？

apache-spark - 如何使用Spark决策树调整分类阈值

扫码查看

我正在使用Spark 2.0和新的spark.ml。包。
有没有一种方法可以调整分类阈值，以便减少误报的数量。
如果重要的话，我也在使用CrossValidator。

我看到RandomForestClassifier和DecisionTreeClassifier都输出一个概率列(我可以手动使用，但是GBTClassifier不能。

最佳答案

听起来您可能正在寻找 thresholds 参数:

您将需要通过在分类器上调用setThresholds(value: Array[Double])进行设置。

关于apache-spark - 如何使用Spark决策树调整分类阈值，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/39359631/

10-11 19:16