我正在尝试在 Spark 中使用 takeSample() 函数,参数是 - 数据、要采集的样本数和种子 。但我不想使用种子。我想每次都有不同的答案。我不知道如何做到这一点。我尝试使用 System.nanoTime 作为种子值但它给出了一个错误,因为我认为数据类型不匹配。是否有其他类似于 takeSample() 的函数可以在没有种子的情况下使用?或者是否有任何其他实现可以与 takeSample() 一起使用,以便每次都能获得不同的输出。

最佳答案

System.nanoTimelong 类型,takeSample 期望的种子是 Int 类型。因此,takeSample(..., System.nanoTime.toInt) 应该可以工作。

关于scala - Spark 中的 takeSample() 函数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14688107/

10-10 16:37