我正在尝试在 Spark 中使用 takeSample()
函数,参数是 - 数据、要采集的样本数和种子 。但我不想使用种子。我想每次都有不同的答案。我不知道如何做到这一点。我尝试使用 System.nanoTime
作为种子值但它给出了一个错误,因为我认为数据类型不匹配。是否有其他类似于 takeSample()
的函数可以在没有种子的情况下使用?或者是否有任何其他实现可以与 takeSample()
一起使用,以便每次都能获得不同的输出。
最佳答案
System.nanoTime
是 long
类型,takeSample
期望的种子是 Int
类型。因此,takeSample(..., System.nanoTime.toInt)
应该可以工作。
关于scala - Spark 中的 takeSample() 函数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14688107/