我试图理解AMS草图和计数草图算法之间的区别我的理解是,它们的目标/输出都是返回一个草图,即频率向量。包含蒸汽中元素的频率。两者有什么区别?
直观地说,AMS算法只显示一个elment是否经过,而不计算实际经过的次数。尽管我不确定这是否正确。
此外,我不知道为什么首先需要一个素描。为什么不使用一个普通的字典,每当一个元素散列到字典中的某个值时就增加一个计数器呢?
希望这是有意义的谢谢

最佳答案

这两种方法都试图解决这样的问题:保持元素的计数比实际放入字典中的元素要多你不可能这样做,但是你可以用一定的错误率来解决相关的问题。
AMS草图试图解决正确估计各种总体统计数据的问题。例如频率平方和。
计数草图试图解决正确估计个体计数的问题因此,在任何时候,你都可以获取你可能看到的任何特定值,并估算出你看到它的次数这个估计是无偏的,同样可能是高或低。
count min草图与count草图类似,只是它提供了您见过它多少次的上限。(“min”指的是在算法中取的min。)

关于algorithm - 输出AMS草图和计数草图算法之间的区别,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56545503/

10-09 17:58