我想写一个流量生成器,它复制运行中的计算机对内存的原始读写需求。
但是运行中的计算机在其内存引用中也显示出(非常强的)局部性,在64位地址空间中,只有非常小的地址范围会被引用(事实上,我在一个基准测试中测试过这一点,并触摸了大约9000页提供的数十亿个页面)。
什么是一个很好的方法来建模这样的稀疏概率密度函数(C或C++理想)-我有基准的概率,但不需要太密切地跟随他们(因为我可以只使用基准引用在任何情况下,但希望有点更灵活)。
为了澄清这一点,我还拥有关于每页应该读取多少次的数据,但我感兴趣的是选择页面的顺序(评论中提出的马尔可夫链思想可能就是这样做的)
最佳答案
值得一提的是,我决定使用一个相当粗糙的技巧——沿着以下思路:选择一个介于1和0之间的随机数,在分布中找到频率/概率等于或大于此数的元素(选择此集中所有元素的最小概率)似乎有用(我在R里做的)
关于c - 如何最好地建模(非常)稀疏概率密度函数?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24716024/