所以我有一个加权项目列表,我想从这个列表中挑选 4 个非重复项目。
Item Weight
Apple 5
Banana 7
Cherry 12
...
Orange 8
Pineapple 50
执行此操作的最有效方法是什么?我最初的尝试是,如果已经选择的项目出现,则为后续选择重新 throw ……但对于小列表,这可能会导致大量重新 throw 。
编辑以澄清:
对于上面的例子,忽略水果 D 到 N,总重量为 82。所以首先被采摘的机会是:
约 6%
乙~8.5%
碳 ~14.6%
氧~9.8%
P ~61%
一旦选择了一个项目,概率就会(应该!)改变。
最佳答案
在您的评论中,您说独特意味着:
.. 权重决定了被选中的可能性。
您需要做的就是确保不选择重复项,只需在选择下一项之前从列表中删除最后一项。是的,这会稍微改变您的权重,但如果您确实想要独特的结果,那么这是正确的统计更改。
此外,我不确定您是如何使用权重来确定候选对象的,但我提出了这个算法,该算法应该以最少的循环次数(并且不需要根据权重填充数组)可能导致非常大的数组,需要 int 权重等)
我在这里使用了 JavaScript,只是为了在没有服务器的情况下很容易在浏览器中查看输出。移植到 PHP 应该是微不足道的,因为它没有做任何复杂的事情。
常数
var FRUITS = [
{name : "Apple", weight: 8 },
{name : "Orange", weight: 4 },
{name : "Banana", weight: 4 },
{name : "Nectarine", weight: 3 },
{name : "Kiwi", weight: 1 }
];
var PICKS = 3;
function getNewFruitsAvailable(fruits, removeFruit) {
var newFruits = [];
for (var idx in fruits) {
if (fruits[idx].name != removeFruit) {
newFruits.push(fruits[idx]);
}
}
return newFruits;
}
脚本
var results = [];
var candidateFruits = FRUITS;
for (var i=0; i < PICKS; i++) {
// CALCULATE TOTAL WEIGHT OF AVAILABLE FRUITS
var totalweight = 0;
for (var idx in candidateFruits) {
totalweight += candidateFruits[idx].weight;
}
console.log("Total weight: " + totalweight);
var rand = Math.random();
console.log("Random: " + rand);
// ITERATE THROUGH FRUITS AND PICK THE ONE THAT MATCHES THE RANDOM
var weightinc = 0;
for (idx in candidateFruits) {
// INCREMENT THE WEIGHT BY THE NEXT FRUIT'S WEIGHT
var candidate = candidateFruits[idx];
weightinc += candidate.weight;
// IF rand IS BETWEEN LAST WEIGHT AND NEXT WEIGHT, PICK THIS FRUIT
if (rand < weightinc/totalweight) {
results.push(candidate.name);
console.log("Pick: " + candidate.name);
// GET NEXT SET OF FRUITS (REMOVING PICKED FRUIT)
candidateFruits = getNewFruitsAvailable(candidateFruits, candidate.name);
break;
}
}
console.log("CandidateFruits: " + candidateFruits.length);
};
输出
for (var i=0; i < results.length; i++) {
document.write(results[i] + "<br/>");
}
基本策略是为每个水果分配总范围
[0,1)
的一部分。在第一个循环中,您将拥有:该脚本迭代列表中的每个项目,并计算一个重量计数器。当它到达包含第一个随机数的范围时,它选择该项目,将其从列表中删除,然后根据新的总重量重新计算范围并再次运行。