我正试图确定这是否是一个已解决的问题,以及我应该搜索哪些算法。
问题在于:我将一个资源发送到一个删除服务,它会对其进行多次猜测,每个猜测都有自己的确定性百分比级别。其中一些猜测将成为其他人的别名。
因此,如果服务猜测资源是一个具有80%确定性的一次猜测的A,而具有40%、50%和60%确定性的三次猜测的A B(例如)在较低的百分比下也可能有其他的单一猜测。
在这种情况下,应用什么样的算法可以在A和B之间进行选择?
或者,哪个概率域适用?
一开始,我考虑过两个将军的问题,但这更多的是因为交付的不确定性,而不是内容的不确定性。
如果这是一个已解决的问题,我应该研究什么算法?
编辑
根据下面的评论和回答,这里有一些更多的信息。
猜测是相互独立的
个人的猜测加起来不到100%。每个猜测都是试图将传入的资源与集合中存在的资源匹配。确定性只取决于匹配的精确程度。
这些资源中的每一个(都是唯一的)都有一些元数据来标识它…一个文本标签,如果你愿意的话。这些可能不是唯一的因此,多个唯一资源可能具有相同的标签,从而消除别名。

最佳答案

“最佳”答案取决于您如何解释同一资源的多个猜测(具有不同别名的猜测)。如果您认为每个被猜测的别名都是一个新的“独立”猜测,而不仅仅是受另一个猜测影响的部分重复猜测,那么解释您所报告的猜测“概率/置信度”的适当方法是将所有被猜测的别名在资源中的百分比相加,无论什么资源的总概率得分最高,都要选择那个。
很难给出更好的答案,除非你能解释一下所报告的猜测“概率/可信度”是如何计算出来的,因为例如,理想情况下,如果所有猜测的所有百分比实际上是每个猜测的概率分数,并且只有一个正确的资源与您的查询匹配,那么所有猜测的所有百分比的总和应为100%(或更少)。如果你的“概率/信心”分数加起来超过100%,那么也许有更好的方法来解释它们,如果你能告诉我们它们是如何计算的/它们真正的“含义”。

09-11 17:35
查看更多