我正在检查AWS CloudSearch以获取系统的新搜索引擎。
假设每篇文章都有文章和一些评论。搜索API应该返回匹配的或具有匹配注释的文章。那么,有什么方法可以通过一次查询从CloudSearch检索DISTINCT值(在这种情况下,是商品的唯一ID)?如果不是,那么通过CloudSearch解决此功能要求的最佳解决方案是什么?
我知道CloudSearch中文档字段的文本数组类型,但是更新文档似乎很昂贵,因为单个文章的注释数可能超过数千。
最佳答案
我遇到了类似的问题,因为在cloudsearch中数组元素不能超过1000个,所以在您的情况下不能添加注释。我将创建两个搜索域,即文章和评论。我将同时向它们两个发出搜索查询(异步或多线程,具体取决于语言),文章将始终生成非重复的ID,但是根据评论查询的结果,您仅需将逻辑应用于文章ID一次,并始终选择排名靠前的,因为结果按匹配分数排序。
关于search-engine - 在CloudSearch查询中的特定字段上应用不重复,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/25104760/