*基本上,我试图按对象在过去一个小时内的分数排序。

我正在尝试为数据库中的对象生成每小时的票数总和。投票被嵌入每个对象中。对象架构如下所示:

{
    _id: ObjectId
    score: int
    hourly-score: int <- need to update this value so I can order by it
    recently-voted: boolean
    votes: {
        "4e4634821dff6f103c040000": { <- Key is __toString of voter ObjectId
            "_id": ObjectId("4e4634821dff6f103c040000"), <- Voter ObjectId
            "a": 1, <- Vote amount
            "ca": ISODate("2011-08-16T00:01:34.975Z"), <- Created at MongoDate
            "ts": 1313452894 <- Created at timestamp
        },
        ... repeat ...
    }
}

这个问题实际上与我几天前问的一个问题Best way to model a voting system in MongoDB

我如何(可以?)运行MapReduce命令来执行以下操作:
  • 仅在最近投票= true或每小时分数> 0的对象上运行。
  • 计算最近一小时创建的投票总数。
  • 更新小时分数=上面计算的总和,最近投票=否。

  • 我还阅读了here,可以通过在M/R命令之前运行db.getMongo()。setSlaveOk()在从属DB上执行MapReduce。我可以在从属服务器上运行reduce并更新主数据库吗?

    Mongo MapReduce甚至可以就地更新吗?

    最佳答案

    您绝对可以做到这一点。我会一次解决您的问题:

    1。
    您可以指定查询以及map-reduce,以过滤将传递到map阶段的对象集。在mongo shell中,这看起来像(假设mr分别是您的mapper和reducer函数的名称):

    > db.coll.mapReduce(m, r, {query: {$or: [{"recently-voted": true}, {"hourly-score": {$gt: 0}}]}})
    

    2。
    步骤#1将使您在所有文档中使用映射器,且在最后一小时内至少有一票(或将recently-voted设置为true),但并非所有投票都已在最后一小时内使用。因此,您需要过滤映射器中的列表,并且只发出您希望计数的选票:
    function m() {
      var hour_ago = new Date() - 3600000;
      this.votes.forEach(function (vote) {
        if (vote.ts > hour_ago) {
          emit(/* your key */, this.vote.a);
        }
      });
    }
    

    并减少:
    function r(key, values) {
      var sum = 0;
      values.forEach(function(value) { sum += value; });
      return sum;
    }
    

    3。
    要更新小时分数表,您可以使用reduceOutput选项进行map-reduce,这将同时使用发出的值和输出集合中先前保存的值(如果有)来调用reducer。传递的结果将保存到输出集合中。看起来像:
    > db.coll.mapReduce(m, r, {query: ..., out: {reduce: "output_coll"}})
    

    除了减少输出之外,您还可以使用merge,它将新创建的文件覆盖输出集合中的文档(但是留下的_id与您的mr作业创建的_id不同的任何replace文件){inline: 1},这是有效的默认为拖放操作,或者使用{inline: 1},它将结果直接返回到 shell 程序或驱动程序。请注意,使用ojit_code时,结果必须适合单个文档允许的大小(在最新的MongoDB版本中为16MB)。

    (4.)
    您可以在辅助服务器(“从属服务器”)上运行map-reduce作业,但是由于辅助服务器无法接受写入(这是使它们成为辅助服务器的原因),因此只能在使用内联输出时执行此操作。

    关于mapreduce - MongoDB MapReduce更新到位如何,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7072320/

    10-16 03:00