*基本上,我试图按对象在过去一个小时内的分数排序。
我正在尝试为数据库中的对象生成每小时的票数总和。投票被嵌入每个对象中。对象架构如下所示:
{
_id: ObjectId
score: int
hourly-score: int <- need to update this value so I can order by it
recently-voted: boolean
votes: {
"4e4634821dff6f103c040000": { <- Key is __toString of voter ObjectId
"_id": ObjectId("4e4634821dff6f103c040000"), <- Voter ObjectId
"a": 1, <- Vote amount
"ca": ISODate("2011-08-16T00:01:34.975Z"), <- Created at MongoDate
"ts": 1313452894 <- Created at timestamp
},
... repeat ...
}
}
这个问题实际上与我几天前问的一个问题Best way to model a voting system in MongoDB
我如何(可以?)运行MapReduce命令来执行以下操作:
我还阅读了here,可以通过在M/R命令之前运行db.getMongo()。setSlaveOk()在从属DB上执行MapReduce。我可以在从属服务器上运行reduce并更新主数据库吗?
Mongo MapReduce甚至可以就地更新吗?
最佳答案
您绝对可以做到这一点。我会一次解决您的问题:
1。
您可以指定查询以及map-reduce,以过滤将传递到map阶段的对象集。在mongo shell中,这看起来像(假设m
和r
分别是您的mapper和reducer函数的名称):
> db.coll.mapReduce(m, r, {query: {$or: [{"recently-voted": true}, {"hourly-score": {$gt: 0}}]}})
2。
步骤#1将使您在所有文档中使用映射器,且在最后一小时内至少有一票(或将
recently-voted
设置为true),但并非所有投票都已在最后一小时内使用。因此,您需要过滤映射器中的列表,并且只发出您希望计数的选票:function m() {
var hour_ago = new Date() - 3600000;
this.votes.forEach(function (vote) {
if (vote.ts > hour_ago) {
emit(/* your key */, this.vote.a);
}
});
}
并减少:
function r(key, values) {
var sum = 0;
values.forEach(function(value) { sum += value; });
return sum;
}
3。
要更新小时分数表,您可以使用
reduceOutput
选项进行map-reduce,这将同时使用发出的值和输出集合中先前保存的值(如果有)来调用reducer。传递的结果将保存到输出集合中。看起来像:> db.coll.mapReduce(m, r, {query: ..., out: {reduce: "output_coll"}})
除了减少输出之外,您还可以使用
merge
,它将新创建的文件覆盖输出集合中的文档(但是留下的_id
与您的mr作业创建的_id
不同的任何replace
文件){inline: 1}
,这是有效的默认为拖放操作,或者使用{inline: 1}
,它将结果直接返回到 shell 程序或驱动程序。请注意,使用ojit_code时,结果必须适合单个文档允许的大小(在最新的MongoDB版本中为16MB)。(4.)
您可以在辅助服务器(“从属服务器”)上运行map-reduce作业,但是由于辅助服务器无法接受写入(这是使它们成为辅助服务器的原因),因此只能在使用内联输出时执行此操作。
关于mapreduce - MongoDB MapReduce更新到位如何,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/7072320/