我有一个这样的文档集。例如:
{ 'observer': 'machine1',
'seen': [
{'page1': ['/link1', '/link3']},
{'page2': ['/link4', '/link1']},
}
{ 'observer': 'machine2',
'seen': [
{'page3': ['/link2']},
{'page1': ['/link5']},
}
我试图得到数组中所有不同键和值的列表,按
observer
分组。在理想的世界里,它看起来像:{'machine1': ['/link1', '/link3', '/link4'], 'machine2': ['/link2', '/link5'] }
和
{'machine1': ['page1', 'page2'], 'machine2': ['page1', 'page3']}
我知道可以使用$aggregate和$group根据子列表获取唯一值,但我不确定如何处理对象列表并获取它们的键和值。
最佳答案
您可以使用下面的聚合
db.collection.aggregate([
{ "$unwind": "$seen" },
{ "$addFields": {
"seen": {
"$objectToArray": "$seen"
}
}},
{ "$unwind": "$seen" },
{ "$unwind": "$seen.v" },
{ "$group": {
"_id": "$observer",
"links": { "$addToSet": "$seen.v" }
}}
])
MongoPlayground
如果您需要同时
pages
和links
。db.collection.aggregate([
{ "$unwind": "$seen" },
{ "$addFields": {
"seen": {
"$objectToArray": "$seen"
}
}},
{ "$unwind": "$seen" },
{ "$unwind": "$seen.v" },
{ "$facet": {
"pages": [
{ "$group": {
"_id": "$observer",
"pages": { "$addToSet": "$seen.v" }
}}
],
"links": [
{ "$group": {
"_id": "$observer",
"links": { "$addToSet": "$seen.k" }
}}
]
}}
])
MongoPlayground
如果你需要更多的增强
db.collection.aggregate([
{ "$unwind": "$seen" },
{ "$addFields": {
"seen": {
"$objectToArray": "$seen"
}
}},
{ "$unwind": "$seen" },
{ "$unwind": "$seen.v" },
{ "$facet": {
"pages": [
{ "$group": {
"_id": "$observer",
"pages": { "$addToSet": "$seen.v" }
}}
],
"links": [
{ "$group": {
"_id": "$observer",
"pages": { "$addToSet": "$seen.k" }
}}
]
}},
{ "$project": {
"pages": {
"$map": {
"input": "$pages",
"in": {
"$let": {
"vars": {
"links": {
"$arrayElemAt": [
"$links",
{ "$indexOfArray": ["$links._id", "$$this._id"] }
]
}
},
"in": {
"_id": "$$this._id",
"pages": "$$this.pages",
"links": "$$links.links"
}
}
}
}
}
}},
{ "$unwind": "$pages" },
{ "$replaceRoot": { "newRoot": "$pages" }}
])
MongoPlayground