我正试图通过将日期时间缩短到小时来汇总记录。在MongoEngine中是否有保存字段类型的方法?
我的数据是:

{'spent': 7, 'time_started': datetime.datetime(2015, 4, 21, 16, 2, 16, 661000)}
{'spent': 3, 'time_started': datetime.datetime(2015, 4, 21, 17, 8, 5, 415000)}
{'spent': 3, 'time_started': datetime.datetime(2015, 4, 21, 15, 52, 45, 917000)}
{'spent': 1, 'time_started': datetime.datetime(2015, 4, 21, 16, 42, 32, 313000)}
{'spent': 8, 'time_started': datetime.datetime(2015, 4, 21, 16, 35, 46, 863000)}
{'spent': 5, 'time_started': datetime.datetime(2015, 4, 21, 15, 55, 1, 217000)}
{'spent': 10, 'time_started': datetime.datetime(2015, 4, 20, 17, 41, 50, 5000)}

到目前为止,我得出的结论是:
pipeline =[
    'match': {
        "time_started": {
            "$gte": datetime.datetime(2015, 4, 21, 0, 0, 0),
            }
        },
    'project': {
        "spent": "$spent",
         "time_started": {"$dateToString": {
                "format": "%Y-%m-%dT%H:00:00",
                "date": "$time_started"
            }}
        },
    'group': {
        "_id": {
            "time_started": "$time_started",
            },
        "spent_total": {"$sum": "$spent"}
        }
    ]

它工作得很好,但是“time_started”是结果中的一个字符串,而我需要datetime,如下所示:
{'spent_total': 16, 'time_started': datetime.datetime(2015, 4, 21, 16, 0, 0)}
{'spent_total': 3, 'time_started': datetime.datetime(2015, 4, 21, 17, 0, 0)}
{'spent_total': 8, 'time_started': datetime.datetime(2015, 4, 21, 15, 0, 0)}

最佳答案

对。您可以对对象使用“日期数学”,然后它们将保留为bson日期类型并转换为驱动程序中的本机类型:

pipeline = [
    { '$match': {
        "time_started": {
            "$gte": datetime.datetime(2015, 4, 21, 0, 0, 0),
            }
        }
     }},
     { "$group": {
        "_id": {
             "$add": [
                 { "$subtract": [
                     { "$subtract": [
                         "$time_started", datetime.datetime(1970, 1, 1)
                     ]},
                     { "$mod": [
                         { "$subtract": [
                             "$time_started", datetime.datetime(1970, 1, 1)
                         ]},
                         1000 * 60 * 60
                     ]}
                 ]},
                 datetime.datetime(1970, 1, 1)
             ]
        },
        "spent_total": { "$sum": "$spent" }
     }}
 ];

Class._get_collection().aggregate(pipeline);

其中的基本概念是,当您从日期字段的值中减去“epoch date”时,返回的值是数字。在这里,应用一个模$mod计算出一小时内毫秒的余数,并将日期四舍五入到一小时。
当您将“epoch date”添加到数字时,则相反,它返回一个新的Date对象,该对象等于以毫秒为单位的表示值。
因为它已经是一个日期了,所以驱动程序会相应地处理它,不需要翻译。比使用字符串或其他运算符要好得多。另外请注意,您不需要$project,只需将这样的转换直接应用到_id中的$group,甚至可以加快速度。

关于python - 按小时聚合时返回日期对象,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/32506805/

10-10 09:40
查看更多