我是SQL / Pandas的新手,因此是个问题。
我有3张桌子

['invites','quotes', 'users']


他们每个人的结构都是

invites->invite_id, request_id, user_id, date

quotes ->quote_id, invite_id, data

....


我运行以下查询以对邀请添加引号。

'SELECT i.invite_id, q.quote_id, i.sent_time FROM invites AS i INNER JOIN quotes AS q ON i.invite_id = q.invite_id'


这给了我下表

invite_id, quote_id, date


我已将其导入数据框。
现在,我想从此数据框中找到两件事。

quotes_per_invite

quotes_per_invite_on_a_per_day_basis


我不知道该怎么做。非常感谢您的帮助。

最佳答案

查看groupby上的熊猫文档

计算每个邀请的所有报价

df.groupby('invite_id')['quote_id'].count()


或计算每个邀请的不同或独特的报价

df.groupby('invite_id')['quote_id'].nunique()


*HINT*您可以在分组依据中使用列表。

关于python - Pandas 的时间序列分析,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43244833/

10-12 23:33