我是SQL / Pandas的新手,因此是个问题。
我有3张桌子
['invites','quotes', 'users']
他们每个人的结构都是
invites->invite_id, request_id, user_id, date
quotes ->quote_id, invite_id, data
....
我运行以下查询以对邀请添加引号。
'SELECT i.invite_id, q.quote_id, i.sent_time FROM invites AS i INNER JOIN quotes AS q ON i.invite_id = q.invite_id'
这给了我下表
invite_id, quote_id, date
我已将其导入数据框。
现在,我想从此数据框中找到两件事。
quotes_per_invite
quotes_per_invite_on_a_per_day_basis
我不知道该怎么做。非常感谢您的帮助。
最佳答案
查看groupby
上的熊猫文档
计算每个邀请的所有报价
df.groupby('invite_id')['quote_id'].count()
或计算每个邀请的不同或独特的报价
df.groupby('invite_id')['quote_id'].nunique()
*HINT*
您可以在分组依据中使用列表。关于python - Pandas 的时间序列分析,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43244833/