编辑-我发现它与pivot table不同。因为就我而言,它基于日期
我有链接数据表。我想将每个客户的最新活动返回到列中,例如用于数据挖掘的时态数据。
所以我的表中有这些列:
id_user | item_id | date
1 | 2 | 2016-11-10
1 | 3 | 2016-9-9
1 | 23 | 2016-8-8
1 | 21 | 2016-6-6
1 | 5 | 2016-7-7
1 | 4 | 2016-10-10
2 | 3 | 2016-9-9
2 | 4 | 2016-10-10
2 | 21 | 2016-5-4
3 | 4 | 2016-10-10
3 | 4 | 2016-9-9
首先-我想过滤数据以获得“最近5次”活动。然后我想出了这段代码
set @num := 0, @group := '';
select x.`id_user`, x.`item_id`, x.`date`
from
(
select `id_user`, `item_id`, `date`,
@num := if(@group = `id_user`, @num + 1, 1) as row_number,
@group := `id_user` as dummy
from ratings
order by `id_user`, `date` desc, `item_id`
) as x,
where x.row_number <= 5
ORDER BY x.`user_id`, x.date DESC;
这些代码给我这张表:
id_user | item_id | date
1 | 2 | 2016-11-10
1 | 4 | 2016-10-10
1 | 3 | 2016-9-9
1 | 23 | 2016-8-8
1 | 5 | 2016-7-7
2 | 4 | 2016-10-10
2 | 3 | 2016-9-9
2 | 21 | 2016-5-4
3 | 4 | 2016-10-10
3 | 4 | 2016-9-9
但是-我想要这样的东西来进行数据挖掘
Id_user | item_1 | Item_2 | Item_3 | Item_4 | Item_5
1 | 2 | 4 | 3 | 23 | 5 |
2 | 4 | 3 | 21 | NULL | NULL |
3 | 4 | 4 | NULL | NULL | NULL |
你知道我的主意吗?抱歉,如果我不能清楚解释,希望您能理解我想要的内容。
问题
如何针对这些问题进行SQL查询? (当前我从MySQL数据库获得RAW数据)
有没有更好的方法来解决这个问题?我希望这是最佳做法。
最佳答案
首先,在使用变量时,请勿在不同的表达式中分配和使用变量。 MySQL不保证SELECT
中表达式的求值顺序。而且,实际上,在某些情况下,它们以不同的顺序进行评估。
因此,这应该是您的查询:
select r.`id_user`, r.`item_id`, r.`date`
from (select `id_user`, `item_id`, `date`,
(@num := if(@u = id_user, @num + 1,
if(@u := id_user, 1, 1)
)
) as num
from ratings r cross join
(select @num := 0, @u := -1) params
order by `id_user`, `date` desc, `item_id`
) r
where x.row_number <= 5
order by x.`user_id`, x.date desc;
然后,只需使用条件聚合:
select r.`id_user`,
max(case when num = 1 then r.item_id end) as item_id_1,
max(case when num = 2 then r.item_id end) as item_id_2,
max(case when num = 3 then r.item_id end) as item_id_3,
max(case when num = 4 then r.item_id end) as item_id_4,
max(case when num = 5 then r.item_id end) as item_id_5
from (select `id_user`, `item_id`, `date`,
(@num := if(@u = id_user, @num + 1,
if(@u := id_user, 1, 1)
)
) as num
from ratings r cross join
(select @num := 0, @u := -1) params
order by `id_user`, `date` desc, `item_id`
) r
where x.row_number <= 5
group by x.`user_id`;