随着圣诞节的来临,微软的Power BI团队使用Power BI来回答大家一直以来所关心的问题:圣诞老人去哪?
要回答这个问题,来自社交网络的数据是最合适不过的了。于是Power BI团队用以下关键字在推特上做了一些搜索:"santa sighting", "saw santa"以及"#santasighting",把这些搜索结果数据导入到Excel之后,创建Power Pivot模型,然后在Power View中的可视化效果来浏览推特中的数据,以及,这些数据都是来自于哪里。
除此之外,Power BI团队通过NORAD Santa Tracker网站的数据,在圣诞节前对全球范围内的访问者进行统计。首先通过Power Query的在线搜索,统计来自全球的站点访问,导入到Excel中,然后创建数据模型,并且通过Power View的可视化功能显示最近7天的访问情况。
以下是一些分析结果:
Santa Tracker的访问者,在最近的7天中,来自美国,英国和加拿大的最多,但是比较有趣的是,排在第四位的是日本,其实想一想还是很合理,就好像老爸信耶稣的话,那么没有干儿子信马克思的道理。
在圣诞节前夕的临近,会有来自全球更多的用户对这个网站感兴趣。到圣诞节那天,估计会有150万到250万浏览者会对网站进行访问。
圣诞老人的踪迹遍布世界各地,在推特中可以发现到目前为止大家最感兴趣的话题是"saw santa",其次是"santa sighting"。而这些话题更多的出现在北美区域和欧洲区域,此外还有来自北极区域的三条推特(北极勘探队也很欢乐啊)。
最后,从推特上的声音来看,由于各种原因,有12%的内容似乎不太喜欢圣诞老人。
对此我也感觉很好奇,发现Power BI团队是对每条推特信息进行了类别判定,比如积极的,中立的和消极的。当然如何去判定的在这里已经不重要,我们来看下有什么样的消息是被认定为积极的。
Had a great day with the Bean Bean... We saw Santa again today, did some thrift store shopping, and watched The Polar Express... Great day!
Lexi saw Santa and it went well. :) http://t.co/HrHftysKyG
Just saw Santa on the Sea King from RMB Chivenor, circling over Barnstaple, got a cheeky wave from him. I promise I've been a good girl