给出一个歌曲列表,确定它们相对“受欢迎度”的最佳方法是什么?
我的第一个想法是使用谷歌趋势。此歌曲列表:
地下乡愁蓝调
帝国精神状态
加州女孩
生成以下Google Trends report:(为了了解现在流行的内容,我将报告限制在过去30天内)
http://s3.amazonaws.com/instagal/original/image001.png?1275516612
《帝国精神状态》的受欢迎程度略高于加州的大师,而《地下思乡蓝调》的受欢迎程度则远不及两者。
所以这很好用,但是当你的单子是100或1000首歌时会发生什么呢?google trends只允许你一次比较5个术语,所以如果没有一个大型的循环,正确的方法是什么?
另一种选择是在谷歌上搜索每首歌,看看哪首歌的搜索结果最多,但这并不是一回事
最佳答案
一首由布兰妮·斯皮尔斯创作的歌曲,可能会在两个月内大受欢迎,然后(谢天谢地)被遗忘,而另一首由猫王创作的歌曲则可能会持续流行30年。你如何定量区分这两者?我们知道我们想认为持续的流行比“昙花一现”更重要,但如何才能得到这个结果呢?
首先,我会在发行日期前后正常化-地下思乡蓝调现在可能不受欢迎(虽然不是在我家),但回到1965年正常化可能会产生不同的结果。
由于大多数歌曲在流行度上都是先升后降的,所以让我们在它们稳定下来的时候选择一个区域。我们可以假设在那个时期,这两个序列是平稳的,不相关的,正态分布的。现在,您可以应用测试来确定方法是否不同。
可能有较少的限制性测试来确定两个时间序列之间的差异程度,但我还没有遇到它们。
有人吗?
关于algorithm - 以编程方式确定项目(书籍,歌曲,电影等)列表的相对“受欢迎程度”,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2962010/