我想在文章发布平台上构建一个分析引擎。更具体地说,我想跟踪用户的阅读行为(如文章的浏览量、打开文章的时间、评分等),以及文章本身的统计数据(如段落数、作者等)。
这将有两个目的:
提供关于用户和文章的见解
向用户提供建议
对于数据分析部分,我一直在关注cubespandaspytables。有很多数据,存储在MySQL表中;我不确定这些包中的哪一个能更好地处理这样的后端。
对于推荐部分,我只是考虑将数据从数据分析引擎提供给集群模型。
有什么建议可以帮助我把这些放在一起,还有一些很酷的python项目吗?
如果我需要更多的信息,请告诉我。
谢谢你

最佳答案

Scikit-learn应该会让您对数据处理(集群)部分感到满意。

关于python - 用于数据分析和学习的Python软件包推荐,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/12425602/

10-12 22:03
查看更多