我试图从Yelp数据集挑战网站(https://www.yelp.com/dataset_challenge)打开文件。我已经成功完成了该操作,但是由于没有扩展名,因此无法打开该文件。它约为4 GB。我认为它可能是JSON文件,因为过去搜索时是这样。但是,我不知道如何打开它或将其转换为CSV。我想在此数据上使用Python进行一些分析。谁能帮我?谢谢你。

最佳答案

我有同样的问题。事实证明tar内的文件(没有扩展名的文件)也是tar文件-因此下载基本上是tar文件内的tar文件。解压缩原始文件后,向其添加tar扩展名,然后解压缩该文件。解压缩后,您将拥有数据集的所有不同的json文件。

关于python - Yelp数据文件类型,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43624065/

10-14 18:26
查看更多