我正在尝试将NYPD停止和刷新数据导入R。该数据位于http://www.nyc.gov/html/nypd/downloads/zip/analysis_and_planning/YYYY.zip的SPSS .por文件中
其中YYYY是从2003年到2012年的一年
大多数文件都可以正常加载,但是2004、2007和2008文件都给我这个错误:
> library(foreign)
> mydata= read.spss("2004.por", to.data.frame=TRUE)
Error in read.spss("2004.por", to.data.frame = TRUE) :
error reading portable-file dictionary
In addition: Warning message:
In read.spss("2004.por", to.data.frame = TRUE) : Bad character in time
Execution halted
关于如何调试的任何建议?我意识到read.spss不支持最新的SPSS版本,但是鉴于大多数文件(十分之七)可以正确导入,所以我想知道它是否更微妙。
psppire会毫无提示地加载所有文件,但数据看起来已损坏,某些字段似乎与其他字段组合在一起,而某些字段中的二进制数据也是如此。
最佳答案
我按照Read SPSS file into R的建议使用memisc
取得了一些成功。即,在安装memisc
之后:
> install.packages('memisc')
您可以轻松读取数据:
> library(memisc)
> data <- as.data.set(spss.portable.file('2004.por'))
尽管我尚未彻底检查数据,但乍看之下似乎是正确的。
关于R read.spss导入SPSS .por文件时出错- "Bad character in time",我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/20697560/