我在Mac版本10.11.1上运行R Studio。通过doBy pacakge运行以下代码时:
ATT_SUM <- summaryBy(STUENR_MEM + STUENR_ABS ~ STUDENT_NUMBER + GRADE_LEVEL + Current.School + ENROLL_STATUS + LAST_NAME + FIRST_NAME + ENTRYDATE + EXITDATE + Enrolled.School + STU_MEM + STU_ABS,
data = Att_14, FUN = function(x) { c(Sum = sum(x))})
我收到以下消息:
Error in data.frame(..., check.names = FALSE) : invalid multibyte string, element 4693
我试图通过STUENR_MEM和STUENR_ABS变量折叠或汇总我的数据。我的数据框中的许多观察结果对于同一个变量都有多个条目。我想对STUENR_MEM和STUENR_ABS列中的数据求和以创建总成员资格和总缺席列-因此对于这两个与观察值相对应的变量将有单独的列。
列名:
1“Current.School”“GRADE_LEVEL”“ENROLL_STATUS”“STUDENT_NUMBER”“LAST_NAME”“FIRST_NAME”
[7]“STU_MEM”“STU_ABS”“STUENR_MEM”“STUENR_ABS”“ENTRYDATE”“EXITDATE”
[13]“注册学校”
我一直在寻找答案,但无济于事。
最佳答案
听起来您的数据文件或特定列包含编码问题。在导入csv / txt文件时,请尝试使用fileEncoding
参数。将类型调整为数据源的特定编码:UTF-8
,Windows-1252
,latin1
等。
Att_14 <- read.csv("DataSource.csv", stringsAsFactors=FALSE, fileEncoding="UTF-8")
另外,考虑R的aggregate(),它可以汇总并按多列分组:
ATT_SUM <- aggregate(cbind(STUENR_MEM, STUENR_ABS) ~ STUDENT_NUMBER + GRADE_LEVEL +
Current.School + ENROLL_STATUS + LAST_NAME + FIRST_NAME +
ENTRYDATE + EXITDATE + Enrolled.School + STU_MEM + STU_ABS,
data = Att_14, FUN = sum)
关于r - data.frame(...,check.names = FALSE)错误:无效的多字节字符串,元素4693,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34689103/