我是R的新手,并尝试用apply系列的功能替换一些for循环。
我仍然不完全了解它们是如何工作的,但是我设法产生了一段有效的代码:
#create some input data
tech<-data.frame(cbind(c("p1","p2","p3","p4"),c(15,15,15,100),c(10,8,18,100)))
colnames(tech)=c("id","capacity.el","capacity.th")
tech$capacity.el<-as.numeric(tech$capacity.el)
tech$capacity.th<-as.numeric(tech$capacity.th)
heat<-data.frame(cbind(c(2,12,6,20,32,21,25,16,34,0),c(31,18,3,27,30,31,18,4,24,7),c(2,12,6,20,32,21,25,16,34,0),c(31,18,3,27,30,31,18,4,24,7)))
colnames(heat)=c("p1","p2","p3","p4")
> tech
id capacity.el capacity.th
1 p1 2 1
2 p2 2 4
3 p3 2 3
4 p4 1 2
> heat
p1 p2 p3 p4
1 2 31 2 31
2 12 18 12 18
3 6 3 6 3
4 20 27 20 27
5 32 30 32 30
6 21 31 21 31
7 25 18 25 18
8 16 4 16 4
9 34 24 34 24
10 0 7 0 7
#the result should be a matrix/list
pel=matrix(,nrow=nrow(heat),ncol=ncol(heat))
epr=matrix(,nrow=nrow(heat),ncol=ncol(heat))
result<-list()
#main code
result<-sapply(colnames(heat),function(x) {
a<-tech$capacity.th[match(x,tech$id)]
b<-tech$capacity.el[match(x,tech$id)]
sapply(heat[,x],function(y) {
pel<-a*y
return(pel)
})
})
这个想法是“遍历”“热” data.frame的列,并使用
“热”数据框架中的值。因此,我使用第一个sapply函数来获取对应的
技术表中加热表中每种植物的特征。然后第二个执行
计算。输出“结果”正是我想要的。
现在,我想计算“热量”(pel和epr)中每一行的值。
但是我不知道如何从适用函数中提取这些值。
我用列表尝试了以下方法,但这将值提取为一个有20行的大矩阵。
理想的结果是像一个具有两个矩阵或data.frame对象的列表,每个对象具有10行4列
与pel/epr值。
result<-sapply(colnames(heat),function(x) {
a<-tech$capacity.th[match(x,tech$id)]
b<-tech$capacity.el[match(x,tech$id)]
sapply(heat[,x],function(y) {
pel<-a*y
epr<-b*y
})
new<-list(pel,epr)
return(new)
})
我将不胜感激任何帮助或评论。
最佳答案
我建议您先整理数据。 see the tidyr package for more information
然后,您将两个数据帧合并,就不需要任何循环或* apply函数。您只需在此新数据框中进行计算即可,例如,使用dplyr软件包:
library(tidyr)
library(dplyr)
heat %>%
gather(id, value) %>%
left_join(tech, by="id") %>%
mutate(a = value * capacity.el,
b = value * capacity.th)
关于从sapply/lapply返回多个值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31471387/