我想使用mutate使用二项分布来计算列。
我有以下示例:
library("dplyr")
d = data.frame(ref = rbinom(100,100,0.5))
d$coverage = 100
d$prob = 0.5
d$eprob= d$ref / d$coverage
d = tbl_df(d)
mutate(d,
ref1= ref,
cov1 = coverage,
eprob1 = eprob,
ref2=rbinom(1, coverage, eprob),
ref3=rbinom(1, cov1, eprob1)
)
结果是这样的:
Source: local data frame [100 x 9]
ref coverage prob eprob ref1 cov1 eprob1 ref2 ref3
1 52 100 0.5 0.52 52 100 0.52 45 44
2 50 100 0.5 0.50 50 100 0.50 45 44
3 45 100 0.5 0.45 45 100 0.45 45 44
4 45 100 0.5 0.45 45 100 0.45 45 44
5 47 100 0.5 0.47 47 100 0.47 45 44
6 46 100 0.5 0.46 46 100 0.46 45 44
7 50 100 0.5 0.50 50 100 0.50 45 44
8 53 100 0.5 0.53 53 100 0.53 45 44
9 44 100 0.5 0.44 44 100 0.44 45 44
10 56 100 0.5 0.56 56 100 0.56 45 44
我不明白-我想让mutate函数返回从ref和coverage(“ref2”)给定的二项式分布得出的随机数...
Mutate正确读取了列-但是在调用rbinom时发生了一些奇怪的事情...
任何帮助,我表示赞赏。
最佳答案
尝试更改n
的rbinom
:
mutate(d,
ref1= ref,
cov1 = coverage,
eprob1 = eprob,
ref2=rbinom(100, coverage, eprob),
ref3=rbinom(100, cov1, eprob1)
)
或更笼统地说:
mutate(d,
ref1= ref,
cov1 = coverage,
eprob1 = eprob,
ref2=rbinom(n(), coverage, eprob),
ref3=rbinom(n(), cov1, eprob1)
)
关于r - 使用rbinom的dplyr mutate不返回随机数,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31878389/