Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。
想要改善这个问题吗?更新问题,以便将其作为on-topic用于堆栈溢出。
7年前关闭。
Improve this question
我的数据有3个独立变量,所有这些都是分类的:
因变量是任务完成时间。我在R中运行
令我困惑的是cond1,groupA和task1不在结果之列。从linear regression "NA" estimate just for last coefficient线程中,我知道一个因子级别被选作“基线”,并显示在(拦截)行中。
但是,如果像上述情况那样将多个因子水平用作基准,该怎么办?
(拦截)行现在指示cond1 + groupA + task1吗? 如果我想分别了解cond1,groupA和task1的系数和重要性,该怎么办? 例如,与groupA相比,groupB的估计系数为+9.3349?还是与cond1 + groupA + task1相比?
想要改善这个问题吗?更新问题,以便将其作为on-topic用于堆栈溢出。
7年前关闭。
Improve this question
我的数据有3个独立变量,所有这些都是分类的:
condition: cond1, cond2, cond3
population: A,B,C
task: 1,2,3,4,5
因变量是任务完成时间。我在R中运行
lm(time~condition+user+task,data)
并获得以下结果:令我困惑的是cond1,groupA和task1不在结果之列。从linear regression "NA" estimate just for last coefficient线程中,我知道一个因子级别被选作“基线”,并显示在(拦截)行中。
但是,如果像上述情况那样将多个因子水平用作基准,该怎么办?
最佳答案
您人口中的一个人必须为每个变量“条件”,“人口”和“任务”取一个值,因此基准个人必须为每个变量取一个值。在这种情况下,cond1,A和t1。所有结果均基于具有这些自变量的理想(平均)个体,因此截距确实给出了cond1,groupA和task1的时间平均值。
cond1,groupA或task1的显着性或系数没有意义,因为显着性表示一组与引用组之间的平均值存在显着差异。您无法将引用组与其自身进行比较。
由于您的模型没有交互作用,因此groupB的系数意味着种群B中某人的平均时间将比种群A中某人的平均时间高9.33(秒?),而不论他们执行的条件和任务如何,并且p值非常小,可以看出,人口B中的人与引用人口(A)中的人实际上的平均时间是不同的。如果您在模型中添加了一个交互项,则这些项(例如usergroupB:taskt4
)将指示如果一个人同时具有两个条件(在这个示例中,如果一个人来自人群B并且在两个条件下),则平均时间增加(或减去)的额外值。已执行任务4)。这些效果将添加到边缘效果(usergroupB
和taskt4
)中。
希望我能帮上忙。
关于r - 当有多个因子水平作为基线时,如何解释R线性回归? ,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21677105/
10-09 13:11