Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。












想要改善这个问题吗?更新问题,以便将其作为on-topic用于堆栈溢出。

7年前关闭。



Improve this question




我的数据有3个独立变量,所有这些都是分类的:
condition: cond1, cond2, cond3

population: A,B,C

task: 1,2,3,4,5

因变量是任务完成时间。我在R中运行lm(time~condition+user+task,data)并获得以下结果:

令我困惑的是cond1,groupA和task1不在结果之列。从linear regression "NA" estimate just for last coefficient线程中,我知道一个因子级别被选作“基线”,并显示在(拦截)行中。

但是,如果像上述情况那样将多个因子水平用作基准,该怎么办?
  • (拦截)行现在指示cond1 + groupA + task1吗?
  • 如果我想分别了解cond1,groupA和task1的系数和重要性,该怎么办?
  • 例如,与groupA相比,groupB的估计系数为+9.3349?还是与cond1 + groupA + task1相比?
  • 最佳答案

    您人口中的一个人必须为每个变量“条件”,“人口”和“任务”取一个值,因此基准个人必须为每个变量取一个值。在这种情况下,cond1,A和t1。所有结果均基于具有这些自变量的理想(平均)个体,因此截距确实给出了cond1,groupA和task1的时间平均值。

    cond1,groupA或task1的显着性或系数没有意义,因为显着性表示一组与引用组之间的平均值存在显着差异。您无法将引用组与其自身进行比较。

    由于您的模型没有交互作用,因此groupB的系数意味着种群B中某人的平均时间将比种群A中某人的平均时间高9.33(秒?),而不论他们执行的条件和任务如何,并且p值非常小,可以看出,人口B中的人与引用人口(A)中的人实际上的平均时间是不同的。如果您在模型中添加了一个交互项,则这些项(例如usergroupB:taskt4)将指示如果一个人同时具有两个条件(在这个示例中,如果一个人来自人群B并且在两个条件下),则平均时间增加(或减去)的额外值。已执行任务4)。这些效果将添加到边缘效果(usergroupBtaskt4)中。

    希望我能帮上忙。

    关于r - 当有多个因子水平作为基线时,如何解释R线性回归? ,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/21677105/

    10-09 13:11