我试图理解R中“ivprobit”包中“ivprobit”函数的语法。该指令说:
Usage
ivprobit(formula, data)
Arguments
formula y~x|y1|x2 whre y is the dichotomous l.h.s.,x is the r.h.s.
exogenous variables,y1 is the r.h.s. endogenous variables and
x2 is the complete set of instruments
data the dataframe
然后显示相应的示例:
data(eco)
pro<-ivprobit(d2~ltass+roe+div|eqrat+bonus|ltass+roe+div+gap+cfa,eco)
summary(pro)
如果我符合指令的说明,
y= d2 = dichotomous l.h.s.
x= ltass+roe+div = the r.h.s. exogenous variables
y1= eqrat+bonus = the r.h.s. endogenous variables
x2= tass+roe+div+gap+cfa = the complete set of instruments
我不明白x和x2之间的区别。
另外,如果x2是完整的工具集,为什么它还不包含内生变量y1?相反,它还包括“gap”和“cfa”变量,它们甚至都没有在x(外生变量)或y中显示。
假设我选择的工具变量确实是“eqrat”和“bonus”,那么我如何构造才能知道x(外生变量)和x2(整套工具)之间的区别?
最佳答案
请注意,这里我们讨论的是sintax,而不是模型的“优点”,对于这种问题,您应该引用https://stats.stackexchange.com/。
让我们以以下等式为例:。
正确指出,在表达式中不是,而是,这只是一个示例。
这里:
为什么内源性有问题?因为它们与错误相关,所以这会导致经典OLS估计出现问题。
是工具,因为它们具有一些基本的特性(更多here):
在提议的sintax中,我们有:x
,外生的,对应于(没有问题); y1
,内生的,与对应(有问题); x2
,对应于的完整工具集。
在您引用的示例中,x2
与x
共享一些公共(public)变量,x2
是一组外生变量(没有问题),另外还有两个工具。
该模型使用3个外生变量作为工具,外加另外两个变量。
x
是工具,可能与外生变量集(fem_works
)重叠。
一定不要包含内生变量,因为这些是使用工具需要方程式照顾的变量。
一个例子:
您想建立一个模型,以预测是否有两个 parent 家庭中的妇女受雇。您具有以下变量:fem_edu
,响应或因变量; kids
,女人的教育水平,外生; other_income
,这对夫妇的 child 数量,外生; male_edu
,家庭收入,内生的(您知道这是先验知识); ivprobit
,男人,乐器的受教育程度(您选择此选项)。
使用other_income
,它将是:mod <- ivprobit(fem_works ~ fem_edu + kids | other_income | fem_edu + kids + male_edu, data)
fem_works
对模型有问题,因为您怀疑它与错误项相关(其他冲击可能会影响other_income
和male_edu
),因此您决定使用ojit_code作为工具,以“缓解”该问题。 (示例取自here)
关于r - 如何在R中的 "ivprobit"包中使用 "ivprobit"函数?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/54806589/