本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

heckman两步法stata命令是多少,第一步的命令多少,第二部的命令多少

stata培训 cdadata 31287℃

heckman两步法stata命令是多少,第一步的命令多少,第二部的命令多少

解答:直接heckman 就可以求出最终结果。带着twostep。
如果你要看两步的结果的话,那么:
第一步应该是:probit 命令对heckman中的select()中的变量进行回归。
然后计算lamda和delta的估计值。
第二步是最小二乘回归。即可以得出结果。regress ,但需要注意解释变量都包括哪些。
具体看格林第五版中文847页。


heckman y x1 x2 x3,select() twostep

select()的括号里是什么变量。
工具变量怎么弄呢,不是要一个工具变量吗?

知道了。你需要将参考被解释变量:wage 生成一个z变量。wage中观测不到的(里面是个点),z记为0,否则记为1.
然后将z对select中的变量回归。
(我试了一下,使用matlab可以得到相应结果)。


是格林847页中22-20中的选择机制,即probit回归。

第二步最小二乘回归是wage(可以观测的数据)对相应的变量和lambda的估计值(注意这里lambda的估计值多于wage的个数,所以需要选择对应wage的部分)。

heckman y x1 x2 x3,select() twostep
用这个命令一步搞定,怎么设置呢。理论我基本理解。是stata命令不会用
select 括号里的变量 是与y什么关系的,工具变量放哪,虚拟变量放哪


最佳解答:

select里面的变量,注意,例子中
heckman wage educ age, select(married children educ age) twostep

前面wage是被解释变量,相当于格林书中的y(有一部分不能观测)
educ和age 相当于x(当然,常数项这儿没写出来)。
select中的变量则相当于书中的w。(常数项也没写)。
z没有写出来,但我觉得它是依据wage自动隐含的变量。(wage,可观测是z=1,否则z=0);
命令解释中,有一个语法:
  heckman depvar [indepvars], select(depvar_s = varlist_s) [twostep]
这个就有depvar_s。

你可以生产z,然后代入语法。
heckman depvar [indepvars], select(depvar_s = varlist_s) [twostep]
中试一下,结果应该一样。

这些我也懂。但是工具变量是哪个呢。select括号里为什么选那几个变量。问题在这。

我认为这儿没有工具变量这一说吧?如果虚拟变量的话,看你使用的虚拟变量在选择方程还是回归模型中。比如格林书中的849页,例子中就有一个虚拟变量city在回归模型中(y的方程)。


844页的例子,说样本选择或者从属断尾。我觉得这儿揭示了为什么需要选择机制。至于select中为什么选择这些变量,可能要考虑哪些因素会影响个体的这种选择,比如847页妇女是否劳动,哪些因素会影响这一选择?不知我的理解正确吗?供参考。

我觉得不需要工具变量。没看到过样本选择模型(sample selection model )与工具变量(instrumental variable)联系在一起。
我觉得你弄混工具变量的定义了。
某一个变量与模型中随机解释变量高度相关,但却不与随机误差项相关,那么就可以用此变量与模型中相应回归系数得到一个一致估计量,这个变量就称为工具变量(这是百度来的),可以看一下伍德里奇的计量经济学导论第三版中文,493页。对工具变量的定义。

至于哪些变量放到select里面:
我觉得就是你要考虑的内容中,你认为哪些变量决定了样本的选择,那么就可以放到select里面。

不过你看这篇文章:技能高中还是普通高中?——中国农村学生的教育选择.pdf中,也提到了工具变量,
注意,,本文用工具变量法控制能力偏误和测量误差。(他这里是能力偏误和测量误差,我认为跟样本选择没有关系)
同样,这篇文章中,提到(第四页)
(2)式中,canyu是二元劳动参与指标,括号内不等式成立取值为 1,否则为 0,工资只有在
canyu=1时,才能被观测到。  X2是影响劳动参与的外生向量 ,△是解释变量的系数 向量,  是
误差项。本文期望得到模型 (1)与 (2)联合一致估计。


请教大家,heckman样本选择模型中的第二步中的因变量必须是连续变量吗?heckman两步法中的第二步模型,里面的因变量必须是连续变量吗?

解答:

第一步必须是probit或者logit,
第二步没有模型要求。
需要注意的是:两步中的自变量必须是有差异的,不能全部雷同。

转载请注明:数据分析 » heckman两步法stata命令是多少,第一步的命令多少,第二部的命令多少

喜欢 (12)or分享 (0)