倾向得分匹配法的Stata命令
发布网友
发布时间:2024-09-30 06:10
我来回答
共1个回答
热心网友
时间:2024-11-24 04:11
首先,下载非官方命令psmatch2:
D,表示处理变量 x1 x2 x3
倾向得分匹配命令的一般格式:
表示协变量 outcome(y),用来制定变量y为结果变量
logit,表示使用Logit来估计倾向得分
默认方法为probit
ties,表示包括所有倾向得分相同的并列个体
默认按照数据排序选择其中一位个体
ate,表示同时汇报ATE\ATU\ATT
默认仅汇报ATT
common,表示仅对共同取值范围内个体进行匹配
默认对所有个体进行匹配
odds,表示使用几率比进行匹配,即p/(1-p)
pscore(varname),用来指定某变量作为倾向得分
默认通过“x1 x2 x3”来估计倾向得分
quietly 表示不汇报对倾向得分的估计过程
具体操作步骤
作为参照,首先进行一元回归:
平均处理效应为1.794,即参加就业培训平均能使1978年实际收入提高1794美元,且在1%水平上显著。 R2很低,仅为0.0178,即是否参加就业培训仅能解释1978年实际收入1.78%的变动。
直接引入协变量,进行更为可信的多元回归:
加入协变量后,平均处理效应降为1.672,且显著性水平接近1%。在协变量中,除了ec与black在5%水平上显著外,其余协变量均不显著。
下面进行倾向得分匹配。为此,先将数据随机排序。
进行一对一匹配(因样本量不大,故进行有放回匹配,且允许并列)
ATT的估计值为1.411,t=1.68<1.96,故不显著。在445个观测值中,控制组(untreated)共有11个不在共同取值范围中,处理组(treated)共有2个不再共同取值范围中,其余432个观测值均在共同取值范围中。
使用自助法得到标准误。
ATT的标准误是0.88,还汇报了上面不曾给出的ATU\ATE的标准误;ATE\ATU在10%水平上显著,而ATT不显著。
使用pstest来考察此匹配结果是否较好地平衡了数据。
匹配后(matched)大多数变量的标准化偏差(% bias)小于10%,只是变量U74的偏差为11.1%,似乎可以接受。而且大多数t检验的结果不拒绝处理组与控制组无系统差异的假设。对比匹配前的结果,大多数变量的标准化偏差均大幅缩小,但变量re74\u74的偏差有所增加。
进行倾向得分匹配的不同具体方法:
k近邻匹配,并令k=4
卡尺内一对四匹配
首先计算倾向得分的标准差,然后乘0.25
为保守起见,将卡尺范围定为0.01,这意味着对倾向得分相差1%的观测值进行一堆四匹配
半径匹配(卡尺匹配)
核匹配(使用默认的核函数与带宽)
局部线性回归匹配(使用默认的核函数与带宽)
使用自助法得到自助标准误
样条匹配(同样使用自助法计算标准误)
马氏匹配,并使用异方差稳健标准误