选择实验获得的数据主要通过离散选择模型来完成。离散选择模型中,最主要的是logit模型。
之前已经介绍了二项logit模型回归的STATA实现(有修改),多项logit模型详解,多项logit模型回归系数解读,多项logit模型回归的检验
继续认识混合logit模型。
最常用的异质性模型是混合logit模型(MixedLogit,MXL),也叫做随机参数模型(Radom Parameter Logit,RPL)。MNL模型需满足随机误差项服从严格的IID假设,而混合Logit 模型则放松了这一限制,允许参数在个体之间随机变动,通过模型参数的分布(均值、标准差)刻画个体的异质性,可以更好地进行异质性研究。在这里要注意,混合logit模型的含义在不同的教科书中有一些不同的界定。陈强的高级计量经济学及STATA应用中混合logit模型并不是可以进行异质性分析的,而只是区别条件logit模型中自变量只能是不随方案而变的,而加入随方案变化而变化的自变量后,就不能用条件logit,只能用这个模型。而本文所说的混合logit模型也就是随即参数模型,怎很多文献中都是这样应用的(朋文欢等,2017;刘伟等,2019)。
01 模型特点
混合logit模型与多项logit的区别可以从可观测效用函数
表示上来看出。
多项logit模型的可观测效用函数为:
混合logit模型的可观测效用函数为:
区别就是模型的估计参数不是一个值:
其中
是设置为固定变量的方案特征,其系数为
,仍为一个值。
其中
是设置为随机变量方案特征,其系数不是一个值,而是一个分布,并假设为正态分布,用分布(均值
、标准差
)的估计。可以用来刻画个体异质性,也就是说不同的个体对不同的特征有不同的偏好。
02 数据继续应用STATA官方系统数据inschoice.dta来介绍混合logit模型的回归程序。(下载该数据,可以关注公众号【选择实验法沙龙】并回复【保险数据】)该数据是记录250人的可用保险方案和选定方案的信息,可选择的保险方案共5个:Health、HCorp、SickInc、MGroup、MoonHealth。根据选定信息和个体特征,共形成6个变量,id、premium、deductible、income、insurance、choice。在之前的文章中已经应用过。stata16.0版本采用了新命令cmmixlogit作为官方命令,之前stata15.0版中采用的命令asmixlogit不在作为官方命令.本文采用cmmixlogit估计混合logit模型(下载STATA16程序,可以关注公众号并回复【stata16】)
03 STA