回归分析什么时候取对数_在线性回归中,什么时候使用自变量的对数代替实际值合适?…

  • Post author:
  • Post category:其他


我总是告诉学生,采用自然对数来转换变量的三个原因。记录变量的原因将决定您是要记录独立变量还是因变量或两者。为了清楚起见,我正在谈论采用自然对数。

首先,如其他海报所指出的那样,提高模型拟合度。例如,如果您的残差不是正态分布的,那么采用偏斜变量的对数可以通过更改比例并使变量更“呈正态”分布来改善拟合。例如,收入被截断为零,并且经常表现出正偏斜。如果变量具有负偏斜,则可以先取变量,然后再取对数。我在这里特别考虑的是作为连续变量输入的李克特量表。虽然这通常适用于因变量,但您有时会遇到因自变量引起的残差(例如,异方差)问题,有时可以通过取该变量的对数来进行校正。例如,当运行一个模型来解释一组讲师的讲师评估并与班级进行协变量时,变量“班级规模”(即讲课的学生人数)的异常值会导致异方差,因为讲师评估中的方差较小,而较大队列比较小的队列。记录学生变量将有所帮助,尽管在此示例中,计算稳健标准误差或使用加权最小二乘可能会使解释更容易。

在模型中记录一个或多个变量的第二个原因是为了解释。我称此为便利原因。如果同时记录因变量(Y)和自变量(X),则回归系数()将具有弹性,解释将如下所示:X增加1%将导致ceteris paribus% Y的增加(平均)。仅记录回归“方程式”的一侧将导致如下所述的其他解释:βββ ββ

Y和X-X的单位增加将导致增加/减少ββ

对数Y和对数X-X增加1%将导致%增加/减少Yββ

对数Y和X-X增加一个单位将导致%增加/减少β∗100β∗100

Y和Log X-X增加1%将导致增加/减少β/100β/100

最后,这样做可能有理论上的原因。例如ÿ



版权声明:本文为weixin_39657575原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。