遗漏变量和加进无关变量的模型,对模型的影响分别是什么?
先下结论:
(1)遗漏模型中本该有的变量,损失的是无偏性和一致性;
(2)加进模型中不应该有的变量,其损失的只有有效性。
具体解释一下,第一:模型中遗漏重要解释变量的不良后果比模型中引入无关解释变量的后果要严重得多。遗漏了重要解释变量的模型是一个错误的不可用的模型,而引进了无关解释变量的模型是一个精度不高、但仍具一定利用价值的模型。应力求避免模型对重要解释变量的遗漏,
第二:虽然在模型引进无关解释变量的不良后果相对较小,但不能认为在模型中包含无关解释变量是可以容忍的。事实上,如果出现这种情况,会造成模型参数估计量精确度下降,还会引发解释变量的多重共线性问题,以及造成自由度的损失。
虚拟变量
应该引入几个虚拟变量?
(1) 一个因素多个属性。若定性因素有m 个不同属性或相互排斥的类型,在模型中则只能引入$m-1$ 个虚拟变量,否则会产生完全多重共线性。
例子:一年四个季度,引入3个虚拟变量
(2) 多个因素各两种属性。如果有$m$个定性因素,且每个因素各有两个不同的属性类
型,则引入$m-1$ 个虚拟变量。
一个例子:
两种设定形式:加法与乘法
(1)加法类型。
在模型中,将虚拟解释变量作为新一项,以达到其调整截距的目的,然后比较有无前后虚拟变量截距的差距来看虚拟变量的影响/
(2)乘法类型。
模型中,将虚拟解释变量与其他解释变量相乘,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。
乘法形式引入虚拟解释变量的主要作用在于:
①两个回归模型之间的比较
②因素之间的交互影响分析
③提高模型对现实经济现象的描述精度
举个例子:
举出时间序列,截面数据,面板数据的例子
截面数据:
时间序列:
面板数据
之前在做这个作业的时候我写了不同事物的例子,今天在Quora上看到这个回答,特意搬运过来。深感这样才是正确举例子的办法。不光老师,学生应该也要学会这样举例子。