举例说明什么是异方差性
发布网友
发布时间:2022-05-01 19:30
我来回答
共2个回答
热心网友
时间:2022-06-21 23:27
异方差性(heteroscedasticity )是相对于同方差而言的。所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。
若线性回归模型存在异方差性,则用传统的最小二乘法估计模型,得到的参数估计量不是有效估计量,甚至也不是渐近有效的估计量;此时也无法对模型参数的进行有关显著性检验。
对存在异方差性的模型可以采用加权最小二乘法进行估计。
异方差性的检测——White test
在此检测中,原假设为:回归方程的随机误差满足同方差性。对立假设为:回归方程的随机误差满足异方差性。判断原则为:如果nR^2>chi^2 (k-1),则原假设就要被否定,即回归方程满足异方差性。
在以上的判断式中,n代表样本数量,k代表参数数量,k-1代表自由度。chi^2值可由查表所得。
2含义
编辑
回归模型的随机扰动项ui在不同的观测值中的方差不等于一个常数,Var(ui)= 常数(i=1,2,…,n),或者Var(u ) Var(u )(i j),这时我们就称随机扰动项ui具有异方差性(Heteroskedasticity)。
在实际经济问题中,随机扰动项ui往往是异方差的,但主要在截面数据分析中出现。
例如
(1)调查不同规模公司的利润,发现大公司的利润波动幅度比小公司的利润波动幅度大;
(2)分析家庭支出时发现高收入家庭支出变化比低收入家庭支出变化大。
在分析家庭支出模型时,我们会发现高收入家庭通常比低收入家庭对某些商品支出有更大的方差;图5-1显示了一元线性回归中随机变量的方差ui随着解释变量 的增加而变化的情况。
异方差性破坏了古典模型的基本假定,如果我们直接应用最小二乘法估计回归模型,将得不到准确、有效的结果。
来源
1.模型中缺少某些解释变量,从而随机扰动项产生系统模式
由于随机扰动项ui包含了所有无法用解释变量表示的各种因素对被解释变量的影响,即模型中略去的经济变量对被解释变量的影响。如果其中被略去的某一因素或某些因素随着解释变量观测值的不同而对被解释变量产生不同的影响,就会使ui产生异方差性。
例如,以某一时间截面上不同收入家庭的数据为样本,研究家庭对某一消费品(如服装、食品等)的需求,设其模型为:
(5-1)
其中Qi表示对某一消费品的需求量,Ii为家庭收入,ui为随机扰动项。ui包括除家庭收入外其他因素对Qi的影响。如:消费习惯、偏好、季节、气候等因素,ui的方差就表示这些因素的影响可能使得Qi偏离均值的程度。在气候异常时,高收入家庭就会拿出较多的钱来购买衣服,而低收入的家庭购买衣服的支出就很有限,这时对于不同的收入水平Ii,Qi偏离均值的程度是不同的,Var(ui) 常数,于是就存在异方差性了。
再比如,以某一时间截面上不同地区的数据为样本,研究某行业的产出随投入要素的变化而变化的关系,建立如下模型:
(5-2)
其中Yi表示某行业的产出水平。Li表示劳动力对产出的影响。Ki表示资本对产出的影响,ui表示除劳动力和资本外其他因素对产出水平的影响,诸如地理位置、国家*等。显然,对于不同的行业 ,这些因素对产出 的影响程度是不 同的,引起 偏离零均值的程度也是不同的,这就出现了异方差。
异方差性容易出现在截面数据中,这是因为在截面数据中通常涉及某一确定时点上的总体单位。比如个别的消费者及其家庭、不同行业或者农村、城镇等区域的划分,这些单位各自有不同的规模或水平,一般情况下用截面数据作样本时出现异方差性的可能性较大。
2.测量误差
测量误差对异方差性的作用主要表现在两个方面:一方面,测量误差常常在一定时间内逐渐积累,误差趋于增加,如解释变量X越大,测量误差就会趋于增大;另一方面,测量误差可能随时间变化而变化,如抽样技术或收集资料方法的改进就会使测量误差减少。所以测量误差引起的异方差性一般都存在于时间序列中。
例如,研究某人在一定时期内学习打字时打字差错数Yt与练习打字时间Xt之间的关系。显然在打字练习中随时间的增加,打字差错数将减少,即随着Xt的增加Yt将减小。这时Var(ut)将随Xt的增加而减少,于是存在异方差性。
不仅在时间序列上容易出现异方差性,利用平均数作为样本数据也容易出现异方差性。因为许多经济变量之间的关系都服从正态分布,例如不同收入组的人数随收入的增加是正态分布,即收入较高和较低的人是少数的,大部分人的收入居于较高和较低之间,在以不同收入组的人均数据作为样本时,由于每组中的人数不同,观测误差也不同,一般来说,人数多的收入组的人均数据较人数少的收入组的人均数据具有较高的准确性,即Var(ui)随收入Ii呈现先降后升的趋势,这也存在着异方差性。
3.模型函数形式设置不正确
模型函数形式的设定误差。如将指数曲线模型误设成了线性模型,则误差有增大的趋势。
4.异常值的出现
随机因素的影响,如*变动、自然灾害、金融危机、战争和季节等。
类型
异方差一般可归结为三种类型:
(1)单调递增型:随X的增大而增大,即在X与Y的散点图中,表现为随着X值的增大Y值的波动越来越大
(2)单调递减型:随X的增大而减小,即在X与Y的散点图中,表现为随着X值的增大Y值的波动越来越小
(3)复杂型:与X的变化呈复杂形式,即在X与Y的散点图中,表现为随着X值的增大Y值的波动复杂多变没有系统关系。
检验存在的方法
事实也证明,实际经济问题中经常会出现异方差性,这将影响回顾模型的估计、检验和应用。因此在建立计量经济模型时应检验模型是否存在异方差性。关于异方差性检验的方法大致如下:图示检验法、Goldfeld - Quandt 检验法、White检验法、Park检验法和Gleiser检验法。
1)图示检验法。①相关图分析。方差为随机变量的离散程度,通过观察y和x的相关图,可以观察的离散程度和解释变量之间的相关关系。若随x的增加,y的离散程度呈逐渐增加或减少的趋势则表明模型存在着递增或者递减的异方差性。②残差图分析。通过对模型残差分布的观察,如果分布的离散程度有明显扩大的趋势,则表明存在异方差性。图示检验法只能较简单粗略判断模型是否存在着异方差性。
2)Goldfeld - Quandt 检验法。 将解释变量排序,分成两个部分利用样本1 和样本2 分别建立回归模型,并求出各自残差平方 和,若误差项的离散程度相同,则 和 的值大致相同,若两者之间存在显著差异,则表明存在差异性。为在检验过程中“夸大”差异性,在样本中去掉c 个样本数据(c= n/4),则构造F统计量
对于给定显著水平,若,则表明模型存在异方差性,反之,则不存在。
3)怀特(white) 检验。White 检验是通过建立辅助回归模型的方法来判断异方差性。假设回归模型为二元线性回归模型 则White 检验的步骤为:估计回归模型,计算残差;估计辅助回归模型: 即将残差平方关于解释变量的一次项,二次项和交叉乘积项进行回归;计算辅助回归模型的判断系数,可以证明在同方差的假定下( ) ,其中q 为辅助回归模型中自变量的个数:给定显著水平,若 ,则认为至少有一个不为0( ),存在异方差性。
4)帕克检验( Park test ) 和格里瑟检验( Glesger test)。通过建立残差序列对解释变量的辅助回归模型,判断随机项的误差和解释变量之间是否有较强的相关关系,以此来判断模型是否存在异方差性。
Park检验:或 ;
Gleiser检验: h=±1,±2,±1/2,……,其中 是随机误差项,给定显著水平,若
经检验其中的某个辅助回归方程是显著的,则证明原模型存在异方差性。帕克检验和格里瑟检验可以判断模型是否存在异方差,而且可以探究模型异方差性的具体形式,这为后来解决异方差性打下基础
后果
在古典回归模型的假定下,普通最小二乘估计量是线性、无偏、有效估计量,即在所有无偏估量中,最小二乘估计量具有最小方差性——它是有效估计量。如果在其他假定不变的条件下,允许随机扰动项ui存在异方差性,即ui的方差随观测值的变化而变化,这就违背了最小二乘法估计的高斯——马尔柯夫假设,这时如果继续使用最小二乘法对参数进行估计,就会产生以下后果:
1.参数估计量仍然是线性无偏的,但不是有效的
2.异方差模型中的方差不再具有最小方差性
3.t检验失去作用
4.模型的预测作用遭到破坏
热心网友
时间:2022-06-21 23:28
异方差性(heteroscedasticity )是相对于同方差而言的。所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。