求助线性回归分析论文
发布网友
发布时间:2022-05-01 10:49
我来回答
共2个回答
热心网友
时间:2023-10-09 08:49
第一节 一元线性回归方程的显著性检验
由上面的讨论知,对于任何的两个变量x和Y的一组观测数据( )(i=1,2,……,n)按公式(10)和(11)都可以确定一个回归方程
然而事前并不知道Y和x之间是否存在线性关系,如果两个变量Y和x之间并不存在显著的线性相关关系,那么这样确定的回归方程显然是毫无实际意义的.因此,我们首先要判断Y和x是否线性相关,也就是要来检验线性假设 是否可信,显然,如果Y和x之间无线性关系,则线性模型的一次项系数 =0;否则 0.所以检验两个变量之间是否存在线性相关关系,归根到底是要检验假设
根据现行假设对数据所提的要求可知,观察值 , ,…… 之间的差异,是有两个方面的原因引起的:(1)自变量x的值不相同;(2)其它因素的影响,检验 是否成立的问题,也就是检验这两方面的影响哪一个是主要的问题.因此,就必须把他们引起的差异从Y的总的差异中分解出来.也就是说,为了选择适当的检验统计量,先导出离差平方和的分解因式.[6]
一、离差平方和的分解公式
观察值 (i=1,2,……,n),与其平均值 的离差平方和,称为总的离差平方和,记作
因为
=
其中:
=2
=2
=2
=2
所以
=
由于 中的 , 为(10)和(11)所确定.即它们满足正规方程组(9)的解.因此定义项
=
于是得到了总离差平方和的分解公式:
其中
(19)
是回归直线 上横坐标为 的点的纵坐标,并且 的平均值为 , 是 这n个数的偏差平方和,它描述了 的离散程度,还说明它是来源于 的分散性,并且是通过x对于Y的线性影响而反映出来的,所以, 称为回归平方和
而 =
它正是前面讨论的 的最小值,在假设(1)式的条件下它是由不可观察的随机变量 引起的,也就是说,它是由其它未控制的因素及试验误差引起的,它的大小反映了其它因素以及试验误差对实验结果得影响.我们称 为剩余平方和或残差平方和.[7]
二、 、 的性质及其分布
由以上分析可知,要解决判断Y和x之间是否存在线性相关关系的问题,需要通过比较回归平方和和剩余平方和来实现.为了更清楚地说明这一点,并寻求出检验统计量,考察估计量 , 的性质及其分布.
(一) 的分布
由(14)式可知
=
在 相互独立且服从同一分布 的假定下由(2)知 , ,…… 是P个相互独立的随机变量,且 (i=1,2,……,n)所以他们的平均值 的数学期望为:
因为 是 的线性函数,且有:
这说明 是 的无偏估计量且 的方差为
所以
即:
同样可证,对于任意给定的 其对应的回归值 (它是 的点估计)适合
( ,
(二) 方差 的估计及分布
因为
=
=
=
由 、 及 可得
=
又由于 及E(L),E(U)得
=E(L)+E(U) =(n-2)
从而,说明了 = = 是 的无偏估计量,由此可见,不论假设 成立与否, 是 的一个无偏估计量,而 仅当假设成立时,才是 的一个无偏估计量,否则它的期望值大于 .说明比值
(20)
在假设成立时有偏大倾向,也就是说,如果F取得值相当大,则没有理由认为x和Y之间有线性相关关系,也就是下面我们将采用F作为检验统计量的原因.另外,由于 , 是 的最小二乘估计,由(8)式可知
=0 , =0
这表明 中的n个变量 , …… 之间有两个独立的线性约束条件,
参考资料:http://www.chinesejy.com/Article/145/2006/20061221159192.html
热心网友
时间:2023-10-09 08:49
http://www.baidu.com/?sr=E8FCC39BF3A8C55A2D9ACE09E889A6E9623A88FD&tn=cb3&word=%CF%DF%D0%D4%BB%D8%B9%E9%B7%D6%CE%F6%C2%DB%CE%C4&bar=4