大哥,您好,我想知道协方差,相关系数的一些相关知识,看不懂协方差的那个计算公式哦
发布网友
发布时间:2022-04-30 02:00
我来回答
共1个回答
热心网友
时间:2023-10-02 03:04
两个不同参数之间的方差就是协方差
若两个随机变量X和Y相互独立,则E[(X-E(X))(Y-E(Y))]=0,因而若上述数学期望不为零,则X和Y必不是相互独立的,亦即它们之间存在着一定的关系。
定义
E[(X-E(X))(Y-E(Y))]称为随机变量X和Y的协方差,记作COV(X,Y),即COV(X,Y)=E[(X-E(X))(Y-E(Y))]。
协方差与方差之间有如下关系:
D(X+Y)=D(X)+D(Y)+2COV(X,Y)
D(X-Y)=D(X)+D(Y)-2COV(X,Y)
因此,COV(X,Y)=E(XY)-E(X)E(Y)。
[编辑本段]
协方差的性质
(1)COV(X,Y)=COV(Y,X);
(2)COV(aX,bY)=abCOV(X,Y),(a,b是常数);
(3)COV(X1+X2,Y)=COV(X1,Y)+COV(X2,Y)。
由协方差定义,可以看出COV(X,X)=D(X),COV(Y,Y)=D(Y)。
协方差作为描述X和Y相关程度的量,在同一物理量纲之下有一定的作用,但同样的两个量采用不同的量纲使它们的协方差在数值上表现出很大的差异。为此引入如下概念:
定义
ρXY=COV(X,Y)/√D(X)√D(Y),称为随机变量X和Y的相关系数。
定义
若ρXY=0,则称X与Y不相关。
即ρXY=0的充分必要条件是COV(X,Y)=0,亦即不相关和协方差为零是等价的。
定理
设ρXY是随机变量X和Y的相关系数,则有
(1)∣ρXY∣≤1;
(2)∣ρXY∣=1充分必要条件为P{Y=aX+b}=1,(a,b为常数,a≠0)
定义
设X和Y是随机变量,若E(X^k),k=1,2,...存在,则称它为X的k阶原点矩,简称k阶矩。
若E{[X-E(X)]^k},k=1,2,...存在,则称它为X的k阶中心矩。
若E(X^kY^l),k、l=1,2,...存在,则称它为X和Y的k+l阶混合原点矩。
若E{[X-E(X)]^k[Y-E(Y)]^l},k、l=1,2,...存在,则称它为X和Y的k+l阶混合中心矩。
显然,X的数学期望E(X)是X的一阶原点矩,方差D(X)是X的二阶中心矩,协方差COV(X,Y)是X和Y的二阶混合中心矩。
[编辑本段]
协方差在农业上的应用
农业科学实验中,经常会出现可以控制的质量因子和不可以控制的数量因子同时影响实验结果的情况,这时就需要采用协方差分析的统计处理方法,将质量因子与数量因子(也称协变量)综合起来加以考虑。
比如,要研究3种肥料对苹果产量的实际效应,而各棵苹果树头年的“基础产量”不一致,但对试验结果又有一定的影响。要消除这一因素带来的影响,就需将各棵苹果树第1年年产量这一因素作为协变量进行协方差分析,才能得到正确的实验结果。
a =
-1 1 2
-2 3 1
4 0 3
for i=1:size(a,2)
for j=1:size(a,2)
c(i,j)=sum((a(:,i)-mean(a(:,i))).*(a(:,j)-mean(a(:,j))))/(size(a,1)-1);
end
end
c =
10.3333 -4.1667 3.0000
-4.1667 2.3333 -1.5000
3.0000 -1.5000 1.0000
c为求得的协方差矩阵,在matlab以矩阵a的每一列为变量,对应的每一行为样本。这样在矩阵a中就有3个列变量分别为a(:,1), a(:,2), a(:,3)。
在协方差矩阵c中,每一个元素c(i,j)为对第i列与第j列的协方差,例如c(1,2) = -4.1667为第一列与第二列的协方差。
拿c(1,2)的求解过程来说
c(1,2)=sum((a(:,1)-mean(a(:,1))).*(a(:,2)-mean(a(:,2))))/(size(a,1)-1);
1. a(:,1)-mean(a(:,1)),第一列的元素减去该列的均值得到
-1.3333
-2.3333
3.6667
2, a(:,2)-mean(a(:,2)),第二列的元素减去该列的均值得到
-0.3333
1.6667
-1.3333
3, 再将第一步与第二部的结果相乘
-1.3333 -0.3333 0.4444
-2.3333 .* 1.6667 = -3.8889
3.6667 -1.3333 -4.8889
4, 再将结果求和/size(a,1)-1 得 -4.1667,该值即为c(1,2)的值。
再细看一下是不是与协方差公式:Cov(X,Y) = E{ [ (X-E(X) ] [ (Y-E(Y) ] } 过程基本一致呢,只是在第4步的时候matlab做了稍微的调整,自由度为n-1,减少了一行的样本值个数。
已知协方差求其特征值:
先写出协方差矩阵s,再调用eig(s)这个库函数,调用方法:[ev,ed]=eig(s).ed为特征值矩阵,ev特征向量矩阵,排列顺序:从低阶到高阶。》s=[2291.333 1340 1934 2523.333 1245.333 2482; 1340 956.6667 1596 1401.333 883.3333 1480;1934 1596 4281.667 1436.667 1663 1945.667;2523.333 1401.333 1436.667 2984.667 1236 2800.667; 1245.333 883.333 1663 1236 843 1343;2482 1480 1945.667 2800.667 1343 2729.667]》[ev,ed]=eig(s) 先写出协方差矩阵s,再调用eig(s)这个库函数,调用方法:[ev,ed]=eig(s).ed为特征值矩阵,ev特征向量矩阵,排列顺序:从低阶到高阶。》s=[2291.333 1340 1934 2523.333 1245.333 2482; 1340 956.6667 1596 1401.333 883.3333 1480;1934 1596 4281.667 1436.667 1663 1945.667;2523.333 1401.333 1436.667 2984.667 1236 2800.667; 1245.333 883.333 1663 1236 843 1343;2482 1480 1945.667 2800.667 1343 2729.667]》[ev,ed]=eig(s)