协方差
在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
协方差定义
COV(X,Y)=E[(X-E(X))(Y-E(Y))]等价计算式为COV(X,Y)=E(XY)-E(X)E(Y)。例如:Xi 1.1 1.9 3Yi 5.0 10.4 14.6E(X) = (1.1+1.9+3)/3=2E(Y) = (5.0+10.4+14.6)/3=10E(XY)=(1.1×5.0+1.9×10.4+3×14.6)/3=23.02Cov(X,Y)=E(XY)-E(X)E(Y)=23.02-2×10=3.02
补充
协方差公式推导cov(X,Y)=∑ni=1(XiX)(YiY)n=E[(XE[X])(YE[Y])]cov(X,Y)=∑i=1n(XiX)(YiY)n=E[(XE[X])
协方差cov计算公式=cov(x,y)=EXY-EX×EY。协方差在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
协方差公式
Cov(X,Y)=E(((X-E(X))(Y-E(Y)))即Cov(X,Y)=E(XY)-E(X)E(Y)中 E(XY)怎么求
Q1:XY的联合分布可以这样理解
令Z=XY,因为X,Y各有4种取值,分别都是0,1,2,3.
那么Z就有如下取值:0(x取零时,y取任何值z都等于0;y取0时,x取任何值z都等于0)
所以 P{Z=0}={x=0时y取0,1,2,3的概率和}+{y取0时,x取1,2,3的概率和}
=0.22+0.16=0.38
P{Z=1}=P{x,y同时为1,Z才可能取1}=P{X=1,Y=1}=0.06
P{Z=2}=P{x=1,y=2}+P{X=2,Y=1}=0.07+0.07=0.14
P{Z=3}=P{x=1,y=3}+P{x=3,y=1}=0.03+0.04=0.07
P{Z=4}=P{x=2,y=2}=0.14
P{z=9}=P{x=3,y=3}=0.09
Z=XY| 0 1 2 3 4 9
p| 0.38 0.06 0.14 0.07 0.14 0.09
E(XY)=E(Z)=0*0.38+1*0.06+2.*0.14 +3*0.07+4*0.14+9*0.09=2.55