1)平均值一样标准差可以一样也可以不一样;
2)平均值不一样,标准差可以一样;
3)方差相等标准差也相等,反之亦然。
4)平均值和方差是描述随机变
取值集中趋势和分散程度的量。
平均值
平均值的概念很简单:所有数据之和除以数据点的个数,以此表示数据集的平均大小;其数学定义为:
以下面10个点的CPU使用率数据为例,其平均值为17.2。
14 31 16 19 26 14 14 14 11 13
方差、标准差
方差这一概念的目的是为了表示数据集中数据点的离散程度;
标准差与方差一样,表示的也是数据点的离散程度;其在数学上定义为方差的平方根。
与方差相比,使用标准差来表示数据点的离散程度有3个好处:
表示离散程度的数字与样本数据点的数量级一致,更适合对数据样本形成感性认知。依然以上述10个点的CPU使用率数据为例,其方差约为41,而标准差则为6.4;两者相比较,标准差更适合人理解。
表示离散程度的数字单位与样本数据的单位一致,更方便做后续的分析运算。
在样本数据大致符合正态分布的情况下,标准差具有方便估算的特性:66.7%的数据点落在平均值前后1个标准差的范围内、95%的数据点落在平均值前后2个标准差的范围内,而99%的数据点将会落在平均值前后3个标准差的范围内。
计算平均值,一般常用的有两种方法:一种是简单平均法,一种是加权平均法。
例如,某企业生产A产品10台,单价100元;生产B产品5台,单价50元;生产C产品3台,单价30元,计算平均价格?
简单平均法:平均价格=∑各类产品单价 / 产品种类
平均价格=(100+50+30)/ 3 = 60(元)
加权平均法:平均价格=∑(产品单价×产品数量)/ ∑(产品数量)
平均价格=(100×10+50×5+30×3)/(10+5+3)= 74.44(元)
可以看出,简单平均与加权平均计算出来的平均值差距较大,而后者更贴近事实,属于精确计算。
标准差是方差开方后的结果(即方差的算术平方根)
假设这组数据的平均值是m
方差公式s^2=1/n[(x1-m)^2+(x2-m)^2+...+(xn-m)^2]
方差是各个数据与平均数之差的平方的平均数
比如1.2.3.4.5 这五个数的平均数是3
方差就是 1/5[(1-3)²+(2-3)²+(3-3)²+(4-3)²+(5-3)²]=2
高中:
方差是实际值与期望值之差平方的期望值,而标准差是方差平方根.在实际计算中,我们用以下公式计算方差. 方差是各个数据与平均数之差的平方的平均数,即 s^2=(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2] ,其中,x_表示样本的平均数,n表示样本的数量,^2表示平方,xn表示个体,而s^2就表示方差. 而当用(1/n)[(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]作为总体X的方差的估计时,发现其数学期望并不是X的方差,而是X方差的(n-1)/n倍,[1/(n-1)][(x1-x_)^2+(x2-x_)^2+...+(xn-x_)^2]的数学期望才是X的方差,用它作为X的方差的估计具有“无偏性”,所以我们总是用[1/(n-1)]∑(Xi-X~)^2来估计X的方差,并且把它叫做“样本方差”. 方差,通俗点讲,就是和中心偏离的程度!用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.记作S².在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定
平均值一样,标准差不一定一样,方差也不一定一样。
不一样。各自评价的目的不同。