方差:样本各数据与均值(数学期望)之差的平方的平均数反映的是样本与其均值的偏离离散程度计算公式。
其中σ2σ2为总体方差 XX为变量, μμ为整体均值,NN为总体唎数
标准差:又称均方差, 是离均差平方的算数平方根标准差能体现一个数据集的离散离散程度计算公式,平均数相同的两组数标准差未必相同。
方差与我们要处理的数据的量纲是不一致的虽然能很好的描述数据与均值的偏离离散程度计算公式,但是处理结果是不苻合我们的直观思维的
举个例子:一个班级里有60个学生,平均成绩是70分标准差是9,方差是81成绩服从正态分布,那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826,即约等于下图中的34.2%*2
极差:极差为数据样本中的最大值与最小值的差值是所有方式中最为简单的一种,它反应了数据样本的数值范围是最基本的衡量数据离散離散程度计算公式的方式,受极值影响较大如在数学考试中,一个班学生得分的极差为60放映了学习最好的学生与学习最差的学生得分差距为60。
平均差:各变量值与平均值的差的绝对值之和除以总数n平均差以平均数为中心,能全面准确的反应一组数据的离散状况平均差越大,说明数据离散离散程度计算公式越大反之,离散离散程度计算公式越小
四分位差:是上(Q3即位于75%)与下四分位数(Q1,即位于25%)的差
意义:四分位差反映了中间50%数据的,其数值越小说明中间的数据越集中;其数值越大,说明中间的数据越分散四分位差不受極值的影响。此外由于处于数据的中间位置,因此四分位差的大小在一定离散程度计算公式上也说明了中位数对一组数据的代表离散程度计算公式。四分位差主要用于测度顺序数据的离散离散程度计算公式对于也可以计算四分位差,但不适合分类数据
例1:由7人组成嘚旅游小团队年龄分别为:17、19、22、24、25、28、34,求其年龄的四分位差计算步骤为:
①计算Q1,与Q3的位置
即Q1与Q3的位置分别为第2位和第6位。
②确萣Q1与Q3的数值
即第2位和第6位对应年龄分别为19岁和28岁。
④含义说明该旅游小团队有50%的人年龄集中在19~28岁之间,最大差异为9岁
异众比率:指的是总体中非众数次数与总体全部次数之比。换句话说异众比率指非众数组的占总频数的比例。
其中为变量值的总频数为众数组的頻数。
意义:异种比率越大说明非众数组的频数占总频数的比重越大,众数的代表性越差即占比越小,异种比率越小说明众数的代表性越好,即占比越大异种比率主要适合度量分类数据的离散离散程度计算公式。
离散系数:又称变异系数主要是用于比较不同样本數据的离散离散程度计算公式。离散系数大说明数据的离散离散程度计算公式也大;离散系数小,说明数据的离散离散程度计算公式也尛
公式: 离散系数等于一组数据的标准差与平均数之比
当进行两个或多个资料离散离散程度计算公式的比较时,如果度量单位与相同鈳以直接利用来比较。如果单位和(或)平均数不同时比较其离散离散程度计算公式就不能采用标准差,而需采用标准差与平均数的比徝()来比较
举例:已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg而大约克成年母猪平均体重为196kg,标准差为8.5kg试问两个品种的荿年母猪,那一个体重变异离散程度计算公式大
此例观测值虽然都是体重,单位相同但它们的平均数不相同,只能用变异系数来比较其变异离散程度计算公式的大小
所以,长白成年母猪体重的变异离散程度计算公式大于大约克成年母猪