《统计学》1-410章解答(修改版) 联系客服

发布时间 : 星期五 文章《统计学》1-410章解答(修改版)更新完毕开始阅读d1d21fe0ce2f0066f433220d

第三章 数据特征的度量

思考题

1. 数据分布的特征可以从哪些方面进行度量和描述?

(1) 数据集中程度度量的常用方法有均值(算术平均数)、调和平均数、几何平均数、

众数、中位数。

(2) 数据离散程度的测度方法,常用的有极差、内距、标准差及离散系数。

2. 简述中位数、四分位数、十分位数的概念,并举例说明。 中位数是将顺序排列的统计数据从中间分成相等的两部分;

四分位数就是将排序后的数据4等分的三个数值,每部分包含25%的数据,其中中间的四分位数就是中位数,其余两项分别为下四分位数(Q1)和上四分位数(Q3); 十分位数和百分位数分别是将排序后的数据10等分和100等分的数值。

3. 简述众数、中位数和均值的特点和关系。 (1) 关系:

当数据呈对称分布时,均值、中位数、众数必定相等,即有x?Me?Mo; 当数据呈左偏分布时,均值小于中位数且小于众数,即有x?Me?Mo; 当数据呈右偏分布时,均值大于中位数且大于众数,即有x?Me?Mo;

(2) 特点:均值是根据所有数据计算的一般水平代表值,数据信息的提取足够充分,

特别是当用样本信息估计总体特征时,均值就更显示其良好的特征。因而在统计数据分析中均值起着很重要的作用。众数、中位数虽然数据信息利用不够充分,但当数据有极端值出现时,中位数的优势就显现了。

4. 简述内距、极差、标准差的概念,并举例说明。

(1) 内距:又称为四分位数差,是指上四分位数和下四分位数之差,通常用Qd表示; (2) 极差:也称全距,它是一组数据的最大值与最小值之差;

在组距式数列中,极差可以是最高组的上限与最低组下限之差; (3) 标准差:也称均方差,是各数据和均值离差平方平均数的平方根。

5. 什么是离散系数?为什么要计算离散系数?

(1) 常用的离散系数主要有标准差系数,也称均方差系数,它是数据的标准差与其相应

的均值之比;

(2) 原因:总体和样本的离散程度除了受变量值之间的离散程度影响外,还受变量值本身水平高低的影响,因此,在比较不同总体和样本的离散程度时,应消除由于变量值水平不同或计量单位不同带来的影响。在统计分析中,用离散系数来比较不同总体和不同样本的均值的代表性。

6. 简述偏度和峰度的概念。

偏度:偏度是对分布偏斜方向及程度的度量;

峰度:是对数据分布尖峭程度的度量,它可以衡量频数分布的集中程度。

练习题

1. 对某公司28位员工的年龄进行统计,得到数据如下(单位:周岁):

28 29 32 22 23 46 42 23 29 40 26 30 32 37 44 25 42 30 24 43 25 33 33 31 39 27

(1) 计算员工年龄的众数、中位数和平均数; (2) 计算标准差;

(3) 绘制员工年龄的茎叶图,说明员工年龄的分布特征。 解:(1) 众数:25,中位数:30,平均数:x=S28=88728=31.6786; (2) 7.2011; (3) 略。

2. 某地区7月份上半月的气温数据如下(单位:摄氏度):

35 37.5 28 32 37 39 37 36.5 33 35 37 29 27 30 31 (1) 计算该地区7月份上半月气温的众数、中位数和算术平均数; (2) 计算几何平均数; (3) 计算气温的标准差;

(4) 绘制直方图,说明气温分布的特点。 解:(1) 众数:37,中位数:35,算术平均数:x=S15=50415=33.6; (2) 几何平均数:G?1535?37.5???31?2.67?1011; (3) 3.874; (4) 略。

25 27

(将第3题改成了分组数据)

3. 某百货公司冬天连续60天的销售额数据分组如下(单位:万元): 按销售额分组(万元) 280~290 290~300 300~310 310~320 320~330 330~340 340~350 350~360 试计算该组数据的平均数、中位数、众数。 解:(1)

频数(fi) 1 3 9 10 13 11 8 5 组中值(xi) 285 295 305 315 325 335 345 355 x?325.1667,

(2)由N/2?30确定中位数在320~330组内,故60-232Me?320+*10?325.3846,13

(3)由题中数据分布知,众数在出现次数最多的320~330组内,故

Mo?320+

13-10*10?326.

(13-10)+(13-11)4. 一项对大学生身高状况的调查表明,男生的平均身高为175cm,标准差为5cm,女生的平均身高为165cm,标准差为5cm。试问是男生的身高差异大还是女生的身高差异大? 解:比较男、女生身高的离散系数,

v男=?男x男=?55=0.02857,v女=女==0.0303, 175x女165v男?v女,故女生的身高差异大。

5. 对10名男生和10名女生的体重(单位:Kg)进行抽样调查,结果如下: 男生组 女生组 64 52 56 54 60 45 62 50 68 48 54 47 52 54 60 55 65 46 61 50 (1) 现在要比较男生和女生的体重差异,应采用什么方法?

(2) 比较分析哪一组的体重差异大? 解:(1) 采用离散系数进行比较; (2)

?男602x男==60.2,?男=5.0067,v男==0.0832,

10x男?501=50.1,?女=3.573,v女=女=0.0713, 10x女x女=由于v男>v女,故女生组体重差异大。

6. 一种机器由多个零组件组成,在使用之前需要人工组装,现在有四种组装方法,为选取最好的方法,随机抽取10个工人,由他们分别用四种方法进行组装。工人们分别采用四种方法组装的机器数量(单位:台)如下:

方法A 92 93 90 85 89 91 87 82 83 90 方法B 65 69 59 60 62 67 56 58 63 62 方法C 82 88 78 70 79 83 85 80 79 78 方法D 79 73 69 70 75 68 65 70 72 71 试采用一种你认为比较好的方法来评价组装方法的优劣。 解:下表给出了一些主要描述统计量:

平均数 中位数 众数 标准差 极差 方法A 88.2 89.5 90 3.795 11 方法B 62.1 62 62 4.0675 13 方法C 80.2 79.5 78、79 4.8488 18 方法D 71.2 70.5 70 3.8816 14