社会统计学 - 教案 联系客服

发布时间 : 星期六 文章社会统计学 - 教案更新完毕开始阅读53f539141eb91a37f0115c2a

X??x n是全部个案数目

n?x表示各个个案数值之和

2、频次分布

X??fx x是变量的各个取值,f是每个变量值对应的次数,n个案数n目

(二)分组数据

fx?X?nm xm是组中心值 xm?U?L 2小结:①三值设计的共同目的,都是希望通过一个数值来描述整体特征,以便简化资料。他们都反映了变量的集中趋势,一般说: 众值:适用于定类、定序和定距变量; 中位值:适用于定序和定距变量; 均值:适用于定距变量。它们三者的代表性决定了它们具有估计和预测的作用。 ②众值仅使用了资料中最大频次这一信息,因而资料使用不完全。中位值,考虑了变量的顺序和居中位置,因此和总体频次分布有关,但因为只考虑居中位置,因而其他变量值的变化很难影响中位值,它也是三个集中值中最不敏感的。均值,既考虑频次又考虑变量值的大小,因而更灵敏。它的解释力最强,具有较高的统计价值。③均值虽然灵敏,但对严重偏态的分布容易失去代表性。即存在非常极端的分布值时,代表性不足。例如,一个国家会因某些少数富翁的存在,使平均收入变得很高。且在分组资料中的极端组没有组限时,不能求出均值,只能用中位值。④偏态图形和三值的关系。对于正态分布的图形来说,三值是合一的。当图形正偏或负偏时,均值变化最快,中位值次之,众值不变。

第三节 离散趋势测量法

一、定类变量——异众比率

γ——非众值的次数与全部个案数目的比率。 公式为:??n?fmo nn是全部个案数目 fmo是众值的次数

二、定序变量——极差、四分位差

(一)极差 R=最大值-最小值

(二)四分位差

1、未分组数据 (1)原始资料 Q1位置?n?13n?1 Q3位置?。 44Q=Q3—Q1 (2)频次分布 2、分组资料

Q1位置?n3n Q3位置? 44?n??3n??cf??cf?13???4? Q1?L1??4wQ?L??1?w333?f1f3???????? Q=Q3—Q1

L1=Q1属组之真实下限 L3=Q3属组之真实下限 f1=Q1属组之次数 f3=Q3属组之次数

cf1↑=低于Q1属组下限之累加次数 cf3↑=低于Q3属组下限之累加次数

w1=Q1属组之组距 w3=Q3属组之组距 三、定距变量——标准差、方差 (一)标准差、方差

离均差x?x→离均差之和

??x?x?→离均差绝对值之和?x?x→

??x?x→S2??2??x?xn?22/S??x?xn?2212?n?x???x? n频次分布S??f?x?x?n?21n?fx2???fx? n21n?fxm2???fxm? n分组资料S??f?xm?x?2n?

(二)变异系数/离散系数 1、使用离散系数的原因 2、CV?S

x四、小结

异众比率最适合于分析定类变项,也可分析定序、定距变项。它仅考虑频次 极差、四分位差(十分位差)最适合用来分析定序变项,也可分析定距变项。极差仅仅考虑了变量的两个极端值,而四分位差考虑了变量的次序或大小。

标准差(或方差)只能用来分析定距变项。由于它们的计算涉及每一个变量值,所以它们反映的信息在离散值中是最全面、最可靠的变异描述指标。方差还具有可加性,能够参与进一步的统计运算。不过,也正是由于标准差和方差的计算涉及每一个变量值,所以,它们也会受到极端值的影响,当数据中有较明显的极端值时不宜使用。另外,它们在计算中实际都使用了均值,因此实际上只有均值能反映集中趋势时才能使用方差和标准差来反映离散趋势。因此,实际上方差和标准差的适用范围应当是正态分布。还有一点要说明的是,比较均值,不一定要看离散趋势,但比较标准差时,一定要看均值的情况。变异系数的计算涉及均值和标准差,因此,它也只能用于分析定距变量。它实际是对标准差的修正。

离散趋势测量法和集中趋势测量法是有互补作用的。二法并用,就可以一方面知道资料的代表值,有利于估计或预测工作,另一方面可以知道资料的差异情况,反映估计或预测时会犯的错误。

第四章 简化两个变量的分布

教学目的和要求:通过本章的学习使学生能够对相关及其性质有初步认识,学会制作与分析列联表,明确选择相关测量法的标准。

教学重点和难点: 重点是列联表、PRE意义,难点是相关关系与因果关系。 教学方法:课堂讲授,辅之以实例讲解 教学内容:

第一节 统计相关的性质

一、什么是相关?

相关,是指一个变量的值与另一个变量的值有连带性。具体来说,如果一个变量的值发生变化,另一个变量的值也有变化。 二、相关的强度和方向

1、相关强度

相关系数——表示变量间的相关程度的量的指标。

相关系数的特征:(1)不具有实际数学运算意义,只能表示相关程度更强。 (2)统计相关:相关系数是统计得来的,它只能说明两种现象间可能存在一定的关联度,不一定具有实际意义,即实际上可能并不存在,这也就是我们讲的统计相关。

(3)取值范围:[-1,1]

相关系数的正负号表明了相关的方向。其绝对值则表明了相关的程度。一般0表示无相关,1代表全相关(-1是完全负相关,1则是完全正相关)。绝对值越大,说明两变量之间的相关程度越强。 2、相关方向

正相关:一个变量的值增加时,另一个变量的值也随着增加。收入水平-消费水平

负相关:一个变量的值增大时,另一个变量的值却减小。教育水平-理想子女数目

需要大家注意的是,相关方向的分析只限于定序以上层次的变量。 三、相关关系的类型(按变量变化的表现形式)