统计学教案习题04总体均数的估计和假设检验 联系客服

发布时间 : 星期五 文章统计学教案习题04总体均数的估计和假设检验更新完毕开始阅读3f1217806d85ec3a87c24028915f804d2b1687e0

第四章 总体均数的估计和假设检验

一、教学大纲要求

(一) 掌握内容

1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;

3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I、II类错误)及注意事项。 (二) 熟悉内容 两样本方差齐性检验。 (三) 了解内容

1. t分布的图形与特征;

2. 总体方差不等时的两样本均数的比较; 3. 等效检验。

二、教学内容精要

(一) 基本概念 1. 抽样误差

抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error)。统计上用标准误(standard error,SE)来衡量抽样误差的大小。不同的统计量,标准误的表示方法不同,如均数的标准误用SX表示,率的标准误用SP表示,回归系数的标准误用Sb表示等等。均数的标准误与标准差的区别见表4-1。

表4-1 均数的标准误与标准差的区别

意义 记法

均数的标准误 反映X的抽样误差大小 ?X(样本估计值SX)

?X=

标准差 反映一组数据的离散情况 ?(样本估计值S)

? nSn? =

S=

?(X??)n22

计算

SX=

?(X?X)n?1

控制方法

增大样本含量可减小标准误。 个体差异或自然变异,不能通过统计方法来控制。

2.可信区间

(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:CI是随机的,总体参数是固定的,所以,CI包含总体参数的可能性是1-?。不能理解为CI是固定随机的,总体参数是随机固定的,总体参数落在CI范围内可能性为1-?。当??0.05时,称为95%可信区间,记作95%CI。当??0.01时,称为99%可信区间,记作99%CI。

(2)可信区间估计的优劣:一定要同时从可信度(即1-?的大小)与区间的宽度两方面来衡量。 (二) t分布与正态分布

t分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t分布峰值较低,而尾部较高;③随自由度增大,t分布趋近与标准正态分布;当???时,t分布的极限分布是标准正态分布。

(三)总体均数的估计

参数估计有点估计和区间估计两种方式。总体均数的估计,见表4-2。

表4-2 总体均数的估计

意义 点估计 直接用样本统计量代替总体参数。

区间估计 用统计量X和Sx确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。 ①小样本(X?t?/2,?Sx,X?t?/2,?Sx)

估计 方法

以X作为估计值

②大样本(X?u?/2Sx,X?u?/2Sx) ③两总体均数差值的可信区间

(X1?X2?t?/2,?Sx1?x2,X1?X2?t?/2,?Sx1?x2)

(四)两均数差别的比较

1. 样本均数和总体均数比较的t检验 前提:服从正态分布

H0:???0;H1:???0

t?X??0,?SX?n?1 (4-1)

2. 配对设计的t检验 前提:差值服从正态分布

H0:?d?0;H1:?d?0

t?d??d, ?Sd?n?1 (4-2)

3. 成组设计的两样本均数比较的t检验

前提:两组数据均服从正态分布;两组总体方差相等 H0:?1??2;H1:?1??2

t?2??Sc?X1?X2,?SX?X12?n1?n2?2 (4-3)

2?n1?1?S12??n2?1?S211?2其中,SX1?X2= (4-4) ???, Sc?n?n?2nn122??1SX?X表示两样本均数差值的标准误。

124. 单样本u检验

前提:当样本较大(如n>50)或总体?0已知时

u?X??0S/nX??0(n较大时) (4-5)

u??0/n(?0已知时) (4-6)

5. 大样本均数比较的u检验 前提:样本足够大

成组设计的两样本均数比较可用:

X1?X2 (4-7) u?22Sx1?Sx26. 要推断组间没有差别或差别很小,应采用等效检验(squivalence test)。

(五)假设检验的步骤及有关概念

1. 基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。

2. 步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P值并作出推断结论。

3. I类错误:H0为真(实际无差别),假设检验结果拒绝H0,接受H1(推论有差别)所犯的错误称为I类

错误(type I error),I类错误的概率记作?。

II类错误:H1为真(实际有差别),假设检验结果拒绝H1,接受H0(推论无差别)所犯的错误称为II类错误(type II error),II类错误的概率记作?。

4. 1-?称为检验效能,过去称把握度(power of test),即两总体确有差别,按?水准能发现该差别的能力。

三、典型试题分析

(一) 单项选择题

1.当样本含量增大时,以下说法正确的是( ) A. 标准差会变小 B. 样均数标准误会变小 C. 均数标准误会变大 D.标准差会变大

答案:B

[评析] 本题考点:这道题是考察均数标准误的概念。

从均数标准误的定义讲,它反映的是均数抽样误差的大小,那么样本含量越大,抽样误差应该越小。从均数标准误的计算公式Sx?S/n来看,也应是n越大,Sx越小。

2.区间X ?2.58Sx的含义是( )

A.99%的总体均数在此范围内 B.样本均数的99%可信区间 C.99%的样本均数在此范围内 D.总体均数的99%可信区间 答案:D

[评析] 本题考点:可信区间的含义。

可信区间的确切含义指的是:总体参数是固定的,可信区间包含了总体参数的可能性是1??,而不是总体参数落在CI范围的可能性为1??。本题B、D均指样本均数,首先排除。A说总体均数在此范围内,显然与可信区间的含义相悖。因此答案为D。

(二) 是非题

1.进行两均数差别的假设检验时,当P≤0.05时,则拒绝H0;当P>0.05时,则接受H0,认为两总体均数无差别。

[评析] 答案:错误。当P≤0.05,拒绝H0时,我们是依据?这一小概率来下结论的。而当P>0.05时,我们对两总体均数无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。正确的说法是,按所取检验水准?,接受H1的统计证据不足。

2.通常单侧检验较双侧检验更为灵敏,更易检验出差别,应此宜广泛使用。

[评析] 答案:错误。根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或者研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较为稳妥。单侧检验,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出率高,但应慎用。

3.只要增加样本含量到足够大,就可以避免I和II型错误。

[评析] 答案:错误。因为通过假设检验推断出的结论具有概率性,因此出现错误判断的可能性就一定存在,无论用任何方法也不能消除这一可能。但是,我们可以使错误判断的可能性尽量地小,比如样本含量越大,犯I和II类错误的可能性越小。

(三) 简答题

1. 简述可信区间在假设检验问题中的作用。

[评析]可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准?的前提下进行计算,而假设检验能够获得一较为确切的概率P值。故将二者结合起来,才

是对假设检验问题的完整分析。

2.某医生就4-3资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前、后血清抗体的变化。

表4-3 328名农民血清抗体滴度及统计量

0 211 2

20 27 16

抗体滴度的倒数 40 80 160 320 19 24 25 19 57 76 75 54

免疫前人数 免疫后人数

sx S X 640 1280

3 0 76.1 111.7 6.17 25 23 411.9 470.5 25.90

t =(411.91-76.10)/25.902?6.172=12.6,按??14查t界值表P<0.01,说明接种后血清抗体有增长。

问该医生在整理资料和分析资料过程中有何不妥?

答: ①资料整理不当,未整理成配对资料;②统计描述指标使用不当,对于滴度的倒数不宜用算术均数、标准差,有“0”出现,也不宜算几何均数。比较免疫前后抗体滴度的倒数,应计算中位数和四分位数间距;③不宜用t检验。可将抗体滴度的倒数经对数或平方根转换后,做配对t检验(ν=327)。

(四) 计算题

1. 某医院用新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)见表4-4。问新药与常规药的疗效有无差别?

表4-4 两种药物治疗婴幼儿贫血结果

治疗药物

新药组 常规药组 血红蛋白增加量(g/L) 14 26 34 23 15 22 24 21 24

14 36 18 25 20 20 25 15 27 19 23 解:本题属成组设计资料。

H0:?1??2 H1:?1??2 ??0.05

t?X1?X2,?Sx1?x2?n1?n2?2

t=

2.7?1.019,??18

2.6485P>0.05

因此,根据现有资料尚不能认为新药与常规药的疗效有差别。

2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后的血沉(mm/h)见表4-5。问:(1)甲、乙两药是否均有效?(2)甲、乙两药疗效是否有别?

表4-5 甲、乙两药治疗某病情况

甲药 乙药

序号 治疗前 治疗后 序号 治疗前 治疗后

1 30 26 11 29 26

2 33 29 12 30 23

3 26 23 13 29 25

4 31 30 14 33 23

5 30 30 15 28 23

6 27 24 16 26 25

7 28 22 17 30 28

8 28 25 18 31 22

9 25 23 19 30 27

10 29 23 20 30 24

(1)解:对甲、乙两药治疗数据分别采用配对t检验,得

甲药:t=d/Sd?3.2/0.611=5.237 乙药:t=d/Sd?5.0/0.9428=5.303

v=9,P<0.001,按?=0.05水准,拒绝H0,接受H1,故可认为甲乙两药治疗前后均有差别。

(2)解:由表中资料分别求得治疗前后差值,再做两组比较。