高中数学第三章统计案例3.1独立性检验卡方检验素材苏教版选修2_3202012251100 联系客服

发布时间 : 星期五 文章高中数学第三章统计案例3.1独立性检验卡方检验素材苏教版选修2_3202012251100更新完毕开始阅读b7be53fb443610661ed9ad51f01dc281e43a5620

检验

(一) 掌握内容 1. 检验的用途。 2. 四格表的检验。

(1) 四格表检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的检验。 3. 行列表的检验。 (二) 熟悉内容

频数分布拟合优度的检验。 (三) 了解内容 1.分布的图形。

2.四格表的确切概率法。

(一)检验的用途

检验(Chi-square test)用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二)检验的基本思想

1.检验的基本思想是以值的大小来反映理论频数与实际频数的吻合程度。在零假设(比如:)成立的条件下,实际频数与理论频数相差不应该很大,即值不应该很大,若实际计算出的值较大,超过了设定的检验水准所对应的界值,则有理由怀疑的真实性,从而拒绝,接受H1(比如:)。

2. 基本公式:,A为实际频数(Actual Frequency),T为理论频数(Theoretical Frequency)。四格表检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误

样本率与总体率之间存在抽样误差,其度量方法:

,为总体率,或 (8-1) , 为样本率; (8-2) 2.总体率的可信区间

当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布。 总体率的可信区间:()。 (8-3) (四)检验的基本计算 见表8-1。

表8-1 检验的用途、假设的设立及基本计算公式

资料形式 用途 、的设立与计算公式 自由度 四格表 ①独立资料两 :两总体率相等:两总体率不等 1

样本率的比较 ①专用公式 ②当n40但1T<5时,校正公式 ②配对资料两 ③配对设计 样本率的比较

RC表 ①多个样本率、 :多个总体率(构成比)相等 (R-1)(C-

频数分布表

构成比的比较

②两个变量之 间关联性分析 频数分布的拟合优度检验

(:两种属性间存在关联) :多个总体率(构成比)不全相等 (:两种属性间存在关联)

:资料服从某已知的理论分布 :资料不服从某已知的理论分布

1) 据频数表的组数而定

(五)四格表的确切概率法

当四格表有理论数小于1或n<40时,宜用四格表的确切概率法。 (六)检验的应用条件及注意事项

1.分析四格表资料时,应注意连续性校正的问题,当140时,用连续性校正检验;T1,或n40时,用Fisher精确概率法。

2.对于RC表资料应注意以下两点:

(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5; (2)注意考察是否有有序变量存在。对于单向有序RC表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的RC表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的RC表资料,为考察两种方法检测的一致性,应选用Kappa检验。

典型试题分析 (一)单项选择题

1.下列哪项检验不适用检验( )

A. 两样本均数的比较 B. 两样本率的比较

C. 多个样本构成比的比较 D. 拟合优度检验 答案:A

[评析] 本题考点:检验的主要用途。检验不能用于均数差别的比较。 2.分析四格表时,通常在什么情况下需用Fisher精确概率法( )

A.140 B.T<5 C.T或n D.T或n 答案: C

[评析] 本题考点:对于四格表,当T或n时,不宜用检验,应用Fisher精确概率法。 3.值的取值范围为

A. << B. C. D.

答案: B

[评析]根据分布的图形或的基本公式可以判断值一定是大于等于零且没有上界的,故应选B。

(二)是非题

两样本率的比较可以采用检验,也可以采用双侧u检验。 答案:正确。

[评析]就两个样本率的比较而言,双侧u检验与检验是等价的。 (三)简答题

1.四格表的检验和u检验有何联系与区别?

答案:相同点:凡是能用u检验进行的两个率比较检验的资料,都可用检验,两者是等价的,即;相异点:(1)u检验可进行单侧检验;(2)满足四格表u检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)检验可用于22列联表资料有无关联的检验。

2.RC表检验的适用条件及当条件不满足时可以考虑的处理方法是什么?

答案:RC表检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。

(四)计算题

1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

表8-2 122对同胞兄弟静脉曲张发生情况 肥胖 发生 未发生 19 5 12 86 31 91

正常体重 发 生

未发生 合 计

合计 24 98 122

[评析]这是一个配对设计的资料,因此用配对检验公式计算。 H0:肥胖者与正常体重者的静脉曲张发生情况无差别 H1:肥胖者与正常体重者的静脉曲张发生情况不同 =,

=2.11<,P>0.05,尚不能认为静脉曲张与肥胖有关。

2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。试对这三种措施的疗效作出评价。

表8-3 三种措施的近期有效率比较 有效人数 无效人数 合计 51 84 135 6 26 32 5 13 18 62 123 185

矫治方法 夏天无眼药水 新医疗法 眼保健操 合计 有效率(%) 37.78 18.75 27.78 33.51

[评析]

:三种措施有效率相等

:三种措施有效率不相等或不全相等

=185=4.498, =(2-1)(3-1)=2

查表得0.25>P>0.10,按水准不拒绝,尚不能认为三种措施有效率有差别。

3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?

表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%) 颈麻 100 41 注药 100 94 置栓 100 89 对照 100 27

[评析] 为了应用检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。

镇痛方法 颈麻 注药 置栓 对照 合计

表8-5 4种镇痛方法的效果比较 有效例数 无效例数 41 59 94 6 89 11 27 73 251 149 合计 100 100 100 100 400 :4种镇痛方法的效果相同 :4种镇痛方法的效果不全相同

=400=146.175, =(4-1)(2-1)=3

查表得P <0.05,按水准拒绝,接受,即4种镇痛方法的效果不全相同。

四、习 题

(一) 单项选择题

1. 关于样本率p的分布正确的说法是: A. 服从正态分布 B. 服从分布

C. 当n足够大,且p和1-p均不太小,p的抽样分布逼近正态分布 D. 服从t分布 2. 以下说法正确的是: A. 两样本率比较可用u检验

B. 两样本率比较可用t检验 C. 两样本率比较时,有 D. 两样本率比较时,有 3. 率的标准误的计算公式是: A. B. C. D.

4. 以下关于检验的自由度的说法,正确的是: A.拟合优度检验时,(n为观察频数的个数) B.对一个表进行检验时,

C.对四格表检验时, =4 D.若,则 5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?

A.不能确定 B.甲、乙法一样 C.甲法优于乙法 D.乙法优于甲法 6.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,适当的方法是:

A.分性别比较 B.两个率比较的检验 C.不具可比性,不能比较 D.对性别进行标准化后再做比较 7.以下说法正确的是

A.两个样本率的比较可用u检验也可用检验