统计学整理资料 联系客服

发布时间 : 星期日 文章统计学整理资料更新完毕开始阅读28a0aef9770bf78a65295482

? 未知?的大样本检验 1. 假设

总体服从正态分布;

当(n ? 30)时,不服从正态分布的总体可以用正态分布来近似。 2. 使用Z检验统计量

3. 将样本统计量转换为标准正态分布Z变量 4. 与Z的临界值比较

如Z检验统计量的值落在临界域内则拒绝H0 否则,不能拒绝H0

【例】某乳制品厂生产的一种盒装鲜奶的标准重量是495克。为了检测产品合格率,随机抽取100盒鲜奶,测得产品的平均重量为494克,标准差为6克,试以5%的显著性水平判断这批产品的质量是否合格。 产品的标准重量是495克,过轻或者过重都不符合产品质量标准。检验过程如下: (1)提出假设: H0:m=495;H1:m≠495;

(2)总体标准差s未知,但是由于大样本抽样,故仍选用Z统计量 (3)显著性水平a=0.05,由双侧检验,查表可以得出临界值 ?1 .96 z?/2?(4)计算统计量Z的值,式中用s代替σ: _ x??494?495Z????1.67

s/n6/100

(5)检验判断:由于 Z ? 1.67 ? Z ? ,落在接受域;故不能拒绝原假设H0,即不能说明/2?1.96这批产品的不符合质量标准。

? 未知?的小样本检验 1. 假设

总体服从正态分布; 2. 使用t检验统计量

_

x??0 t??t?n?1?s/n

4. t检验的决策规则:

若采用双侧检验,临界值为-ta/2和ta/2 。当-ta/2 ≤t ≤ ta/2时,落入接受域,不能拒绝原假设;反之,则拒绝原假设。

若采用左单侧检验,临界值为-ta。当t < -ta时,落入拒绝域,拒绝原假设;反之,则不能拒绝原假设。

若采用右单侧检验,临界值为ta。当t > -ta时,落入拒绝域,拒绝原假设;反之,则不能拒绝原假设。

【例】沿用上例,对鲜奶产品进行抽样检查,随机抽取10盒产品,测得每盒重量数据如下(单位:克):496、499、481、499、489、492、491、495、494、502。试以5%的显著性水平判断这批产品的质量是否合格。

根据前面的分析,本例题为双侧检验问题。检验过程如下: (1)提出假设: H0:m=495;H1:m≠495;

(2)总体标准差s未知,小样本抽样,故仍选用t统计量;

(3)当a=0.05,自由度n-1=9时,由双侧检验,查表可以得出临界值: 计算得: t?/2?9??2.262(4)计算统计量t的值: __ x??493.8?495x?493.8,s?6.01t????0.63 s/n6.01/10

(5)检验判断:由于 t ? 0.63 ? t? / 2 ? 2.262 ,落在接受域;故不能拒绝原假设H0,即不能说明这批产品不符合质量标准。

*总体比例的假设检验

通常是在大样本条件下进行的,根据正态分布来近似临界值,其检验方法和步骤与均值检验时相同,只是检验统计量不同。

待检验的假设为:

双侧检验: H0:???0,H1:???0左侧检验: H0:???0,H1:???0右侧检验: H0:???0,H1:???0检验统计量为: Z?

p??0?0?1??0??N?0,1?n

【例】主管经理估计25-35岁的会员占总人数的70%,随机抽取40人,调查得知其中25-35岁的会员占74%。试以5%的显著性水平判断主管经理的估计是否准确?

根据题意,建立如下假设: H0:??0.7,H1:??0.7样本比例 p=0.74;

显著性水平 a=0.05,由双侧检验,查表可以得出临界值: Za/2=1.96; 由于是大样本抽样,样本统计量Z值为:

p??00.74?0.7 Z???0.550.7(1?0.7)?0?1??0?

40 n由于 Z ? Z ,即Z的值落入接受域,故不能拒绝原假设;即不能认为主管经理的估计错误。

?

? 两个总体比例之差的假设检验

假设两个总体服从二项分布。两个总体中具有某种特征单位数的比例分别为p1和p2,但p1和p2未知,可用样本比例p1和p2代替。 待检验的假设为: 双侧检验: H0:?1??2?0,H1:?1??2?0左侧检验: H0:?1??2?0,H1:?1??2?0右侧检验: H0:?1??2?0,H1:?1??2?0检验统计量为: Z?

?p1?p2????1??2?p1?1?p1?p2?1?p2??n1n2

【例】某电子产品厂商对两条流水线上生产的同种产品进行质量检测,检测结果如下: A流水线:抽样检测产品100个,合格92个; B流水线:抽样检测产品80个,合格76个;

能否根据上述检测结果,以5%的显著性水平判断流水线B的合格率比流水线A的合格率高?

根据题意,这是一个左单侧检验问题,建立如下假设: 样本比例 p1=0.92,p2=0.95;

显著性水平 a=0.05,由左单侧检验,查表可以得出临界值: Za=-1.645;

?p1?p2????1??2??0.92?0.95?0统计量Z值为 Z???0.823 0.92(1?0.92)0.95(1?0.95)p1?1?p1?p2?1?p2??? 10080n1n2

由于 Z ? 0.823 ? Z ? ? 1.645 ,落入接受域,故不能拒绝原假设;即不能认为流水线B的产品合格率高于流水线A的。

第十二章 相关分析

相关分析与回归分析的联系、区别

1.概 念

相关分析:是用一个指标(相关系数)来表明现象间相互依存关系的密切程度。

回归分析:是根据相关关系的具体形态,选择一个合适的数学模式,来近似地表达自变量和因变量之间的数量变化关系,进而确定一个或几个变量的变化对另一个特定变量的影响程度。

(1)相关分析与回归分析的联系

相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。

如果仅有回归分析,则缺乏对研究现象的定性分析及相关关系密切程度的判断,从而影响回归分析的可靠性。如果仅有相关分析而缺乏回归分析,就会降低相关分析的实际意义。 因此,只有把两者结合起来,才能达到统计分析的目的。 (2)相关分析与回归分析的区别

相关分析只研究变量间是否存在关系及关系的密切程度;回归分析研究的是变量间存在的是什么关系,并可由回归方程进行预测和控制。

相关分析中,不必区分自变量与因变量,所研究变量属于对等关系;回归分析中,必须区分自变量和因变量,所研究变量属于非对等关系。

相关分析中,变量之间只能计算出一个相关系数,改变变量的地位不影响相关系数的数值;回归分析则不同,回归模型可能不止一个。

*散点图、相关系数、一元回归方程

? 相关系数:在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r表示

S2xyr??SxSy???x?x??y?y?n??x?x?n???y?y?n?xy??x?yn?x???x?n?y?(?y)222222n

相关系数r的取值范围:-1≤r≤1 r>0 为正相关,r < 0 为负相关; |r|=0 表示不存在线性关系; |r|=1 表示完全线性相关;

0<|r|<1表示存在不同程度线性相关: |r| < 0.4 为低度线性相关;

0.4≤ |r| <0.7为显著性线性相关; 0.7≤|r| <1.0为高度显著性线性相关。

6、某销售公司的8名推销员拨打销售电话次数与商品销售件数的资料如下。 (1)绘制散点图 (2 )计算相关系数 (3) 建立直线回归方程 找了个类似的例子,是PPT上的。