卫生统计学复习题 联系客服

发布时间 : 星期日 文章卫生统计学复习题更新完毕开始阅读7f94e97527284b73f24250c0

意义,而通常的检验假设其总是非特定的,所以β值的大小很难确切估计。仅知道样本例数确定时,α越小,β越大,反之,α越大,β越小。所以α和β是相互制约的,可以根据研究要求适当控制。要同时减少α及β,唯一的方法是增加样本例数,当样本例数确定后,可以通过选定α来控制β。若重点减少α,一般取较小的α;若重点减少β,一般取α=0.05,α=0.1或更高,因为虽属未知,但估计比取α=0.01时小些。

假设检验时,一般当P<0.05时,则拒绝H0,理论根据是什么?

答:P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t值或u值)的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知道可能犯Ⅰ型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

假设检验中?和P的区别何在?

答:?和P均为概率,其中?是指拒绝了实际上成立的H0所犯错误的概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与?对比来得到结论,若P≤?,则拒绝H0,接受H1,有统计学意义,可以认为??不同或不等;若P> ?,则不拒绝H0,无统计学意义,还不能认为??不同或不等。 检验假设中P值的意义是什么?

答:如果总体状况与H0一致,统计量获得现有数值以及更不利于H0的数值的概率。

能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么? 答:不能,因为P值的大小与总体指标间差异大小不完全等同。P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。

P值越小,不能说差异越显著或者是差异越大,只能说统计学结论越可靠,发现差异的把握越好。统计学结论值说明总体的参数之间有无差异,以及得出这种结论的可靠程度。具体差异的大小,要经专业判,统计学结论要和专业结论结合起来,才能做出最终的判断。 请你谈谈对假设检验结论的认识。

由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。

如何确定检验水准?

答:检验水准确定需根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。

怎样正确选用单侧检验和双侧检验?

答:单双侧检验首先应考虑所要解决的问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。 t检验的应用条件是什么?

答:(1)随机事件,(2)来自正态分布总体,(3)均数比较时,要求两总体方差相等。

对单样本t检验要求资料服从正态分布;对配对t检验要求差值服从正态分布;对两样本t检验则要求两组数据均服从正态分布,且两样本对应的两总体方差相等,对两小样本尤其要求方差齐性。

简述t检验的具体步骤,如何进行检验结果判断?

步骤:(1)建立假设和确定检验水准α;(2)计算统计量;(3)确定P值;(4)判断结果。结果的判断:P >α,接受H0,差异无显著性,可认为差异是由抽样误差所致。P ≤α,拒绝H0,差异有显著性,可认为样本间存在差异。 简述假设检验的注意事项。

答:假设检验的注意事项:①假设检验时可能犯两类错误;②选择检验方法要注意符合其应用条件;③正确理解假设检验的结论;④当差别无显著性时,有两种可能;⑤统计学的显著性与否和日常生活中的显著性概念不同;⑥单侧检验与双侧检验

1、严密的研究设计2、根据设计要求和资料的类型选择适当的检验方法 3、正确理解P值的含义 4、正确理解和解释统计学结果

第八章 方差分析

方差分析的基本思想是什么?

答:方差分析的基本思想是把全部观察值间的变异按设计和需要分解成两个或多个组成部分,然后将各个部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。 方差分析的应用条件是什么?

答:(1)各样本是相互独立的随机样本,(2)都采自正态总体,(3)各个总体方差相等。

方差分析的用途有哪些?

方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分析。

试比较完全随机设计和随机区组设计资料的方差分析基本思想。 (1)完全随机设计资料的方差分析

完全随机设计(completely random design):亦称成组设计。该设计仅涉及一个研究因素,k个不同的水平(k个分组)。用单因素方差分析(one-way ANOVA)。三种变异:SS总=SS组间+SS组内 (2)随机区组设计资料的方差分析

随机区组设计(random block design):又称配伍设计,是配对设计的扩展。 四种变异:SS总= SS处理+ SS区组+ SS误差,ν总=kb-1 在完全随机设计方差分析中SS组间、SS组内各表示什么含义?

答:SS组间表示组间变异,指各处理组样本均数大小不等,是由处理因素作用(如果有)和随机误差造成的;SS组内表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。 方差分析存在问题

方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息,可进行多个样本间的两两比较。 重复测量设计与随机区组设计的区别

在于重复测量的时点不能随机分配给受试对象,时间因素仅为受试对象的伴随因素;各时点之间的效应指标存在相关关系。而随机区组设计的特征是区组内受试个体同质且彼此独立,只是接受的处理不同。 重复测量设计的优缺点 1、优点:

(1)每一个体作为自身的对照,克服了个体间的变异。分析时可更好地集中于

处理效应。

(2)因重复测量设计的每一个体作为自身的对照,所以研究所需的个体相对较少,因此更加经济。 2、缺点:

(1)滞留效应(carry-over effect) :前面的处理效应有可能滞留到下一次的处理。

(2)潜隐效应(latent effect):前面的处理效应有可能激活原本以前不活跃的效应。

(3)学习效应(learning effect):由于逐步熟悉实验,研究对象的反应能力有可能逐步得到了提高。

重复测量资料方差分析的前提条件

1、正态性,处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数服从正态分布 (个体内不独立);

2、方差齐性,相互比较的各处理水平的总体方差相等,即具有方差齐同; 3、各时间点组成的协方差阵(covariance matrix)具有球形性(sphericity/circularity)特征或复合对称性(compound symmetry)。 多个样本均数的两两比较能否用t检验或u检验?

每次犯第一类错误的概率0.05,10次都犯的概率不是0.05,而是:5/45≈0.11远大于0.05,不是小概率事件,会把本来无差别的两个总体均数判断为有差别。应用方差分析

两两比较的方法很多:有多重比较(multiple)、线性对比(linear contrast)、正交对比(orthogonal contrasts)等。常用的是多重比较,进一步又可分为以下两种情况:

(1)探索性研究(exploratory research),涉及每两个均数的比较。可采用SNK(Student-Newman-Keuls)法、Bonfferoni t 检验、??。

(2)证实性研究(confirmatory research),如多个处理组与对照组的比较,某一对或几对在专业上有特殊意义的均数间的比较等。可采用Dunnett-t检验、LSD-t检验(Fisher’s least significant difference t test)等,也可以用Bonfferoni t 检验。 数据变换的目的和方法:

目的:将原始资料变换成适用于检验方法的资料 方法:对数变换、平方根变换、倒数变换等。

为什么在方差分析的结果为拒绝H0、接受H1之后,对多个样本均数的两两比较要用多重比较的方法?

答:方差分析的备择假设H1是g个总体均数不全相等,拒绝H0,接受H1,只说明g个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。 两因素析因设计和随机区组设计的区别。书P151 小结4 对不符合方差分析假定条件的资料的分析方法。书P152 小结8 书P152课后简答:

1、方差分析师用于研究哪种数据的统计方法

2、方差分析的基本思想是什么?总离均差平方和以及总自由度怎样计算? 3、两样本t检验与完全随机设计资料的方差分析有何关系?配对样本t检验与随机区组设计资料的方差分析又有何关系? 4、举例说明何谓交互效应?并绘制交互效应图。

5、SNK-q检验Dunnett-t检验都可用于均数的多重比较,它们有何不同? 6、数据变换在资料处理中有什么作用?

第九章 x2

检验

完全随机设计的两样本率比较时,如何正确选择统计分析方法(写出相应的计算公式)。

(1)当总例数n≥40且所有格子的T≥5时,用x2检验的基本公式或四格表资料x2

检验的专用公式;当P ≈α时,改用四格表资料的Fisher确切概率法。公式为: ,v=(行数-1)(列数-1)

(2)当n≥40但有1≤T<5时,用四格表资料x2检验的校正公式 ;或改用四格表资料的Fisher确切概率法的连续性校正法: , (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 x2检验的基本思想是什么?

答:①x2检验的基本思想:其计算公式为 ,式中A代表实际频数;T代表理论频数;而x2值反映了实际频数与理论频数的吻合程度,其中 反映了某个格子实际频数与理论频数的吻合程度。若检验假设H0成立,实际频数与理论频数的差值会小,则x2值也会小;反之,若检验假设H0不成立,实际频数与理论频数的差值会大,则x2

值也会大。 说明x2检验的用途。

答:x2

检验的用途较广。通常多用于①推断两个总体率或构成比之间有无差别;②推断多个总体率或构成比之间有无差别;③多个样本率的多重比较;④两个分类变量之间有无关联性;⑤频数分布拟合优度的x2检验。 两样本率比较的u检验与x2检验有何异同?

答:两样本率比较时,若对同一资料同时进行u检验与x2检验,在不校正的情况下,x2=u2;但u检验通常用于大样本,而x2检验可用于大样本或小样本。 对于四格表资料,如何正确选用检验方法?

答:(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。 (2)对于两样本率比较的四格表资料(独立样本2X2列联表资料),应根据各格的理论值T和总例数n的大小选择不同的x2

计算公式:①当n≥40且所有的T≥5时,用x2

检验的基本公式 或四格表资料x2

检验的专用公式 ,②n≥40,且任一理论频数T有1≤T<5,用四格表资料x2检验的校正公式 或 (或用四格表资料的Fisher确切概率法);③当n<40,或T<1时,用四格表资料的Fisher确切概率法。

若资料满足两样本率u检验的条件,也可用u检验。

(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时:①(b+c) ≥40, ;②(b+c) <40, 。 说明行×列表资料x2检验应注意的事项。(书P164)

答:(1)行×列表中的理论频数不应小于1,或1≤T<5的格子数不宜超过格子总数的1/5。

(2)多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间皆有差别。要进一步推断哪两个总体率之间有差别,需进一步做多个样本率的x2分割或多重比较。 (3)对于有序的R×C表资料不宜用x2检验。对于R×C表的资料要根据其分类类型和研究目的选用恰当的检验方法。 说明R×C表的分类及其检验方法的选择。

答:(1)分类:R×C表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。

(2)检验方法的选择:①双向无序R×C表:若研究目的为多个样本率(或构成比)的比较,可用行×列表资料的x2检验;若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可用行×列表资料的x2

检验以及Pearson列联系数进行分析。②单向有序R×C表:若R×C表中的分组变量是有序的,而指标变量是无序的,此种单向有序R×C表资料可进行行×列表资料的x2检验分析其构成情况;若R×C表中的分组变量为无序的,而指标变量是有序的,此种单向有序R×C表资料宜用秩和检验分析。③双向有序属性相同的R×C表:宜用一致性检验分析两种检测方法的一致性。④双向有序属性不同的R×C表:若研究目的如为分析不同年龄组患者疗效之间有无差别时,可把它视为单向有序R

×C表资料,选用秩和检验;若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。

两组或多组等级资料的比较,为什么不能用x2

检验,而用秩转换的非参数检验? 答:若选行×列表资料的x2检验,只能推断两个或多个总体的等级构成比差别,这一般不是推断目的;而选秩转换的非参数检验,可推断两个或多个总体的等级强度差别,这是推断目的。 课后简答题:

卡方检验的应用条件有哪些?课本P174小结3

比较两个独立样本频率分布的χ2检验,和比较两个配对样本频率分布的χ2检验在设计方法、资料整理、假设检验等方面的差别是什么?

答:前面针对的是“两独立样本”,行合计是事先固定的;而后者实质上是一组样本,及时可以看成两个样本,也是“两个互不独立的样本”,样本含量都是n,是固定的,而行合计与列合计却是事先不确定的。

前者原始数据可以表示为教材中表9-3所示的四格表形式,而后者原始数据表示为表9-9所示的四格表形式。检验统计量,前者用教材中公式9-5和公式9-7,而后者用9-9和9-10。

如果实验效应应用等级资料表示,欲比较两组总体效应间差别是否有统计学意义,为什么不能用χ2检验?请举例说明。

答:关键在于此时χ2检验差别有统计意义,只能推断两频率分布不同,而频率分布不同不能说明两总体平均水平不同。 为什么有些四个表必须要计算确切概率?

第十一章 两变量关联性分析

相关系数的特点:

参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个;相关系数没有单位,其值为-1≤r≤1,r绝对值越大,相关关系越密切;相关系数的正负号反映相关关系的方向,r值为正表示正相关,r值为负表示负相关,r值等于零为零相关,r值的绝对值等于1为完全相关;计算相关系数的两个变量都是随机变量。 积差相关系数的适用条件

两个变量的测量值应来自于同一总体或同一样本中n个个体的测量,或者是来自于对两个有意义配对的总体或样本的测量;两个变量的分布应近似于正态分布;样本量不能太小,样本量太小时所计算出的相关系数不够稳定。 直线相关系数的意义

直线相关系数r的值,在任何情况下总在﹣1与﹢1之间,而在医学研究中由于影响因素众多,很少有完全相关的情况;相关系数r的正负号表示相关的性质,即正相关、负相关以及零相关;相关系数r的绝对值大小表示相关程度的大小(强弱),愈接近于1,相关程度愈高;愈接近于0,相关程度愈低。 线性相关应用中应注意的问题

1、样本的相关系数接近零时并不意味着两变量间一定无相关性。2、一个变量的数值人为选定时莫作相关。3、出现异常点时慎用相关。4、相关未必真有内在联系。5、分层资料盲目合并易出假象。6、注意变量取值的离散程度。 秩相关适用于下列资料:(1)不服从双变量正态分布(2)总体分布型未知(3)等级资料

Spearman等级相关:它是用秩相关系数rs说明两变量间相关关系的密切程度和方向。

何为两属性相互独立?书P203

所谓两属性X和Y互相独立(independence),是指属性X的分布的概率与属性Y的概率分布无关,否则称这两种属性之间存在关联性。从概率的角度考虑,独立是指在交叉分类表每一格子中同时具有两种属性的联合概率等于相应属性的边际概率的乘积。

列联系数。书P204

关于两个分类变量关联程度,我们可用Peason列联系数(contingency coefficient)来描述。列联系数介于0与1之间,表示两种属性相关的密切程度。理论上也应就总体列联系数是否为0作假设检验,但这个假设检验等价于上述两变量关联性分析的卡方检验。 相关系数和列联系数。书P211小结4、5

对两个随机变量进行关联性或相关性分析时,如何正确选择统计分析方法(写出相应的公式)?

答:①两变量为数值变量时:a、若两变量均为正态随机变量,且其散点图呈直线趋势,则用直线相关分析,计算样本相关系数: 然后对其进行假设检验: H0:ρ=0 H1:ρ≠0 α=0.05 ,v=n-2

b、若两变量为非正态分布,则用等级相关分析。将两变量各自按由小到大的顺序排秩,编上秩次,求各对数据的秩次之差,记为di。按下式计算Spearman等级相关系数:

然后对其进行假设检验: H0:ρ=0 H1:ρ≠0 α=0.05

当n≤50时,查Spearman等级相关系数界值表;当n>50时,按下式计算检验统计量u:

,根据标准正态分布的概率函数确定P值,作出推断结论。 ②两变量为分类变量时:

a、两变量均为无序多分类变量时:用行×列表的?2检验: H0:两变量无关联 H1:两变量有关联 α=0.05

若拒绝H0,接受H1,可计算Pearson关联系数:

b、两变量均为有序多分类变量时,可用Spearman等级相关分析,方法同前。 随机区组设计多个样本比较的Friedman M检验,备择假设H1如何写?为什么? 答:H1写为多个总体分布位置不全相同。H1不能写为多个总体分布不全相同。因为Friedman M检验对于多个总体分布的形状差别不敏感,只对其位置差别敏感。

量间相互关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y如何依赖于X而变化。③意义上:r说明具有直线关系的两变量间相互关系的方向和密切程度;b表示X每变化一个单位所导致Y的平均变化量。④计算上: , 。⑤取值范围:-1≤r≤1,- ∞<b<∞。⑥单位:r没有单位,b有单位。

Pearson积距相关与Spearman等级相关有何异同?

答:Pearson积距相关与Spearman等级相关的应用条件不同,前者要求数据服从二元正态分布,属于参数方法;而后者可不满足正态分布条件,为非参数法;相同点都是用来解决两变量间的线性相关程度的大小,相关系数的含义、单位、取值范围一致,且计算公式相同,不过一个直接用原始的定量数据,另一个则要用等级数据。

比较分类变量的两个样本或多个样本的频数分布所采用的χ2检验与关联性分析的χ2检验有何异同?

答:分类变量的两样本与多个样本频数分布比较的χ2检验是对两样本或多个样

本比较,而关联性分析的χ2检验却是探讨一份样本的两种属性所对应的两个变量间的关系,研究的问题不同、设计不同、检验假设不同、意义不同、结论不同;相同的仅是计算统计量的工具。

分类变量配对的2×2资料在什么情况下用McNemerχ2检验,什么情况下用Pearson χ2检验?

答:分类变量配对设计的2×2频数资料若是作两组频数比较,则用McNemerχ2检验,若是作两变量间关联性分析则用Pearson χ2检验?

第十二章 简单回归分析

直线回归的概念

目的:研究应变量Y对自变量X的数量依存关系。

特点:统计关系。X值和Y的均数的关系,不同于一般数学上的X 和Y的函数关系

样本线回归方程中a和b的含义

a 为回归直线在 Y 轴上的截距

Y??a?bX (12?1)(1)a > 0,表示直线与纵轴的交点在原点的上方; (2)a < 0,则交点在原点的下方; (3)a = 0,则回归直线通过原点。

b为回归系数,即直线的斜率

(1)b>0,直线从左下方走向右上方,Y 随 X 增大而增大; (2)b<0,直线从左上方走向右下方,Y 随 X 增大而减小; (3)b=0,表示直线与 X 轴平行,X 与Y 无直线关系。

b 的统计学意义是:X 每增加(减)一个单位,Y 平均改变b个单位 线性回归模型的前提条件是:

线性(linear)独立(independent)正态(normal)等方差(equal variance) 直线回归应用的注意事项

1.根据分析目的选择变量及统计方法

直线回归用于定量刻画应变量Y对自变量X在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X,另一个随机变量作Y,例如用身高估计体表面积。

两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析。

2.进行回归分析前应绘制散点图

(1) 散点图可考察两变量是否有直线趋势; (2) 可发现异常点(outlier)。

散点图对异常点的识别与处理需要从专业知识和现有数据两方面来考虑,结果可能是现有回归模型的假设错误需要改变模型形式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要认真核对原始数据并检查其产生过程认定是过失误差,或者通过重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或采用其它估计方法。 3.资料的要求

直线回归要求至少对于每个 X 相应的 Y 要服从正态分布,X可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量;

* 对于双变量正态分布资料,根据研究目的可选择由 X 估计 Y 或者由 Y 估计

X ,一般情况下两个回归方程不相同)。 4. 结果解释及正确应用

反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P值。

P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变

量的取值范围。

(1-α)置信带的意义是:

在满足线性回归的假设条件下,可以认为真实的回归直线落在两条弧形曲线所形成的区带内, 置信度为(1-α) 简述直线回归与直线相关的区别。

(1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。

简述直线回归与直线相关的区别与联系。

答:两者的联系:①对于既可以作相关又可作回归分析的同一组数据,计算出的b与r正负号一致。②相关系数与回归系数的假设检验等价,即对于同一样

本,tb=tr。③同一组数据的相关系数和回归系数可以相互换算:r=bY?X×SX/SY。④用回归解释相关:由于决定系数r2=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明相关的效果越好。

两者的区别:①资料要求上:相关要求X、Y服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;回归要求Y在给定某个X值时服从正态分布,X是可以精确测量和严格控制的变量,称为Ⅰ型回归。②应用上:说明两变 试总结从样本数据判断总体回归关系是否成立的统计方法有哪些? 答:用tb、tr作t检验;用F对b和R2作方差分析;直接查τ界值表。 现有根据10对数据算出的直线回归方程: =2.1+0.8X,只有X和Y的均数、标准差,而原始数据丢失时如何判定回归方程是否成立?

答:例如可以利用r=b×SX/SY,求得相关系数,然后查相关系数界值表对回归方程作假设检验。

请计算直线回归中残差和自变量之间的积差相关系数。 答:可以证明,残差 与自变量X之间的相关系数为0。 证:只需证明二者的离均差积和 因为 的均数为 ,所以 ,故有: 简述直线相关与秩相关的区别与联系。

答:二者的联系:①两者所解决的应用问题相同,都可用来表示两个数值变量之间关系的方向和密切程度。②两个相关系数都没有单位,取值范围都在(-1,1)之间。③计算上,用秩次作积差相关,得到的就是秩相关系数。

二者的区别:①资料要求不同:积差相关要求X、Y服从双变量正态分布,秩相关可以是任意分布。②由于资料要求不同,二者属于参数统计与非参数统计方法,所以符合分布条件时,积差相关的效率高于秩相关。③二者假设检验方法不同。

Ⅰ型回归和Ⅱ型回归的区别与联系?

答:前者要求Y为随机变量,服从正态分布,X可人为取值;后者X,Y均为随机变量,均服从正态分布。 线性回归分析中应该注意哪些问题?

答:(1)作简单线性回归分析要有实际意义,不要把豪无关联的两种现象强加在一起作回归分析。在理论上,任何成对的两组数据都可以获得一个唯一的线性回归方程,并有可能作回归系数的假设检验有统计学意义。(2)在作线性回归分析前,一定要绘制散点图,观察全部数据点的分布趋势,只有存在线性趋势时,才可以进行线性回归分析。(3)线性回归方程的适用范围一般以自变量的取值范围为限,若无充分理由证明超过自变量取值范围仍是直线,应该避免外延。(4)作线性回归分析有统计学意义不等于有实际意义,考察线性回归

方程的实际效果用决定系数R2的大小,而不是线性回归分析的假设检验的概率P值。

简述线性相关与线性回归的区别与联系?

答:联系:①r(相关系数)与b(回归系数)可相互换算;②r与b的假设检验等价;③r与b正负号一致;④回归可解释相关,相关系数的平方r(对称决定系数)是回归平方与总的离均差平方和之比,故回归平方和是引入相关变

意义上:r说明两变量关系程度与方向b表示x增或改变,使Y改变b个单位;

㈣计算上:b=Lαy/Lαx, r=Lxy/

LxxLyy;⑤取值范围:-∞<b<+∞,-1

≤r≤1;⑥单位:b有单位,r无单位。

随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?

答:随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上的

量后总平方和减少的部分tr=tb=

F。区别:①资料要求上相关X,Y正态分

不同之处,具体如下表所示:

布,回归Y正态分布;②应用上:相关说明相关关系,回归说明依存关系。③区别点 设计 完全随机设计 采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理 变异分解 三种变异:SS总=SS组间+SS组内 随机区组设计 随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。 四种变异:SS总=SS处理+SS区组+SS误差 随机区组设计与完全随机设计相比,因为利用区组控制了可能的混杂因素,并在进行方差分析时将区组的变异从原组内变异中分解出来,所以,当区组间有统计学意义时,由于减少了误差,实验效率得以提高。

均数的可信区间与参考值范围有何不同?(书P98,表6-5)

答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示: 区别点 含义 均数的可信区间 按预先给定的概率,确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当α=0.05时为95%)的可能性包含了总体均数 计算 公式 ①σ未知: ②σ已知: ③σ未知但n>50 用途 估计总体均数 * 也可用 (对应于单尾概率时) 率

与构成比的区别 概念 强调点 资料获得 特点 请你谈谈标准差和标准误的异同点。 区别点 意义 计算公式 标准差 个体差异大小 总体标准差: 样本标准差: 与n的关系 用途 n↑ ,则S→σ 与均数结合可制定参考值范围 n↑,则 →0 与均数结合可计算总体均数的可信区间 标准误 抽样误差大小 样本均数的标准差: 或 率 发生的频率或强度 随机发生事件 较难 不一定 构成比 各组成部分所占的比重 各部分的构成 容易 合计为100% 判断观察对象的某项指标正常与否 ** 也可用 (对应于单尾概率时) ①正态分布: ②偏态分布: 参考值范围 “正常人”的解剖、生理、生化某项指标的波动范围。 试述正态分布、标准正态分布及对数正态分布的联系和区别。 答:正态分布、标准正态分布及对数正态分布的联系和区别: 原始值X 分布类型 集中趋势指标 均数与中位数的关系

正态分布 无需转换 对称 μ μ=M 标准正态分布 作u=(X-μ)/σ转换 对称 μ=0 μ=M 对数正态分布 作Y=log X转换 正偏态 G μ>M