生物医学研究的统计学第2、4、10章答案 下载本文

8~ 29 12~ 18 16~ 15 20~ 10 24~ 6 28~ 3 32~ 2 36~ 1 合计 120

试据此资料估计正常成人平均尿铅含量的置信区间及正常成人尿铅含量的参考值范围。

由表中数据得到该例的n?120,S?8.0031,S?0.7306,某作者将这些数据代入公式(4-20),即采用?Z?S计算得到正常成人平均尿铅含量100(1??)%置信区间为(??,14.068 4);采用公式?Z?S计算得到正常成人尿铅含量100(1??)%参考值范围为(??,26.030 6)。请问这样做是否合适?为什么?应当怎么做?

案例辨析 该定量资料呈偏峰分布,不适合用正态分布法计算100(1??)%参考值范围。

正确做法 可以用百分位数法求正常成人尿铅含量100(1??)%参考值范围的单侧上限。例如,当?=0.05时,可直接求P95分位数,(0,P95)就是所求的正常成人尿铅含量的95%正常值范围。

欲求正常成人尿铅含量总体均数的置信区间,当样本含量n较大(比如说,n大于30或50)时,样本均数就较好地接近正态分布(根据数理统计上的中心极限定理)。本例, 因为n?120较大,不必对原始数据作对数变换就可以用?Z?S估计总体均数的置信区间。

案例4-2 在BiPAP呼吸机治疗慢性阻塞性肺病的疗效研究中,某论文作者为了描述试验前的某些因素是否均衡,在教材表4-5中列出了试验前患者血气分析结果。由于作者觉得自己数据的标准差较大,几乎和均数一样大,将标准差放在文中显得不雅观,于是他采用“均数±标准误”(?S),而不是“均数±标准差”(?S)来对数据进行描述。问在研究论文中以教材表4-5方式报告结果正确吗?为什么?

教材表4-5 试验组和对照组治疗前血气分析结果(组别 试验组 对照组 例数 12 10 年龄/岁 pH

pa(CO2)/kPa ?S)

Sa(O2)/% 85.12?1.73 86.45?2.25 pa (O2)/kPa 9.25?0.55 9.16?0.62

63.00?4.33 7.36?0.05 63.00?4.33 62.50?3.95 7.38?0.06 63.00?4.33 案例辨析 描述数据的基本特征不能采用?S,因为S为反映抽样误差大小的指标,只表示样本均数的可靠性,而不能反映个体的离散程度。不仅如此,因S仅为与其对应的S的1/n,有时,即使S很大(甚至大于),用S表示离散度时,不易被察觉出来,因此,用?S表达定量资料时,往往具有欺骗性。

正确做法 当各组定量资料服从或近似服从正态分布时,反映个体的离散程度应该采用标准差,即描述数据的基本特征必须采用?S;否则,需要采用M(Q1~Q3)描述数据的基本特征。此处,M为中位数、Q1和Q3分别为第1四分位数和第3四分位数。

案例4-3 某市往年的12岁男孩平均身高为140.0 cm。现在从该市的12岁男孩中随机抽得120名作为研究对象, 得到平均身高为143.1 cm, 标准差为6.3 cm。请估计该样本对应总体均数的95%置信区间,并确定该均数是否与往年不同。

某学生的回答如下:“该例12岁男孩平均身高的点估计值为143.1 cm,按公式(4-21)计算得到该点估计值的95%置信区间为141.9~144.2 cm。

因为往年12岁男孩平均身高为140.0 cm,没有落在所计算的95%置信区间以内,所以可以认为现有男孩平均身高与往年身高有差异”。 请指出学生回答中的不恰当之处。

案例辨析 不恰当之处有三:① “点估计值的95%置信区间”的说法不对;②“以往男孩平均身高没有落在所计算的95%置信区间以内”的说法不对;③“现有男孩平均身高与往年身高有差异”的说法不对。

正确做法 ① 应该说“点估计值对应总体均数的95%置信区间”;② 应该说“95%置信区间没有覆盖(包括)以往男孩平均身高”;③ 应该说“现有男孩平均身高与往年男孩平均身高的差异有统计学意义”。

第10章 简单线性回归分析 案例辨析及参考答案

案例10-1 年龄与身高预测研究。某地调查了4~18岁男孩与女孩身高,数据见教材表10-4,试描述男孩与女孩平均身高与年龄间的关系,并预测10.5岁、16.5岁、19岁与20岁男孩与女孩的身高。 教材表10-4 某地男孩与女孩平均身高与年龄的调查数据