发布时间 : 星期二 文章第18章 Logistic回归思考与练习参考答案更新完毕开始阅读6e9438fb910ef12d2af9e719
第18章 Logistic回归 思考与练习参考答案
一、最佳选择题
1. Logistic回归与多重线性回归比较,( A )。 A.logistic回归的因变量为二分类变量 B.多重线性回归的因变量为二分类变量
C.logistic回归和多重线性回归的因变量都可为二分类变量 D.logistic回归的自变量必须是二分类变量 E.多重线性回归的自变量必须是二分类变量 2. Logistic回归适用于因变量为( E )。
A.二分类变量 B.多分类有序变量 C.多分类无序变量 D.连续型定量变量 E.A、B、C均可 3. Logistic回归系数与优势比OR的关系为( E )。
A.β?0等价于OR>1 B.β?0等价于OR<1 C.β=0等价于OR=1 D.β<0等价于OR<1 E.A、C、D均正确 4. Logistic回归可用于( E )。
A.影响因素分析 B.校正混杂因素 C.预测 D.仅有A和C E.A、B、C均可
5. Logistic回归中自变量如为多分类变量,宜将其按哑变量处理,与其他变量进行变量筛选时可用( D )。
A.软件自动筛选的前进法 B.软件自动筛选的后退法
C.软件自动筛选的逐步法 D.应将几个哑变量作为一个因素,整体进出回归方程 E.A、B、C均可
二、思考题
1. 为研究低龄青少年吸烟的外在因素,研究者采用整群抽样,在某中心城区和远城区的初中学校,各选择初一年级一个班的全部学生进行调查,并用logistic回归方程筛选影响因素。试问上述问题采用logistic回归是否妥当?
答:上述问题采用logistic回归不妥当,因为logistic回归中参数的极大似然估计要求样本结局事件相互独立,而研究的问题中低龄青少年吸烟行为不独立。 2. 分类变量赋值不同对logistic回归有何影响? 分析结果一致吗?
答:(1)若因变量交换赋值,两个logistic回归方程的参数估计绝对值相等,符号相反;优势比互为倒数,含义有所区别,实质意义一样;模型拟合检验与回归系数的假设检验结果相同。
(2)若改变自变量参照类或哑变量设置方法,logistic回归方程形式、参数含义虽有不同,但是模型实质与应用结果相同,可以根据研究需要选择不同赋值方法。Logistic回归结果报告中,一定要说明分类变量赋值方法及其参照,否则无法理解模型意义。
3. 例18-6研究性别对吸烟行为的影响,采用logistic回归校正了年龄对居民吸烟行为的影响,请考虑有无其他混杂因素需要校正?
答:例18-6的主要目的是研究吸烟行为与性别的联系及其强度,例题采用logistic回归只校正了年龄对居民吸烟行为的影响。事实上,除年龄外,仍有其他因素会影响吸烟行为与性别的联系强度,如家庭人均年收入、受教育程度、主动获取保健知识等。建立回归模型时,首先应根据专业知识确定可能的影响因素,再采用logistic回归,将性别作为强制引入变量,对其他可能的影响因素进行变量筛选,最后将性别与筛选出的因素作为自变量建立logistic回归方程,从而正确回答校正混杂因素后吸烟行为与性别的联系及其强度。
4. 配对病例-对照研究资料若采用非条件logistic回归进行分析,对结果有何影响?
答:采用配对(匹配)方法的目的是对可能的混杂因素加以控制,有助于提高研究效率和可靠性。配对设计的特点是对子内部控制的混杂变量一致,有较好的可比性。配对(匹配)资料若采用非条件logistic回归进行分析,则忽视了这种可比性,降低了分析方法的检验效能。
三、计算题
探讨肾细胞癌转移有关的因素研究中,收集了26例行根治性肾切除术患者的肾癌标本资料(教材表18-19),有关变量说明如下,试进行logistic回归分析。
X1:确诊时患者的年龄(岁)。 X2:肾细胞癌血管内皮生长因子,其阳性表达由低到高共3个等级,分别赋值1、2、3。
X3:肾细胞癌组织内微血管数。
X4:肾细胞癌细胞核组织学分级,由低到高共4级,分别赋值1、2、3、4。
X5:肾细胞癌分期,由低到高共4期,分别赋值1、2、3、4。
Y:肾细胞癌转移情况,有转移=1,无转移=0。
教材表18-19 26例行根治性肾切除术患者的肾癌标本资料
i X1 X2 X3 X4 X5 Y i X1 X2 X3 X4 X5 Y 1 2 3 4 5 6 7 8 9 10 11 12 13 59 36 61 58 55 61 38 42 50 58 68 25 52 2 1 2 3 3 1 1 1 1 3 3 2 1 43.4 57.2 190.0 128.0 80.0 94.4 76.0 240.0 74.0 68.6 132.8 94.6 56.0 2 1 2 4 3 2 1 3 1 2 4 4 1 1 1 1 3 4 1 1 2 1 2 2 3 1 0 0 0 1 1 0 0 0 0 0 0 1 0 14 15 16 17 18 19 20 21 22 23 24 25 26 31 36 42 14 32 35 70 65 45 68 31 58 60 1 3 1 3 1 1 3 2 2 3 2 1 3 47.8 31.6 66.2 138.6 114.0 40.2 177.2 51.6 124.0 127.2 124.8 128.0 149.8 2 3 2 3 2 2 4 4 2 3 2 4 4 1 1 1 3 3 1 3 4 4 3 3 3 3 0 1 0 1 0 0 1 1 0 1 0 0 1 数据摘自 倪宗瓒. 卫生统计学 4版,人民卫生出版社,2004。
解:
Variables in the Equation
X2 X4 Constant
B
2.413 2.096 –12.329
SE
1.196 1.088 5.431
Wald 4.072 3.713 5.154
df 1 1 1
Sig. 0.044 0.054 0.023
Exp(B) 11.172 8.136
Logistic回归分析结果显示:肾细胞癌转移与肾细胞癌血管内皮生长因子和肾细胞癌细胞核组织学分级有关。肾细胞癌血管内皮生长因子X2和肾细胞癌细胞核组织学分级X4的回归系数均为正值,说明两个变量取值越大,则肾细胞癌转移的危险性越大。在肾细胞癌细胞核组织学分级不变条件下,肾细胞癌血管内皮生长因子每增加一级,肾细胞癌转移的优势增至11.172倍,增加10.172倍;在肾细胞癌血管内皮生长因子不变条件下,肾细胞癌细胞核组织学分级每增加一级,肾细胞癌转移的优势增至8.136倍,增加7.136倍。
(毛宗福 余红梅)