发布时间 : 星期一 文章(全国通用)2018高考数学一轮复习 第9章 算法初步_统计与统计案例 第4节 变量间的相关关系更新完毕开始阅读c835424c970590c69ec3d5bbfd0a79563d1ed45b
月收入(单位:百元) 赞成定价者人数 认为价格偏高者人数 [15,25) 1 4 [25,35) 2 8 [35,45) 3 12 [45,55) 5 5 [55,65) 3 2 [65,75] 4 1 (1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);
(2)由以上统计数据填下面2×2列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.
认为价格 偏高者 赞成定价者 总计 附:K=
2
月收入不低于55百元的人数 月收入低于55百元的人数 总计 a+bnad-bc2c+da+cP(K2≥k0) k0 a+d. 0.05 3.841 0.01 6.635 [解] (1)“赞成定价者”的月平均收入为 x1=
20×1+30×2+40×3+50×5+60×3+70×4
1+2+3+5+3+4
≈50.56.
“认为价格偏高者”的月平均收入为
x2=
20×4+30×8+40×12+50×5+60×2+70×1
4+8+12+5+2+1
=38.75,
∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1-x2=50.56-38.75=11.81(百元).5分
(2)根据条件可得2×2列联表如下:
认为价格 偏高者 月收入不低于55百元的人数 月收入低于55百元的人数 总计 3 29 32 赞成定价者 总计 7 10 211 40 18 50 K=
2
-10×40×18×32
≈6.27<6.635,
∴没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.12分
[思想与方法]
1.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.
2.根据K的值可以判断两个分类变量有关的可信程度. [易错与防范]
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
2.独立性检验中统计量K的观测值k的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错.
课时分层训练(五十七) 变量间的相关关系与统计案例
A组 基础达标
2
2
(建议用时:30分钟)
一、选择题
1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
^^①y与x负相关且y=2.347x-6.423;②y与x负相关且y=-3.476x+5.648;③y与x^^
正相关且y=5.437x+8.493;④y与x正相关且y=-4.326x-4.578.
其中一定不正确的结论的序号是 ( ) ...A.①② C.③④
B.②③ D.①④
D [由正负相关性的定义知①④一定不正确.]
2.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R如下,其中拟合效果最好的模型是 ( )
A.模型1的相关指数R为0.98 B.模型2的相关指数R为0.80 C.模型3的相关指数R为0.50 D.模型4的相关指数R为0.25
A [相关指数R越大,拟合效果越好,因此模型1拟合效果最好.]
3.第31届夏季奥林匹克运动会,中国获26金,18银,26铜共70枚奖牌居奖牌榜第二,并打破3次世界记录.由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见.有网友为此进行了调查,在参加调查的2 548名男性公民中有1 560名持反对意见,2 452名女性公民中有1 200人持反对意见,在运用这些数据说明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力( )
A.平均数与方差 C.独立性检验
B.回归直线方程 D.概率
2
2222
2
C [由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求.故用独立性检验最有说服力.]
4.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元) 支出y(万元) 8.2 6.2 8.6 7.5 10.0 8.0 11.3 8.5 11.9 9.8 ^^^^^^根据上表可得回归直线方程y=bx+a,其中b=0.76,a=y-bx.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 C.12.0万元
B.11.8万元 D.12.2万元
8.2+8.6+10.0+11.3+11.9
B [由题意知,x==10,
5
y=
6.2+7.5+8.0+8.5+9.8
=8,
5
^
∴a=8-0.76×10=0.4,
^
∴当x=15时,y=0.76×15+0.4=11.8(万元).]
5.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
爱好 不爱好 总计 由K=算得K=附表:
22
男 40 20 60 女 20 30 50 ,
总计 60 50 110 a+bnad-bc2c+da+c-60×50×60×50
2
b+d≈7.8.
P(K2≥k0) k0 0.050 3.841 0.010 6.635 0.001 10.828 参照附表,得到的正确结论是( ) A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C.有99%以上的把握认为“爱好该项运动与性别有关” D.有99%以上的把握认为“爱好该项运动与性别无关”
C [根据独立性检验的定义,由K≈7.8>6.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”.]
二、填空题
6.(2017·西安质检)某车间为了规定工时定额,需要确定加工零件所花费的时间,为^
此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.
零件数x(个) 加工时间y(min) 10 62 20 30 40 81 50 89 2
75 现发现表中有一个数据看不清,请你推断出该数据的值为________.