(新人教A版)2020版高考数学大一轮复习第九章统计第3节变量间的相关关系与统计案例讲义理 联系客服

发布时间 : 星期六 文章(新人教A版)2020版高考数学大一轮复习第九章统计第3节变量间的相关关系与统计案例讲义理更新完毕开始阅读ad3dcf4ff9c75fbfc77da26925c52cc58bd69092

C.③④ D.②③

(2)甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:

r m 甲 0.82 106 乙 0.78 115 丙 0.69 124 丁 0.85 103 则哪位同学的试验结果体现A,B两变量有更强的线性相关性( ) A.甲

B.乙

C.丙

D.丁

解析 (1)由散点图知③中的点都分布在一条直线附近.④中的点都分布在一条曲线附近,所以③④中的两个变量具有相关关系.

(2)在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性. 答案 (1)C (2)D

规律方法 1.散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.

2.利用相关系数判定,当|r|越趋近于1相关性越强.当残差平方和越小,相关指数R2越大,相关性越强.若r>0,则正相关;r<0时,则负相关.

^

^

3.线性回归直线方程中:b>0时,正相关;b<0时,负相关.

【训练1】 (1)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( ) A.x与y正相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z负相关 D.x与y负相关,x与z正相关

(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.

①x,y是负相关关系;

5

②在该相关关系中,若用y=c1e

2

则R21>R2;

c2x

拟合时的相关指数为

^^^

2

R1,用y=bx+a拟合时的相关指数为

R22,

③x,y之间不能建立线性回归方程.

解析 (1)由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关.

(2)在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;由散点图知用y=c1e

c2x

2

拟合比用y=bx+a拟合效果要好,则R21>R2,故②正确;x,y之间可以建立线性回

^

^

^

归方程,但拟合效果不好,故③错误. 答案 (1)C (2)①② 考点二 线性回归方程及应用

【例2】 (2019·日照调研)某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:

年份x 储蓄存款y(千亿元) 2013 5 表1

为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5得到下表2:

时间代号t Z 1 0 2 1 表2

(1)求z关于t的线性回归方程;

(2)通过(1)中的方程,求出y关于x的回归方程;

(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?

^

^

^

2014 6 2015 7 2016 8 2017 10 3 2 4 3 5 5 (附:对于线性回归方程y=bx+a,

n^

其中b=

i=1

∑xiyi-nx·y

n2

∑x2i-nxi=1

^

^-

,a=y-bx)

5i=1

5i=1

解 (1)t=3,z=2.2,∑tizi=45,∑t2i=55,

^

--

b=

^

45-5×3×2.2

=1.2,

55-5×9

^-

a=z-bt=2.2-3×1.2=-1.4,

6

^

所以z=1.2t-1.4.

^

(2)将t=x-2 012,z=y-5,代入z=1.2t-1.4,

^

得y-5=1.2(x-2 012)-1.4,即y=1.2x-2 410.8.

^

(3)因为y=1.2×2 022-2 410.8=15.6,

所以预测到2022年年底,该地储蓄存款额可达15.6千亿元.

^

^

规律方法 1.(1)正确理解计算b,a的公式和准确的计算是求线性回归方程的关键.

^

^

^

(2)回归直线方程y=bx+a必过样本点中心(x,y).

2.(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.

(2)对于非线性回归分析问题,应先进行变量代换, 求出代换后的回归直线方程,再求非线性回归方程.

【训练2】 (2018·全国Ⅱ卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.

为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据

^

2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y=-30.4+13.5t;根

^

据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

^

解 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).

利用模型②,该地区2018年的环境基础设施投资额的预测值为

^

y=99+17.5×9=256.5(亿元).

7

(2)利用模型②得到的预测值更可靠. 理由如下:

(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利

^

用2010年至2016年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.

(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.

以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分. 考点三 独立性检验

【例3】 (2019·湖南长沙雅礼中学、河南省实验中学联考)环境问题是当今世界共同关注的问题,我国环保总局根据空气污染指数PM2.5浓度,制定了空气质量标准:

空气污染(0,50] 指数 空气质量优 等级 某市政府为了打造美丽城市,节能减排,从2010年开始考察了连续六年11月份的空气污染指数,绘制了频率分布直方图,经过分析研究,决定从2016年11月1日起在空气质量重度污染和严重污染的日子对机动车辆限号出行,即车牌尾号为单号的车辆单号出行,车牌尾号为双号的车辆双号出行(尾号是字母的,前13个视为单号,后13个视为双号).王先生有一辆车,若11月份被限行的概率为0.05.

良 轻度污染 中度污染 重度污染 严重污染 (50,100] (100,150] (150,200] (200,300] (300,+∞)

(1)求频率分布直方图中m的值;

8