2018版数学人教A版选修2-3学案:第三章 统计案例 含答案 精品 联系客服

发布时间 : 星期一 文章2018版数学人教A版选修2-3学案:第三章 统计案例 含答案 精品更新完毕开始阅读23d39567bb0d4a7302768e9951e79b896802689c

1 回归分析与独立性检验的理解与加深

一、回归分析

^

^

^

1.回归方程y=bx+a,其中:

n^

i=1

n

∑ ?xi-x??yi-y?∑xiyi-nx y^^

i=1

b==n,a=y-bx. n222

∑ ?xi-x?∑xi-nx==

i1

i1

n^

i=1(注:b=

∑xiyi-nx y

2

∑xi-ni=1nx

2

主要方便计算,其中(xi,yi)为样本数据,(x,y)为样本点的中心)

公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋势. 公式联系:是进行残差分析的基础. 2.样本相关系数的具体计算公式:

n

r=

i=1ni=1

∑ ?xi-x??yi-y?

2ni1

2

∑ ?xi-x?∑ ?yi-y?=

ni=1

22

?∑x2y2i-nx??∑i-ny?==

nni1

i1

∑xiyi-nx y

公式作用:反映两个变量之间线性相关关系的强弱.当r的绝对值接近1时,表明两个变量的线性相关性越强;当r的绝对值接近0时,表明两个变量之间几乎不存在线性相关关系.规定当r>0.75时,认为两个变量有很强的线性相关关系.

公式联系:(1)由于分子与回归方程中的斜率b的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当r>0时,两个变量正相关;当r<0时,两个变量负相关. (2)常配合散点图判断两个随机变量是否线性相关.

散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失效;它形象直观地反映了数据点的分布情况.

相关系数r是从数上反映了两个随机变量是否具有线性相关关系,以及线性相关关系的强弱,它较精确地反映了数据点的分布情况,准确可靠.

3.我们可以用相关指数R2来刻画回归的效果,其计算公式是:R2=1-

n

n

^

i1

ni=1

∑ ?yi-yi?2=

2

n^

∑ ?yi-y?

∑ ?yi-y?-∑ ?yi-yi?2==i1i1

n2

∑ ?yi-y?=

i1

2

用R来刻画回归的效果.对于已经获取的样本数据,R表达式中的∑ (y-y)为确定的i=

i1

22数.因此R越大,意味着残差平方和∑ (y-y)越小,即模型的拟合效果越好;R越小,残ii=

i1

2

n

^

2

2

n

2

差平方和越大,即模型的拟合效果越差.在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.R2是常用的选择模型的指标之一,在实际应用中应该尽量选择R2大的回归模型. 二、独立性检验

(一)基础概念的梳理与理解

1.分类变量:对于宗教信仰来说,其取值为有宗教信仰与无信宗教信仰两种.像这样的变量的不同“值”表示个体所属的不同类别的变量称为分类变量.例如性别变量其取值为男和女两种,吸烟变量其取值为吸烟与不吸烟两种.

2.两个分类变量:是否吸烟与是否患肺癌,性别男和女与是否喜欢数学课程等等,这些关系是我们所关心的.

3.2×2列联表:列出的两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2}的样本频数表称为2×2列联表(如下表).

x1 x2 总计

(二)两个分类变量是否有关的粗略估计 等高条形图

y1 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d

ac

由深、浅颜色的高度可见两种情况下的百分比;另一方面,数据要比小得多,因此,

a+bc+d说明两分类变量X和Y有关系成立的可能性较大.

重点:等高条形图能直观地看出在两个分类变量频数相等的情况下,各部分所占的比例情况. (三)独立性检验的基本思想

上面通过分析数据与图形,得出的估计是粗略的,因为我们说的“大得多”、“小得多”,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的.但是上面的分析给了我们一种重要的思想方法.

下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法. 1.基本思想与图形的联系

ac

假设两类分类变量是无关的,可知如下的比应差不多,即:≈?|ad-bc|=0.

a+bc+dn?ad-bc?2

构造随机变量K=(其中n=a+b+c+d)(此公式如何记忆,其特点是

?a+b??c+d??a+c??b+d?

2

什么?结合2×2列联表理解).

显然所构造的随机变量与|ad-bc|的大小具有一致性. 2.独立性检验的思想方法

如果K2的观测值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就是两分类变量是有关系的(称小概率事件发生);如果K2的观测值较小,此时接受假设,说明两分类变量是无关系的.其思想方法类似于数学上的反证法. 3.得到K2的观测值k常与以下几个临界值加以比较:

如果k>2.706,就有90%的把握认为两分类变量X和Y有关系;如果k>3.841,就有95%的把握认为两分类变量X和Y有关系;如果k>6.635,就有99%的把握认为两分类变量X和Y有关系;如果k>10.828,就有99.9%的把握认为两分类变量X和Y有关;如果k≤2.706,就认为没有充分的证据说明变量X和Y有关系.

像这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.

2 回归分析题型归纳

相关关系是自然中普遍存在的关系,高考中对具有线性相关关系的考查已成为趋势,有的考查概念性质,更多是考查线性回归方程的实际应用,下面精选几例题型供赏析. 一、考查相关系数

例1 变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的

线性相关系数,r2表示变量V与U之间的线性相关系数,则( ) A.r2

解析 方法一 由散点图可以得出结论: 变量X与Y正相关;变量U与V负相关. 故r1>0,r2<0,因此选C. 方法二 由线性相关系数公式知

B.0

i=1

? ?xi-x??yi-y?

. 2

n

r=

i=1

? ?xi-x?

n

i=1

? ?yi-y?2

n

∵X=U=11.72,Y=V=3,

Xi=Ui(i=1,2,…,5),Yi=V6-i(i=1,2,…,5), ∴

i=1

? ?Xi-X?

5

5

2

i=1

? ?Yi-Y?2

5

5

i=1

? ?Ui-U?

2

i=1

? ?Vi-V?2.

令? (Xi-X)(Yi-Y)=A

i=1

5

=(10-X)(1-Y)+(11.3-X)(2-Y)+(11.8-X)·(3-Y)+(12.5-X)(4-Y)+(13-X)(5-Y),

i=1

? (Ui-U)(Vi-V)=B

5

=(10-U)(5-V)+(11.3-U)(4-V)+(11.8-U)·(3-V)+(12.5-U)(2-V)+(13-U)(1-V),

∴A>0,B<0,∴r1>0,r2<0. 答案 C

二、考查线性回归直线的性质

例2 已知x与y之间的几组数据如下表:

x y

1 0 2 2 3 1 4 3 5 3 6 4