第十章 统计与统计案例 联系客服

发布时间 : 星期三 文章第十章 统计与统计案例更新完毕开始阅读c613ec650a4c2e3f5727a5e9856a561252d3210e

第 33 页 共 42 页

i=1

? ?ti-t??yi-y?

^^^

,回归方程y=a+bt中斜率和截距

2ni=1

n

参考公式:相关系数r=

ni=1

? ?ti-t?? ?yi-y?2

^

的最小二乘估计公式分别为b=

i=1

? ?ti-t??yi-y?

? ?ti-t?2

n

n

^^

,a=y-b t.

i=1

解:(1)由折线图中的数据和附注中的参考数据得 t=4,? (ti-t)2=28,

i=17

i=1

? ?yi-y?2=0.55,

7

7

i=1

? (ti-t)(yi-y)=?tiyi-t?yi=40.17-4×9.32=2.89,

i=1

i=1

77

∴r≈

2.89

≈0.99.

0.55×2×2.646

因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.

(2)由y=

7

9.32

≈1.331及(1)得 7

^b=

i=1

? ?ti-t??yi-y?

=i=1

? ?ti-t?2

7

2.89

≈0.103. 28

^^

a=y-b t≈1.331-0.103×4≈0.92. ^

所以y关于t的回归方程为y=0.92+0.10t.

^

将2016年对应的t=9代入回归方程得y=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.

2.(2015·新课标全国卷Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,?,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

第 34 页 共 42 页

88x y w i=1? (xi-x) 2i=1? (wi-w) 2i=1? (xi-x)(yi-y) 8i=1? (wi-w)(yi-y) 108.8 846.6 563 6.8 289.8 1.6 1 469 18

表中wi=xi,w=?wi.

8i=1

(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程.

(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题: ①年宣传费x=49时,年销售量及年利润的预报值是多少? ②年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据(u1,v1),(u2,v2),?,(un,vn),其回归直线v=α+βu的斜率和截

^

i=1

? ?ui-u??vi-v?

^

^

n

距的最小二乘估计分别为β=

i=1

? ?ui-u?2

n

,α=v-β u.

解:(1)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.

(2)令w=x,先建立y关于w的线性回归方程.

^

i=1

? ?wi-w??yi-y?

? ?wi-w?2

8

8

由于d=

i=1

108.8==68, 1.6

第 35 页 共 42 页

^

^

c=y-dw=563-68×6.8=100.6,

^

所以y关于w的线性回归方程y=100.6+68w, ^

因此y关于x的回归方程为y=100.6+68x. (3)①由(2)知,当x=49时,

^

年销售量y的预报值y=100.6+6849=576.6,

^

年利润z的预报值z=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z的预报值

^

z=0.2(100.6+68x)-x=-x+13.6x+20.12.

^

13.6

所以当x==6.8,即x=46.24时,z取得最大值.

2

故年宣传费为46.24千元时,年利润的预报值最大.

3.(2014·新课标全国卷Ⅱ)某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:

年份 年份代号t 人均纯收入y 2007 1 2.9 2008 2 3.3 2009 3 3.6 2010 4 4.4 2011 5 4.8 2012 6 5.2 2013 7 5.9 (1)求y关于t的线性回归方程; (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.

附:回归直线的斜率和截距的最小二乘估计公式分别为:

^b=

i=1

? ?ti-t??yi-y?

? ?ti-t?2

n

n

^^,a=y-bt

i=1

11

解:(1)由所给数据计算得t=(1+2+3+4+5+6+7)=4,y=(2.9+3.3+3.6+4.4

77+4.8+5.2+5.9)=4.3,? (ti-t)2=9+4+1+0+1+4+9=28,

i=17

i=1

? (ti-t)(yi-y)=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+

7

第 36 页 共 42 页

^

2×0.9+3×1.6=14,b=

i=1

? ?ti-t??yi-y?

? ?ti-t?2

7

7

14

==0.5, 28

i=1

^^

a=y-bt=4.3-0.5×4=2.3, ^

所求回归方程为y=0.5t+2.3.

^

(2)由(1)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.

^

将2015年的年份代号t=9代入(1)中的回归方程,得y=0.5×9+2.3=6.8, 故预测该地区2015年农村居民家庭人均纯收入为6.8千元.

[课时达标检测] 重点保分课时——一练小题夯双基,二练题点过高考 [练基础小题——强化运算能力]

1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组^

样本数据(xi,yi)(i=1,2,?,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是( )

A.y与x具有正的线性相关关系 --

B.回归直线过样本点的中心(x,y)

C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg

解析:选D 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,--

故A正确.又线性回归方程必过样本点的中心(x,y),故B正确.由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.

2.某医疗机构通过抽样调查(样本容量n=1 000),利用2×2列联表和 K2统计量研究患肺病是否与吸烟有关.计算得K2=4.453,经查对临界值表知P(K2≥3.841)≈0.05,现给出四个结论,其中正确的是( )

A.在100个吸烟的人中约有95个人患肺病 B.若某人吸烟,那么他有95%的可能性患肺病 C.有95%的把握认为“患肺病与吸烟有关” D.只有5%的把握认为“患肺病与吸烟有关”

解析:选C 由已知数据可得有1-0.05=95%的把握认为“患肺病与吸烟有关”.