2020版高考数学大一轮复习 第十章 统计与统计案例 第2节 用样本估计总体学案 理 新人教B版 联系客服

发布时间 : 星期四 文章2020版高考数学大一轮复习 第十章 统计与统计案例 第2节 用样本估计总体学案 理 新人教B版更新完毕开始阅读c962f0eca4e9856a561252d380eb6294dc882278

2019年

解析 (1)∵甲组学生成绩的平均数是88,

∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3, ∵乙组学生成绩的中位数是89,∴n=9, ∴m+n=12.

2

(2)该样本中AQI大于100的频数是4,频率为,

52

由此估计该地全年AQI大于100的频率为,

52

估计此地该年AQI大于100的天数约为365×=146.

5答案 (1)C (2)146

考点二 频率分布直方图(易错警示)

【例2】 (2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:

(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;

(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;

(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.

解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4.

所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9,

2019年

分数在区间[40,50)内的人数为100-100×0.9-5=5. 5

所以总体中分数在区间[40,50)内的人数估计为400×=20.

100(3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,

1

所以样本中分数不小于70的男生人数为60×=30.

2

所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2. 规律方法 1.频率、频数、样本容量的计算方法 频率(1)×组距=频率. 组距

频数频数(2)=频率,=样本容量,样本容量×频率=频数. 样本容量频率

2.例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键,并利用频率分布直方图可以估计总体分布.

频率易错警示 1.频率分布直方图的纵坐标是,而不是频率,切莫与条形图混淆.

组距2.制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.

【训练2】 某校2018届高三文(1)班在一次数学测验中,全班N名学生的数学成绩的频率分布直方图如下,已知分数在110~120的学生有14人.

(1)求总人数N和分数在120~125的人数n;

(2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少? 解 (1)分数在110~120内的学生的频率为

P1=(0.04+0.03)×5=0.35,

所以该班总人数N=

14

=40. 0.35

分数在120~125内的学生的频率为

P2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.10,

分数在120~125内的人数n=40×0.10=4.

2019年

105+110

(2)由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标,即为=107.5.

2

设中位数为a,

∵0.01×5+0.04×5+0.05×5=0.50,∴a=110. ∴众数和中位数分别是107.5,110. 考点三 样本的数字特征

【例3】 (1)(2018·济南一中质检)2017年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动.为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为( ) A.9

B.4

C.3

D.2

(2)(2016·四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.

①求直方图中a的值;

②设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; ③估计居民月均用水量的中位数.

1

(1)解析 由茎叶图得该组数据的平均数x=(87+89+90+91+93)=90.

5122222

∴方差为[(87-90)+(89-90)+(90-90)+(91-90)+(93-90)]=4.

5答案 B

(2)解 ①由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.

同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,

2019年

0.06,0.04,0.02.

由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a, 解得a=0.30.

②由①知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000. ③设中位数为x吨.

因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5. 又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5. 所以2≤x<2.5.

由0.50×(x-2)=0.5-0.48,解得x=2.04. 故可估计居民月均用水量的中位数为2.04吨.

规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定. 2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.

【训练3】 (2018·北京东城质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:

假设每名同学最近一周平均每天的锻炼时间是互相独立的. ①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大; ②从平均值分析,男生每天锻炼的时间比女生多;

③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;

④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.

其中符合茎叶图所给数据的结论是( ) A.①②③

B.②③④

C.①②④

D.①③④

解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.

5142男生平均每天锻炼时间超过65分钟的概率P1==,女生平均每天锻炼时间超过65分钟的概率P2==,

102105