统计学练习题 联系客服

发布时间 : 星期日 文章统计学练习题更新完毕开始阅读dcebcac3c850ad02de8041d1

《统计学》练习题

一、选择题

1、根据样本计算的用于描述总体特征的度量工具(如均值)被称为( D )。 A、参数 B、总体 C、样本 D、统计量 2、下列属于分类变量的是( D )。

A、年龄 B、工资 C、产量 D、性别

3、为了估计某城市中拥有私家车的家庭比例,随机抽取500个家庭,得到拥有私家车的家庭比例为30%,这里的30%是( B )。

A、参数值 B、统计量的值 C、样本量 D、统计量 4、抽样调查不可避免的误差是( B )。

A、系统性误差 B、偶然性误差 C、观察性误差 D、登记性误差 5、下列关于抽样误差的说法,正确的是( B )。

A、抽样误差是针对某个具体样本的检测结果与总体结果的差异而言 B、样本容量N越大,抽样误差越小 C、总体的变异度越大,抽样误差越小 D、抽样误差可控制,也可避免

6、不适用于顺序尺度的统计量是( D )。

A、频率 B、众数 C、中位数 D、均值 7、描述定性数据的两种最常用的图示法是( A )。 A、条形图和饼图 B、散点图和饼图 C、散点图和条形图 D、条形图和茎叶图 8、下列图形中,适合描述顺序数据的是( D )。

A、直方图 B、茎叶图 C、箱线图 D、环形图

9、对连续变量或变量值较多的离散变量分组是,通常采用的分组方法是( B )。 A、单项式分组 B、组距式分组 C、等距分组 D、异距分组 10、为了描述身高与体重的依存关系,适合采用的图形是( B )。

A、直方图 B、散点图 C、箱线图 D、雷达图 11、在对几组数据的离散程度进行比较时使用的统计量通常是( D )。

A、异众比率 B、平均差 C、标准差 D、 离散系数

12、当观察数据偏斜程度较大时,应该选用( D )测度数据的集中趋势。

A、均值 B、标准差 C、变异系数 D、中位数

13、从一个均值=20,标准差=1.2的总体中随机抽取n=36的样本。假定该总体并不是很偏,则样本均值小于19.8的近似概率为( B )。

A、0.1268 B、0.1587 C、0.2735 D、0.6324

14、从一个均值为60,标准差为8的总体里随机抽查容量n=100的样本,则样本均值和抽样分布的标准误差分别为( B )。

A、60,8 B、60 ,0.8 C、0.6,8 D、0.6,0.08 15、对于非正态总体,在大样本条件下,估计总体均值使用的分布是( A )。 A、正态分布 B、t分布 C、?2 分布 D、F分布 16、一个估计量的有效性是( D )。

A、该估计量的数学期望等于被估计的总体参数 C、该估计量的方差比其他估计量的大 B、该估计量一个具体数值等于被估计的总体参数 D、该估计量的方差比其他估计量的小 17、为调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排序后,每隔50名学生抽取一名学生进行调查,这种调查方法是( C )。

A、简单随机抽样 B、整群抽样 C、系统抽样 D、分层抽样 18、在下列叙述中,错误的是( C )。

A、样本均值的抽样分布是从总体中抽取特定容量样本的所有样本均值的分布 B、样本统计量是对样本的一种数量描述

C、参数是对总体的一种数量描述,它的值总是已知的 D、样本均值的期望值等于总体均值

19、以样本均值为估计量对总体均值进行区间估计,且总体方差已知,则下列说法正确的是( A )。 A、95%的置信区间比90%的置信区间宽 B、样本容量较小的置信区间较小 C、相同置信水平下,样本容量大的置信区间大 D、样本均值越小,区间越大

20、抽取一个容量为100的随机样本,其均值x=81,标准差s=12,总体均值?的95%的置信区间为( B )。 A、81

??1.97 B、81?2.35 C、81?3.10 D、81?3.52

21、根据某校学生周上网时间的一个样本,用99%的置信水平构造的该校学生周上网时间的置信区间为5.25~10.25小时,则全校学生的周上网时间( D )。

A、肯定在这一区间内 B、有99%的可能性在这一区间内 C、有1%的可能性在这一区间内 D、可能在这一区间内,也可能不在这一区间内

22、某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的允许误差为25元,则应抽取的样本容量是( B )。

A、100 B、110 C、120 D、130 23、研究者想收集证据予以支持的假设通常称为( B )。

A、原假设 B、备择假设 C、合理假设 D、正常假设

24、消费者协会针对消费者对某种品牌的A玩具铅含量超标的投诉的回应是没有证据表明该玩具铅超标,则在该假设检验中消费者协会提出的备择假设内容为( A )。

A、该品牌的所有A玩具铅含量超标 B、该品牌的所有A玩具铅含量不超标 C、被抽检的A玩具铅含量不超标 D、无法确定 25、在假设检验中,P值越小,则( B )。

A、拒绝原假设的可能性越小 B、拒绝原假设的可能性越大 C、拒绝备择假设的可能性越大 D、不拒绝备择假设的可能性越小 26、在一次假设检验中。当显著性水平??0.01原假设被拒绝时,则用??0.05时( A )。

A、一定会被拒绝 B、一定不会被拒绝 C、需要重新检验 D、有可能拒绝原假设 27、设ZC为检验统计量的计算值,检验假设为

H:?≤?0,Ho:?>?0,当ZoC=1.645时,计算

出的P值为( A )。

A、0.05 B、0.01 C、0.025 D、0.1 28、在单因素方差分析中,若SST=20,SSE=10,K=4,N=20,则统计量F值为( C )。 A、2 B、2.375 C、5.33 D、6.33 29、在单因素方差分析中,F统计量分子与分母自由度分别为( C )。

A、k-1, n B、k-1, n-1 C、k-1, n--k D、n-k, k-1

30、在方差分析中,进行多重比较的前提是( A )。

A、拒绝原假设 B、不拒绝原假设 C、可以拒绝原假设,也可以不拒绝原假设 D、各样本均值相等 31、在回归模型

yi????xi??i 中,? 反映的是( B )。

A、由于x的变化引起的y的线性变化部分 B、由于x的变化引起的y平均的变化部分 C、由于y的变化引起的x的线性变化部分 D、由于y的变化引起的x的线性变化部分 32、在一元回归中,作了t检验后再作F检验( B )。

A、无意义 B、与t检验的结论相同 C、与t检验的结论不同 D、与可决系数的结论不同

33、利用估计回归方程进行区间估计时,关于置信区间与预测区间(置信度,样本量n,自变量值相同),下列说法正确的是( B )。

A、置信区间比预测区间宽 B、预测区间比置信区间宽 C、两者一样宽 D、不一定 34、对一元线性回归模型,以 A、 C、

se表示估计标准误差,r表示样本相关系数,则( D )。

sse=0时,r=1 B、=0时,r=1 D、

sse=0时,r=-1 =0时,r=1或-1

ee35、对多个总体的方差进行检验时,进行方差分析所构造的统计量F是( D )。

A、SSASSE B、 SSAMSE C、MSASSE D、MSAMSE

36、由最小二乘法拟合回归方程的数学依据是,满足因变量( D )。

A、平均值与其估计值的离差平方之和最小 B、实际值与其平均值的离差平方之和最小 C、实际值与其估计值的离差之和为0 D、实际值与其估计值的离差平方之和最小 37、在应用过程中发现,若对回归模型增加一个解释变量,多重可决系数

R一般会( B )

2 A、减少 B、增加 C、不变 D、不能确定 38、在多元回归分析中,多重共线性是指模型中( A )。

A、两个或两个以上的自变量彼此相关 B、两个或两个以上的自变量彼此无关 C、因变量与一个自变量相关 D、因变量与两个或两个以上的自变量相关 39、根据可决系数与F统计量的变化关系可知,当

R2。 ?1,有( D )

A、F=1 B、F=-1 C、F=0 D、F=?

40、在n=45,的一组样本估计的线性回归模型中,包括4个解释变量,若计算的多重相关系数为0.8232,则调整后的多重相关系数为( B )。

A、0.8011 B、0.8055 C、0.8060 D、0.8235

二、问答题

1、 怎样理解描述统计学和推断统计学在探索数量规律性方面的不同之处?

描述统计学主要包括利用获得的数据,绘制统计图,并计算一些数字特征值;

推断统计学主要包括利用获得的样本数据,进行区间统计、假设检验、回归分析、方差分析、时间序列分析等;

总而言之,描述统计学只是了解数据的现状,而推断统计学则要基于现有数据进行预测。 2、 数据的计量尺度分为哪几种?不同计量尺度各有什么特点?

定类尺度:是测量尺度中层次最低的计量尺度,按照某种属性把事物进行分类,可以用定类尺度来度量性别、品牌类型等对象;

定序尺度:具有定类尺度的一切特征,同时还能反映出类别之间的等级,即不仅能把事物分成不同的类别,而且不同类别之间还能进行排序;

定距尺度:在定序尺度的基础上,对事物类别或者次序之间间距的测度,没有绝对零点,可以进行加减运算。

定比尺度:也称比率尺度,是最高层次的度量尺度,有绝对零点,除了可以分类、比较大小及加减运算外,还可以进行乘除运算,计量测度值之间的比值。

3、 试描述数据集中趋势的测度指标并简要分析指标特征?(至少五个)

算术平均数:分为简单算术平均数和加权算术平均数,前者根据原始数据直接计算平均值,后者所依据的数据是经过一定整理的,即是根据一定规则分组的;

几何平均数:是n个变量值连乘积的n次方根,常用G表示,分为简单几何平均数和加权几何平均数; 调和平均数:根据变量值的倒是计算,也叫倒数平均数,是均值的一种重要的表现形式,用字母Hm表示,分为简单调和平均数和加权调和平均数;

中位数:度量数据集中趋势额另一重要测度,是一组数据按数值大小从小到大排序后,处于中点位置的变量,通常用Me表示,是一个位置代表值,不受极端变量值影响;

众数:是一组数据中出现次数最多的变量的值,不受极端值的影响,同时也可用于数值型数据,不能用于分类数据数值的确定。

4、 怎样理解算术均值在统计学的重要地位?

算数均值在统计学中具有重要地位,它是进行统计分析和统计推断的基础,首先,从统计思想上看,均是一组数据的重心所在,是数据误差相互抵消后的必然结果,其次,均值是有一些重要的数学性质,这些数学性质在实际中有着广泛的应用,许多统计分析都来源于这些性质,同时也体现了均值的统计思想。 5、 茎叶图与直方图相比有什么优点?它们的应用场合是什么?

直方图作为传统数据整理方法,其局限性表现为整理后就损失了原始数据的信息;

而茎叶图是探索性数据分析统计,即直接描述和分析未分组的原始数据,直观地描述了原始数据的分布特点,并能根据数据的特点,选择适当的分析工具探索数据的内在数量规律,有助于用户思考对数据进一步分析的方案,既保留了数据的原始信息,又为准确计算均值等提供了方便和可能,通过茎叶图可以看出数据的分布形状以及数据的离散状况;

直方图通常用于大批量数据,而茎叶图通常适用于小批量数据。

6、 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的人回答他们的消费支出方式是用信用卡。请回答一下问题: (1)这一研究的总体是什么?

(2)月收入是哪一类计量尺度的变量? (3)消费支出方式是哪一类计量尺度的变量? (4)这一研究涉及截面数据还是时间序列数据?

(1)所有的IT从业者;(2)定比尺度;(3)定类尺度;(4)截面数据