《统计学》实验三:数据整理 联系客服

发布时间 : 星期六 文章《统计学》实验三:数据整理更新完毕开始阅读7777db70bd64783e08122b2b

实验3 数据整理

一、实验目的

掌握SPSS18.0中的数据整理操作;

二、实验原理

软件设计原理。

三、实验内容

数据管理与转换

四、实验方法与步骤

1. 已正确安装SPSS18.0软件; 2. 进入SPSS18.0的数据编辑窗口;

数据经过预处理后,可进一步做分类或分组整理。在对数据进行整理与显示时,首先要弄清是什么类型的数据,不同类型的数据适用的处理方法不同。一般情况下,对品质数据主要是分类整理,对数值型数据主要是分组整理。本部分以及下一部分(数值型数据的整理与显示)主要介绍这两大类数据的频数分布的制作,而对于一般图形的制作,如:条形图、饼行图、直方图、圆环图等基本内容,由于篇幅所限不在这里讲述。

操作一、分类数据的整理与显示 数据:分类数据整理.sav

表3-1是一家市场调查公司为研究不同品牌饮料的市场占有率,调查员某天对50名顾客购买饮料品牌记录的原始数据。具体做法是:如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌记录一次。

表3-1 顾客购买饮料品牌的记录

(一)输出频数分布表 菜单:分析->描述统计->频率

(二)输出条形图 菜单:图形->旧对话框->条形图->简单箱图(个案组摘要) (三)输出饼图 菜单:图形->旧对话框->条形图->个案组摘要

操作二、顺序数据的整理与显示

数据:顺序数据甲.sav 顺序数据的整理.exl

提示:注意数据的加权操作

在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?

1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。

甲城市家庭对住房状况评价的频数分布 甲城市 回答类别 户数 百分比 (户) 非常不满意 不满意 一般 满意 非常满意 合计

(一)计算顺序数据甲的频数分布 菜单:分析->描述统计->频率 (二)生成甲城市的累计图 菜单:分析->质量控制->排列图->简单 (三)利用excel生成甲乙两城市的环形图

24 108 93 45 30 (%) 8 36 31 15 10 向上累积 向下累积 户数 百分比 户数 百分比 (户) 24 132 225 270 300 — (%) 8.0 44.0 75.0 90.0 100.0 — (户) 300 276 168 75 30 — (%) 100.0 92 56 25 10 — 300 100.0 操作三、数值型数据的整理与显示 数据:数值行数据整理1.sav

采用等距分组的形式制作频数分布表和分布图。

在使用spss前,首先需要明确分几组,组距以及每组的上下组限。一般情况下,可以按Sturges公式来确定组数K:

K?1?lg(n)?1?3.3lg(n)lg(2) 1

其中,n为数据的个数,对结果用四舍五入的办法取整即为组数。 组距是一个组的上限和下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值—最小值)÷组数。(组距最好是5或10的倍数)

某电脑公司2010年前四个月各天的销售量数据(单位:台)。试对数据进行分组。

(一)利用经验公式确定出组数和组距。

(二)利用 转换->重编码为不同变量 生成新变量“分组”将个数据归类到已分好的组中。 (三)利用菜单:分析->描述统计->频率 生成分组变量的频数分布表。 (四)对销售量数据做直方图 菜单:图形->旧对话框->直方图

(五)对销售量数据做茎叶图和箱线图 菜单:分析->描述统计->探索->绘制按钮

操作四、时间序列数据 数据:时间序列图.sav

菜单:图形->旧对话框->线图->简单(个案值)

操作五、多变量数据

(一)数据:多批箱线图.sav

菜单:图形->旧对话框->箱图->简单(个案组摘要)

(二)数据:雷达图.exl

2

当研究的变量只有2个时,可以在平面直角坐标中进行绘图;当有3个变量时,可以在三维坐标里绘图,但让人看起来很不方便,特别是当变量多于3个时,利用一般的点图方法就很难做到了。为此,人们研究了许多多变量的图示方法,其中有雷达图、脸谱图、星座图、连接向量图等。这里只介绍较为常见的雷达图。

雷达图的具体的做法是:先做一个圆,然后将圆P等分(要绘制P个变量的雷达图),得到P个变量,再将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示,再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图。

雷达图在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形围成的面积成正比。另外,利用雷达图可以研究样本之间的相似程度,两个样本形成的多边形图越相似其相似程度越高。

下面以2000年我国城乡居民家庭人均各项生活消费支出比重数据为例,绘制雷达图。如表1-13所示。

表1-13 2000年城乡居民家庭人均生活消费支出比重(%)

第一步;选中数据所在的区域,本例为A1:C9。单击工具栏上的“图表向导”按钮,或者从“插入”菜单中选择“图表”选项。

第二步:在弹出的对话框(图表向导—4步骤之1—图表类型)中,选择雷达图。如图1-29所示。

3