某高校在校生体测成绩的统计分析 联系客服

发布时间 : 星期五 文章某高校在校生体测成绩的统计分析更新完毕开始阅读ca8aa06568eae009581b6bd97f1922791688bef8

天津科技大学2014届本科生毕业论文

3 MATLAB主要统计函数简介

MATLAB意为矩阵工厂(Matrix&Laboratory两个词的组合,)。MATLAB是由美国The Mathworks公司发布的。MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完成相同的事情简捷得多,并且MATLAB也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用。数据分析的目的是利用数据来研究一个领域的具体问题。数据分析的过程包括确定数据分析的目标、研究设计、收集数据、分析数据、解释结果。从数据分析的整个过程来看,软件的使用主要是在数据整理与分析阶段。软件所起的主要作用是整理、计算、绘制图表等。MATLAB 在统计分析方面的知识,有很多软件都可以用作统计分析与计算,比如SAS、Spss、Splus等软件。在这些软件中,MATLAB的功能无疑是最强大的。MATLAB有简便的编程语言,还有包罗万象的工具箱,易学易用,学者不仅可以调用现成的函数进行计算,还可以自己编程自己所需要的函数。

本文主要用了描述性统计、方差分析、回顾分析、判别分析对2010中国农大的体测成绩进行分析。主要涉及的函数有:

(1)num = xlsread(filename, range)

从指定文件名夹读取,输入参数filename是由单引号括起来的字符串。输入参数range是所在的单元格范围,比如说range='A1:A8'。比如说num=xlsread('2010.xls'),即从当前程序所在文件夹里,从A1单元格开始读取,读取2010.xls文件,把数据返回给num。

(2)[p,table,stats] = anova1(X,group),anova1函数是单因素一元方差分析。原假设是输入参数X的各列所对应的总体具有相同的均值。矩阵X的列数表示因素的水平数,矩阵X的行数表示样本容量。输入的参数group可以是字符串元胞数组或是字符数组,用来指明每组的组名,在本文是学院名称。输出参数p是检验的p值,对于给定的显著性水平?,如果??p,则拒绝原假设。认为X的各列所对应的总体具有不完全相同的均值。反之,则接受原假设。输出参数table是元胞数组形式的方差分析表。方差分析表有六列,第一列为方差来源,方差来源有组间(Columns)、组内(Error)和总计(Totel)第二列为各方差来源所对应的的平方和(SS)。第三列为个方差所对应的自由度(df)。第四列为各方差来源所对应的均方(MS),MS=SS/df。第五列为F检验统计量的观测值,它是组间均方和组内均方的比值。第六列为检验p值,是根据F检验统计量的分布得出的。输出的stats是结构体变量,用于进行后续的多重比较。还会返回箱线图。

13

天津科技大学2014届本科生毕业论文

[p,table,stats] =kruskalwallis(X,group),kruskalwallis函数是非参数方差分析。输出参数和上面的anova1函数返回的一样,输入参数也一样。 (3)R=corrcoef(data),进行相关性分析,求相关系数。输入参数data是矩阵,得到的结果是一个n*n矩阵相关系数矩阵。

(4)mdl=LinearModel.fit(x,y),LinearModel.fit函数是做一元线性回归。输入参数x是自变量观测矩阵,输入y是因变量观测矩阵,x和y具有相同的行。输出线性回归模型的参数。

(5)class=classify(sample,training,group),其中输入参数sample是全部样本数据,即6290个学生的身高,体重,肺活量数据。输入参数training是已知组别的样本数据,即5999名学生的身高,体重,肺活量数据。输入参数group是样本的分组信息数据,其中第一类是超重,第二类是肥胖,第三类是较低体重,第四类是营养不良,第五类是正常体重,用前5999名学生判别291个同学的类别。

14

天津科技大学2014届本科生毕业论文

4 某高校在校生体测成绩统计分析

4.1数据来源

本文数据取自2010年体测成绩(中国农大)共有学生6290个学生,三个年级,测试成绩有身高,体重,身高体重等级,肺活量,肺活量体重指数,肺活量体重分数,耐力类项目成绩,耐力类项目分数,耐力类项目等级,柔韧、力量项目成绩,柔韧、力量项目分数、柔韧、力量项目等级,速度、灵巧类项目成绩,速度、灵巧类项目分数,速度、灵巧类项目等级,测试总分,总分等级。数据来源

http://tice.cau.edu.cn/tyb_clt/news/user/title.action?typeid=27,部分数数据件附录。 4.2描述性统计量

样本数据是中国农业大学2010年的体测数据,在初步接触样本数据中国农业大学2010年的体测数据之前,有必要先从几个特征数认识一下它们,也就是先用MATLAB软件计算出样本的几个描述性统计量。包括均值(mean)标注差(std)最大值(max)最小值(min)极差(range)中位数(median)众数(mode)变异系数(cvar)偏度(skewness)峰度(krtosis)。通过以下表格形式给出,相关程序放在附件中。

09级学生各个测试成绩数据的描述性统计量如表4-1。 08级学生各个测试成绩数据的描述性统计量如表4-2。 07级学生各个测试成绩数据的描述性统计量如表4-3。

表 4-1 09级学生各个测试成绩数据的描述性统

身高 体重 平均值标准差 最大值最小值 中位数众数 变异系偏度 (mean) (1) (max) (min) (median) (mode) 数(cvar) (skewness) 167.6902 7.8421 193.9 143.3 37.4 726 30 -19.7 1.01 167.3 56.9 3.45e+03 50 29.5 1.97 167 50.3 2863 45 19.9 1.85 0.0468 0.1793 0.2396 0.1615 0.4611 0.156 0.1618 1.3235 0.3749 1.4405 0.2823 0.1341 58.5294 10.4931 119.9 肺活量 3.56e+03 852.4996 7359 耐力类 51.3834 8.3003 柔韧、力32.7964 15.1214 量 速度、灵巧

91 86.4 2.95 2.0232 0.3156 15

天津科技大学2014届本科生毕业论文

表4-2 08级各个测试成绩数据的描述性统计量

平均值标准差 最大值最小值中位数众数变异系偏度(mean) (1) (max) (min) (median) (mode) 数(cvar) (skewness) 身高 167.9363 7.688 196.1 148.3 0.0458 164.1 0.0458 0.0458 体重 58.6857 10.6593 112.6 35 57.2 53.7 0.1816 1.1005 肺活量 3.55e+03 874.5447 6601 659 3431 2823 0.2466 0.3199 耐力类 50.171 8.0083 88 30 49 45 0.1596 1.4881 柔韧、力31.8158 15.8584 量类 速度、灵1.9769 0.3176 巧类 86.1 2.94 0 1.16

26.65 1.94 19.9 1.68 0.4984 0.1606 0.2826 0.1258 表 4-3 07级各个测试成绩的描述性统计量

平均值标准差 最大值最小值中位数众数变异系数偏度(mean) (std) (max) (min) (median) (mode) (cvar) (skewness) 192.2 144.1 167.7 171.1 0.0454 0.1672 身高 168.1449 7.6359 1 体重 58.9113 11.0641 123.7 35.1 56.65 53.2 0.1878 1.1543 肺活量 3.64e+03 868.6128 6218 731 3498 3198 0.2389 0.3002 耐力类 49.8057 柔韧、31.9564 力量 速度、2.0161 灵巧 7.7216 88 31 48 45 0.155 1.513 15.9358 0.2912 75.1 2.85 0 1.16 27.1 2 19.9 2.16 0.4987 0.1444 0.2934 0.0359 16