张亨整理 四个常用统计软件SAS,STATA,SPSS,R语言分析比较及其他统计软件概述 联系客服

发布时间 : 星期二 文章张亨整理 四个常用统计软件SAS,STATA,SPSS,R语言分析比较及其他统计软件概述更新完毕开始阅读94569c4d998fcc22bdd10d1e

四个常用统计软件SAS,STATA,SPSS,R语言

分析比较及其他统计软件概述

一、 SAS,STATA,SPSS,R语言简介 (一) SAS简介

SAS(全称Statistical Analysis System,简称SAS,翻译成汉语是统计分析系统)是全球最大的软件公司之一,是由美国NORTH CAROLINA州立大学1966年开发的统计分析软件。1976年SAS软件研究所(SAS INSTITUTE INC)成立,开始进行SAS系统的维护、开发、销售和培训工作。期间经历了许多版本,并经过多年来的完善和发展,SAS系统在国际上已被誉为统计分析的标准软件,在各个领域得到广泛应用。

其网址是:http://www.sas.com/ (二) STSTA简介

STATA统计软件由美国计算机资源中心(Computer Resource Center)1985年研制。STATA 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。

新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。STATA提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。

除此之外,STATA软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也可以透过 STATA Journal 获得许许多多的相关讯息以及书籍介绍等。另外一个获取庞大资源的管道就是STATAlist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。

其网址是:http://www.STATA.com/ (三) SPSS简介

SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(Statistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。

1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。

SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent于1968年研究开发成功,同时成立了SPSS公司,并于1975年成立法人组织、在芝加哥组建了SPSS总部。

2009年7月28日,IBM公司宣布将用12亿美元现金收购统计分析软件提供商SPSS公司。如今SPSS已出至版本22.0,而且更名为IBM SPSS。迄今,SPSS公司已有40余年的成长历史。

其网址是:http://www.spss.com/ (四) R语言简介

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发了一个R系统。由“R开发核心团队”负责开发。 R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。

其网址是:www.r-project.org

二、 使用范围

典型应用范围 SAS 市场需求预STATA SPSS 典型的应用是民意调查、问卷分析;主要用于社会科学研究 社会科学(社会、教育、心理、政治、行政、传播…),行政管理领域 R 计量经济学、制造、金融、生物医药、学术论文 基本统计学、经济学、生物信息学、生态学、医药学、社会学、地理学 统计研究人员 测、销售预测、医学,生物统潜在客户开发、CRM、经营绩效分析等 计研究,学术界 使用范围 适合领域 管理科学(企业、资料、财务、会计、经济……) 统计学、经济学、生物学、医药学、社会学、人口学 适合人员 专业研究及编程人员 统计研究人员 应用统计人员 SAS语言具有强大的对数据处理的能力,但其不具有对

扩展性

新算法的集成功能,因此算法比较固定,需随着SAS软件的版本更新才能更新算法

STATA的编程功能也很强大,每期的STATA journal都有最新的模型程序更新

不具备扩展性,无法编写新算法,只能使用软件提供的固定功能

R的可扩展功能很强,可以任意实现自己的算法,甚至都可以编游戏了,不过这方面并不是R的长处,R的主要应用在统计编

三、 综合比较 SAS STATA SPSS 使用Windows的窗口方式展示各种管理和分析STATA就如一个半自动相操作界面 纯编程界面,操作困难 机,也就是说它把傻瓜菜单和命令编程结合了起来。 数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务 SAS直接兼容较少的数据(库)格式,对于其数据兼容 它不直接兼容的数据格式需使用SAS Access将数据格式转换为SAS数据格式才能使用。 数据处理功能非常强大,SAS语言的优势所在 通常数据来源于数据库下载,而不是手工录入。STATA不能直接支持很多格式(Excel files, SAS files),可以先保存为csv格式后再导入STATA 在数据管理和许多前沿统计方法中的功能还是非常强大的。 能打开Excel、DaBase、Foxbase、Lotus 1-2-3、Access、文本编辑器等生成的数据文件。 实际基本上各大数据库厂商已有相应的R语言企业级应用产品,这些厂商包括Oracle、IBM、Teradata、Sybase、SAP。 完美的数据可视化制作只能利用菜单进行一些数据的常规操作 工具,丰富的图形函数和外置包,几乎无限的扩展能力,数据处理很强大 R的界面非常简洁,只有一个菜单栏,和一个默认新建的R Console 控制台 R 数据的处理 STATA 的作图模块,主要提供如下八种基本图形的

制作 : 直方图 (histogram) ,条形图 (bar), 百分条图 (oneway) ,百分圆图

(pie) ,散点图

多维数据的图形描述

SAS的图形功能很强

(twoway) ,散点图矩阵(matrix) ,星形图 (star) ,分位数图。这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提

供了残差图等。 STATA 的统计功能很强,除了传统的统计分析方法外,还收集了近 20 年发展起来的新方法,如 Cox

SAS是确切地说是一套大型集成应用软件系统,具有完备的数据存取、数据管理、数据分析和数据展现功能。SAS

分析方法

系统中提供的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工

比例风险回归,指数与 Weibull 回归,多类结果与有序结果的 logistic 回归, Poisson 回归,负二项回归及广义负二项回归,随机效应模型等。具体说, STATA 具有如下统计分析能力:数值变量资料的一般分析,分类资料的一般分析,等级资料分析,其他方法如质量控制,整群抽样的设计效率,诊断试验评价, kappa

等。

对于数据预处理、操作方面具有很强大的灵活

编程灵活性

性,但是对于统计分析功能灵活性不强,只能通过设置不同参数来改

变输出结果。

STATA 是一个统计分析软件,但它也具有很强的程

序语言功能

几乎是固定的用法,不

具备灵活性

强大的编程语言。R的功能能够通过由用户撰写的套件增强。增加的功能有特殊的统计技术、绘图功能,以及编程界面和数据输出/输入功能。

提供很多常用统计方法,但是分析功能仍然

有所欠缺

R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户

可自定义功能。

利用SPSS可以生成数十种基本图和交互图。交互图可有不同风格的二维、三维图。交互图包括条形交互图、点形交互图、线形交互图、带形交互图、饼形交互图、箱形交互图、误差条形交互图、直方交互图和散点交互图等。图形生成以后,可以进行

编辑。

R的强项是绘图功能,制图具有印刷的素质,也可

加入数学符号。

具等等,功能相当强大。 的一般分析,相关与回归