SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。
1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。
发展历史
SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生Norman H. Nie、C. Hadlai (Tex) Hull 和 Dale H. Bent于1968年研究开发成功,同时成立了SPSS公司,并于1975年成立法人组织、在芝加哥组建了SPSS总部。
2009年7月28日,IBM公司宣布将用12亿美元现金收购统计分析软件提供商SPSS公司。如今SPSS已出至版本22.0,而且更名为IBM SPSS。迄今,SPSS公司已有40余年的成长历史。
软件功能
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows的窗口方
式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows操作技能,精通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序。极大的方便了中、高级用户。
SPSS图表制作SPSS for Windows是一个组合式软件包,它集数据录入、整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块,以降低对系统硬盘容量的要求,有利于该软件的推广应用。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。SPSS for Windows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推广到多种各种操作系统的计算机上,它和SAS、BMDP并称为国际上最有影响的三大统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。最新的21.0版采用DAA(Distributed Analysis Architecture,分布式分析系统),全面适应互联网,支持动态收集、分析数据和HTML格式报告。SPSS操作界面SPSS输出结果虽然漂亮,但是很难与一般办公软件如Office或是WPS2000直接兼容,如不能用Excel等常用表格处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。在撰写调查报告时往往要用电子表格软件及专业制图软件来重新绘制相关图表,这已经遭到诸多统计学人士的批评;而且SPSS作为三大综合性统计软件之一,其统计分析功能与另外两个软件即SAS和BMDP相比仍有一定欠缺。虽然如此,SPSS for Windows由于其操作简单,已经在我国的社会科学、自然科学的各个领域发挥了巨大作用。该软件还可以应用于经济学、数学、统计学、物流管理、生物学、心理学、地理学、医疗卫生、体育、农业、林业、商业等各个领域。发展历史1968年:斯坦福大学三位学生创建了SPSS1968年:诞生第一个用于大型机的统计软件1975年:在芝加哥成立SPSS总部1984年:推出用于个人电脑的SPSS/PC+1992年:推出Windows版本,同时全球自SPSS 11.0起,SPSS全称为“Statistical Product and Service Solutions”,即“统计产品和服务解决方案”2009年:SPSS公司宣布重新包装旗下的SPSS产品线,定位为预测统计分析软件(Predictive Analytics Software)PASW,包括四部分:PASW Statistics (formerly SPSS Statistics):统计分析PASW Modeler (formerly Clementine) :数据挖掘Data Collection family (formerly Dimensions):数据收集PASW Collaboration and Deployment Services (formerly Predictive Enterprise Services):企业应用服务2010年:随着SPSS公司被IBM公司并购,各子产品家族名称前面不再以PASW为名,修改为统一加上IBM SPSS字样版本历史· SPSS15.0.1- 2006年11月· SPSS16.0.2- 2008年4月· SPSS Statistics17.0.1- 2008年12月· PASW Statistics17.0.2- 2009年3月· PASW Statistics17.0.3- 2009年11月· PASW Statistics18.0.0- 2009年8月· PASW Statistics18.0.1- 2009年12月· PASW Statistics18.0.2- 2010年4月· PASW Statistics18.0.3- 2010年9月· IBM SPSS Statistics 19.0 - 2010年8月· IBM SPSS Statistics 20.0 - 2011年8月· IBM SPSS Statistics 21.0 - 2012年8月· IBM SPSS Statistics 22.0 - 2013年8月从被IBM收购之后,SPSS的更新都是一年一个版本,每年的8月中旬,总能见到。功能介绍数据管理在10版以后,SPSS的每个新增版本都会对数据管理功能作一些改进,以使用户的使用更为方便。13版中的改进可能主要有以下几个方面:1)超长变量名:在12版中,变量名已经最多可以为64个字符长度,13版中可能还要大大放宽这一限制,以达到对当今各种复杂数据仓库更好的兼容性。2)改进的Autorecode过程:该过程将可以使用自动编码模版,从而用户可以按自定义的顺序,而不是默认的ASCII码顺序进行变量值的重编码。另外,Autorecode过程将可以同时对多个变量进行重编码,以提高分析效率。3)改进的日期/时间函数:本次的改进将集中在使得两个日期/时间差值的计算,以及对日期变量值的增减更为容易上。结果报告从10版起,对数据和结果的图表呈现功能一直是SPSS改进的重点。在16版中,SPSS推出了全新的常规图功能,报表功能也达到了比较完善的地步。13版将针对使用中出现的一些问题,以及用户的需求对图表功能作进一步的改善。1)统计图:在经过一年的使用后,新的常规图操作界面已基本完善,本次的改进除使得操作更为便捷外,还突出了两个重点。首先在常规图中引入更多的交互图功能,如图组(Paneled charts),带误差线的分类图形如误差线条图和线图,三维效果的简单、堆积和分段饼图等。其次是引入几种新的图形,已知的有人口金字塔和点密度图两种。2)统计表:几乎全部过程的输出都将会弃用文本,改为更美观的枢轴表。而且枢轴表的表现和易用性会得到进一步的提高,并加入了一些新的功能,如可以对统计量进行排序、在表格中合并/省略若干小类的输出等。此外,枢轴表将可以被直接导出到PowerPoint中,这些无疑都方便了用户的使用。统计建模Complex Samples是12版中新增的模块,用于实现复杂抽样的设计方案,以及对相应的数据进行描述。但当时并未提供统计建模功能。在13版中,这将会有很大的改观。一般线形模型将会被完整地引入复杂抽样模块中,以实现对复杂抽样研究中各种连续性变量的建模预测功能,例如对市场调研中的客户满意度数据进行建模。对于分类数据,Logistic回归则将会被系统的引入。这样,对于一个任意复杂的抽样研究,如多阶段分层整群抽样,或者更复杂的PPS抽样,研究者都可以在该模块中轻松的实现从抽样设计、统计描述到复杂统计建模以发现影响因素的整个分析过程,方差分析模型、线形回归模型、Logistic回归模型等复杂的统计模型都可以加以使用,而操作方式将会和完全随机抽样数据的分析操作没有什么差别。可以预见,该模块的推出将会大大促进国内对复杂抽样时统计推断模型的正确应用。模块这个模块实际上就是将以前单独发行的SPSS AnswerTree软件整合进了SPSS平台。笔者几年前在自己的网站上介绍SPSS 11的新功能时,曾经很尖锐地指出SPSS的产品线过于分散,应当把各种功能较单一的小软件,如AnswerTree、Sample Power等整合到SPSS等几个平台上去。看来SPSS公司也意识到了这一点,而AnswerTree就是在此背景下第一个被彻底整合的产品。Classification Tree模块基于数据挖掘中发展起来的树结构模型对分类变量或连续变量进行预测,可以方便、快速的对样本进行细分,而不需要用户有太多的统计专业知识。在市场细分和数据挖掘中有较广泛的应用。已知该模块提供了CHAID、Exhaustive CHAID和C&RT三种算法,在AnswerTree中提供的QUEST算法尚不能肯定是否会被纳入。为了方便新老用户的使用,Tree模块在操作方式上不再使用AnswerTree中的向导方式,而是SPSS近两年开始采用的交互式选项卡对话框。但是,整个选项卡界面的内容实际上是和原先的向导基本一致的,另外,模型的结果输出仍然是AnswerTree中标准的树形图,这使得AnswerTree的老用户基本上不需要专门的学习就能够懂得如何使用该模块。由于树结构模型的方法体系和传统的统计方法完全不同,贸然引入可能会引起读者统计方法体系的混乱。为此,本次编写的高级教程并未介绍该模块,而将在高级教程的下一个版本,以及关于市场细分问题的教材中对其加以详细介绍。兼容性随着自身产品线的不断完善,SPSS公司的产品体系已经日益完整,而不同产品间的互补和兼容性也在不断加以改进。在13版中,SPSS软件已经可以和其他一些最新的产品很好的整合在一起,形成更为完整的解决方案。例如,SPSS、SPSS Data Entry和新发布的SPSS Text Analysis for Surveys一起就形成了对调查研究的完整解决方案。而新增的SPSS Classification Trees模块将使得SPSS软件本身就能够针对市场细分工作提供更为完整的方法体系。产品特点操作简便界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。编程方便具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。功能强大具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。数据接口能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt及html格式的文件。模块组合SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。针对性强SPSS针对初学者、熟练者及精通者都比较适用。并且很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。SPSS18.02010年,业界领先的预测分析软件提供商 SPSS 公司推出其旗舰统计分析软件 SPSS 的新版本 SPSS 18.0 for Windows。该版本继承了原有产品的特点之外还增加了许多显著的新特性。公司从大量的客户反馈信息中提取有益的建议,并加入到该新版本中。SPSS 18 在数据管理、统计分析和可编程性方面增加了许多新的特性。除此之外,SPSS 18 还提供了新的图形选项以及 PDF 格式输出功能-这些都是用户强烈要求的新特性。如果用户使用了 Dimensions 软件用于调查研究,SPSS 同样能够直接导入和导出各种 Dimensions 数据模型。对于企业用户来说,SPSS 服务器不仅性能得到加强,其中用于 SPSS 预测企业服务萡 SPSS 适配器能够让企业内部的各个部门能够更有效地使用一致性的数据。SPSS 18.0由17个功能模组组成:· Base System 基础程式· Advanced Models 高等统计模组(GEE/GLM/存活分析)· Regression Models 进阶回归模组· Custom Tables 多变量表格· Forecasting 时间序列分析· Categories 类别资料分析/多元尺度方法· Conjoint 联合分析· Exact Tests 精确检定· Missing Value Analysis 遗漏值分析· Neural Networks 类神经网络· Decision Trees 决策树· Data Preparation 资料准备· Complex Samples 抽样计划· Direct Marketing 直销行销模组· Bootstrapping 拔靴法· Data collection Data Entry 资料收集· Programmability Extension 扩充程式码能力SPSS广泛应用于各个领域,但是每个行业都存在着自己与众不同的行业特点和行业需求,因此SPSS根据各个行业数据分析和数据挖掘的特点,设计了更具有针对性的解决方案。图形和输出在SPSS 以往版本中已经使用的一种高度可视化的构造图表交互界面-图形构建器在 SPSS 新版中得到了进一步的加强。新式的图表能够让用户将复杂的信息清晰地表现出来。而 PDF 格式的输出功能够让用户更好地同其它人员进行信息共享。数据和访问管理SPSS Base 18 提供了更强大的数据管理功能帮助用户通过 SPSS 使用其它的应用程序和数据库。用户还可以定制 SPSS 内部信息显示的方式,这样在管理数据的时候能够节省时间,也具备一定的灵活性。分析功能SPSS Base 18 还包括了 ordinal regression(次序回归)分析算法,该算法在以前的版本中包含在 SPSS Advanced Models 附属模块中。在 18.0 中用户可以直接在 Base 模块中直接使用这种新的算法来对两种以上的变量的次序输出进行预测。例如,预测客户忠诚度及其与客户满意度的相关性。可编程性SPSS 18.0 中包括了 SPSS Programmability Extension 功能,在 SPSS 命令语法语言的基础上提供与其它编程语言的结合功能。用其它语言编写的程序代码,如 Python®,可以管理使用 SPSS 语法所编写的任务流。使用 SPSS 18.0 提供的扩展编程功能和特性,让 SPSS for Windows 成为了最强大的统计开发平台之一。软件平台SPSS自SPSS16.0起推出Linux版本。SPSS最新版本为SPSS 22.0,已支持Windows 8、Mac OS X、Linux及UNIX/2012年,提供Mac、Windows、Linux及UNIX四种平台产品版本下载。[2] 相关图书SPSS其实很简单作者:罗纳德·D·约克奇 美国加利福尼亚大学教授。SPSS
译者:刘超,吴铮出 版 社:中国人民大学出版社出版时间:2010-6-1开本: 16开定价: 39.00元统计分析(第3版) (附光盘一张)作 者:卢纹岱主编出 版 社:电子工业出版社出版时间:2006-6-1字 数: 1039000版 次: 1页 数: 700印刷时间:2006/06/01纸 张: 胶版纸包 装: 平装SPSS宝典作者:张红兵页数: 603定价: 59出版社: 电子工业出版社装帧: 平装出版年:2007-02-01统计学(第三版)作者:贾俊平页数:331定价:32出版社:中国人民大学出版社出版年:2008年11月SPSS数据统计与分析作者:骆方 刘红云 黄昆页数:270定价:35.00出版社:清华大学出版社出版年:2011年07月其他相关ClementineSPSS Clementine是ISL(Integral Solutions Limited)公司开发的数据挖掘工具平台。1999年SPSS公司收购了ISL公司,对Clementine产品进行重新整合和开发,Clementine已经成为SPSS公司的又一亮点。作为一个数据挖掘平台, Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。 强大的数据挖掘功能和显著的投资回报率使得Clementine在业界久负盛誉。 同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比, Clementine其功能强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终,在缩短投资回报周期的同时极大提高了投资回报率。广泛分析带来最优结果为了解决各种商务问题,企业需要以不同的方式来处理各种类型迥异的数据, 相异的任务类型和数据类型就要求有不同的分析技术。 Clementine为您提供最出色、最广泛的数据挖掘技术,确保您可用最恰当的分析技术来处理相应的问题, 从而得到最优的结果以应对随时出现的商业问题。即便改进业务的机会被庞杂的数据表格所掩盖, Clementine也能最大限度地执行标准的数据挖掘流程,为您找到解决商业问题的最佳答案。CRISP-DM 使数据挖掘成为标准的商业流程为了推广数据挖掘技术,以解决越来越多的商业问题,SPSS和一个从事数据挖掘研究的全球性企业联盟制定了关于数据挖掘技术的行业标准--CRISP-DM(Cross-Industry Standard Process for Data Mining)。与以往仅仅局限在技术层面上的数据挖掘方法论不同,CRISP-DM把数据挖掘看作一个商业过程,并将其具体的商业目标映射为数据挖掘目标。一次调查显示,50%以上的数据挖掘工具采用的都是CRISP-DM的数据挖掘流程,它已经成为事实上的行业标准。Clementine完全支持CRISP-DM标准,这不但规避了许多常规错误,而且其显著的智能预测模型有助于快速解决出现的问题。应用模板的结果在数据挖掘项目中使用Clementine应用模板(CATs)可以获得更优化的结果。 应用模板完全遵循CRISP-DM标准,借鉴了大量真实的数据挖掘实践经验,是经过理论和实践证明的有效技术,为项目的正确实施提供了强有力的支撑。Clementine中的应用模板包括:CRM CAT--针对客户的获取和增长,提高反馈率并减少客户流失;Web CAT--点击顺序分析和访问行为分析;Telco CAT--客户保持和增加交叉销售;Crime CAT--犯罪分析及其特征描述,确定事故高发区,联合研究相关犯罪行为;Fraud CAT--发现金融交易和索赔中的欺诈和异常行为;Microarray CAT--研究和疾病相关的基因序列并找到治愈手段。结构方程模型确定复杂的关系在社会科学以及经济、市场、管理等研究领域,有时需要处理多个原因多个结果间的复杂关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不好解决的问题。二十世纪八十年代以来,结构方程分析迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。简单而言,与传统的回归分析不同,结构方程分析能同时处理多个因变量,并可以比较评价不同因果关系的理论模型。与传统的探索性因子分析不同,在结构方程模型中,我们可提出一个特定的因子结构,并检验它是否吻合数据。通过结构方程多组分析,我们可了解不同组别 (如不同性别) 内各变量的关系是否保持不变,各因子的均值是否有显着差异。国际上关于教育与心理统计的研究取得了快速的发展,结构方程模型可以说是其中发展较快,应用广泛的多元统计分析技术;在商业领域的品牌研究、顾客满意度研究等方向上也得到了广泛的应用。在我国,SEM研究方法还在管理学、经济学、医学及社会学研究等领域的应用也得到了快速的发展。结构方程模型(SEM)是国际管理研究和其他社会科学研究中日益广泛采用的建模技术,每年的美国管理学会年会上都有专题教学和研讨。SEM越来越成为各类高层次学术刊物、高层次管理研究以及社会学和经济学等学科研究领域的必备方法。AMOS软件简介AMOS 是SPSS Statistics软件包中的独立产品,是功能强大的结构方程(SEM) 建模工具,通过对包括回归、因子分析、相关性分析和方差分析等传统多元分析方法的扩展,为您的理论研究提供更多的支持。在AMOS 环境下,您可以在直观的路径图下指定、估计、评估以及设定模型,以展示假定的各变量之间的关系,来方便地地建立能真实反应复杂关系的行为态度模型。在AMOS 中,任何数值变量,不管是可观测的还是潜在的,都可以用来建模,预测其它数值变量。 AMOS快速创建模型以检验变量之间的相互影响及其原因,由于结构方程模型是一次性地验证复杂的因果关系,用标准方法以及在此基础上扩展的方法进行多元分析,因此比普通最小二乘回归和探索性因子分析更进一步,能获得更精确、丰富的综合分析结果。AMOS界面使用AMOS直观的拖放式绘图工具,您可以快速地以路径图定制模型而无需编程。在有缺失值的情况下,AMOS使用Full Information Maximum Likelihood方法仍然可以自动计算正确的标准误及适当的统计量,降低估算值偏差。新版本的AMOS 还增加了探索性结果方程模型、辅助多组分析、高级文本输出、扩展的AMOS编程环境等功能。AMOS被广泛地应用于顾客满意度分析等领域。