产品概述
# 产品概述
# 一、我们是谁?
SPSSPRO(Scientific Platform Serving for Statistics Professional,简称 SPSSPRO)“专业、科学的数据分析平台”,是众言科技旗下的一款区别于 SPSS、SAS 传统客户端模式的全新在线数据分析平台。基于数据处理、分析算法等核心能力,SPSSPRO 将面向高校师生、市场调研人员、科研人员等提供在线化、低门槛的在线数据分析服务,可广泛运用于科研、商业、数据挖掘、问卷调查等领域。
众言科技是中国市场研究协会(CMRA)会员,一直致力为政府、企业和个人提供数据服务,2008 年诞生于上海交大慧谷创业楼,执着于打磨产品、无死角解决客户需求,多年深耕,现团队规模已超过 500 位员工,服务的客户遍及互联网、教育、媒体、金融、房地产、新零售、电商等多个行业,为超万家企业提供专业调研、数据洞察与客户体验管理、数据分析等服务,也用自身产品的更迭、完善推动着国内数据服务的不断成熟。尤其在教育行业,已为超过 300 万高校师生提供网络调研支持,包括清华北大、复旦交大、浙大南大等一众高校,累积了大量高校调研实施经验。
众言科技持续加大科技投入,在高性能与大并发配额计算技术、多数据源大数据实时计算与可视化报表、支持复杂逻辑及长问卷设计技术等领域形成了体系化技术优势,拥有 70 多项软件著作权,相继通过了“高新技术企业”、“双软企业”、 ISO9001、ISO27001 质量管理体系认证和 CMMI 三级认证等。
众言科技旗下拥有国内领先的、免费在线网络调研平台问卷网与面向大中型企业的客户体验管理平台倍市得(BESTCEM)。成立十余年以来,众言科技已经帮助超过 1700 万用户收集超过 15 亿份客户心声。
# 二、我们的优势
# 1、专业强大
- 涵盖全部专业统计算法模型,不断更新,让您的各种算法需求都能得到一站式满足;
- 一键生成分析与解释,关键术语自动注释,没有统计知识也能读懂分析报告。
# 2、安全可靠
- 每一步数据清洗操作我们都配有示例说明,让您更加清楚数据背后的运作,保证数据的清洗更加规范、安全;
- 数据处理步骤均自动保存版本,关键时刻能找回原始数据,不浪费任何心血去数据恢复;
- 分析结果永久保存,永不丢失。
# 3、精准智能
- 原始数据上传后系统自动进行编码判断,免去手工一对一编码烦恼;
- 系统自动输出分析结果,按照科研学术规范表述,帮助你读懂关键统计指标得出算法结论,还可直接引用至报告或论文中。
# 4、高效便捷
- 支持 Excel、csv、sav 等多格式数据文件处理、分析与导出;
- 卡片式布局,极简交互,快速管理各类数据;
- 数据永久保存,支持数据按版本导出不同数据格式,按需索取,告别冗余。
# 5、简单快捷
- 极简交互与时尚设计,在赏心悦目间实现漂亮的图表呈现;
- 跟随指引,妥妥拽拽即可完成一个复杂的模型计算。
# 6、一触即达
- 与问卷网等主流在线调研平台无缝对接,轻松实现专业的在线 SPSS 分析;
- 无需下载安装客户端,不占用本地计算机资源,有网就能用。
# 三、产品功能简介
SPSSPRO 是一款集成专业统计方法与数据算法于一体的在线式数据处理、分析平台。可广泛运用于科研、商业、数据挖掘、问卷调查等领域。目前 SPSSPRO 支持下列功能,更多功能不断更新升级中。
# (一)数据处理
- 标签设置 标签是给统计数据中的数值赋予被解读的意义,贴上一个文本标签,如 1=男,2=女,计算只识别数字,但分析结果却可以以标签的形式呈现,能被被我们轻易解读,如果没有标签就会显得很吃力。
- 数据编码 标签与编码是数据处理的第一步,是将原始数据转化成计算机能识别、计算同时又能被分析解读的关键步骤。SPSSPRO 支持对原始数据的进行自动编码与归类,如字符型数据会转置为定类数据,并将其自动编码,保留原始字符为标签。
- 异常值处理 原始数据中掺杂异常值或者需要得到一份指定范围的纯净数据时需要借助异常值处理功能。SPSSPRO 支持异常值范围自定义,如数字缺失、数字范围、数据波动范围等;同时支持将异常值处置为空值或替换为平均数、中位数、众数等功能。
- 个案处理 个案处理是指对一个样本的所有数据进行管理操作,目的是排除重复、无效的样本,使得整个分析数据符合研究的预期设想。SPSSPRO 支持重复、无效个案筛选,筛选结果可以直接剔除,也可以标记后用户自己决定。
- 生成变量
生成变量是指在原始变量数据基础上,根据一定规则生成新的变量用以进一步研究,如:体重/身高 ² 可以得到 BMI 体质指数,用以衡量个体肥胖程度。SPSSPRO 目前支持常见的求和、乘积、Z 标准化、中心化、对数转化等基础计算与量纲计算,支持自编公式等。
# (二)数据分析
SPSSPRO 目前支持描述性统计分析如频数、交叉汇总、正态性检验、相关分析等;差异性分析如独立T检验、方差分析、交叉卡方检验等;统计建模如回归分析;问卷研究如信效度、多选题、聚类分析等。
- 频数分析 频数分析是对一组数据的不同数值的频数,或者数据落入指定区域内的频数进行统计,了解其数据分布状况的方式。通过频数分析,能在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差,并以此证明以后相关问题分析的代表性和可信性。
- 描述性统计 描述性统计分析是对调查总体所有变量的有关数据进行统计性描述,包括数据的集中趋势与离散趋势。
- 分类汇总 根据定类变量分类进行汇总(按照某一标准进行分类,然后在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等方法的汇总。又名列联表分析)。
- 正态性分析 正态性检验用于检验数据是否满足正态分布,一些算法需要数据满足正态分布。(如单样本 t 检验,独立样本 t 检验等)。
- 相关性分析 相关分析是对变量两两之间的相关程度进行分析。相关分析的计算方式有3种,分别是 Pearson相关系数(适用于定量数据,且数据满足正态分布)、Spearman相关系数(数据不满足正态分布时使用),kedall's tau-b 相关系数(有序定类变量)。
- 方差分析 方差分析(单因素方差分析或 F 检验)用于定类字段(X)与 1 个或 1 个以上的定量字段(Y)之间的差异性研究。需要注意的是,一个定类字段称为单因素方差分析,两个定类字段及以上称为多因素方差分析,与独立样本 T 检验不同的是,方差分析可用于多分类定类字段数据的差异性分析,T 检验只能作用于二分类定类变量。
- 独立样本 T 检验 独立样本 t 检验用于分析一个定类变量与一个或者多个定量变量之间有无明显差异,需要特别注意的是,该定类变量为二分类变量(三分类及以上使用方差分析),各分类频数可以不相等。
- 卡方检验 卡方检验(Pearson 卡方检验)主要是比较定类变量与定类变量之间的差异性分析。通过统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为 0,表明理论值完全符合。
- 线性回归 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,在线性回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
- 信度分析 信度分析主要用来考察问卷中量表所测结果的稳定性以及一致性,即用于检验问卷中量表样本是否可靠可信。量表题型就是问题的选项,是分陈述等级进行设置的。比如我们对手机的喜爱从非常喜欢到不喜欢这个程度的变化。在量表里面最出名的就是李克特 5 级量表,在这种量表的选项里面主要是分为'非常同意'、'同意'、'不一定'、'不同意'、'非常不同意'五种回答,分别记为 5、4、3、2、1。
- 聚类分析 聚类分析是一种基于中心的聚类算法(K均值聚类),通过迭代,将样本分到K个类中,使得每个样本与其所属类的中心或均值的距离之和最小。与分层聚类等按照字段进行聚类的算法不同的是,快速聚类分析是按照样本进行聚类。