本书从数据分析入门、常用研究方法应用、数据综合评价及预测、问卷数据分析和医学数据分析等五个方面系统地介绍科研数据的分析方法,涉及13 项知识类应用(如影响关系、权重关系、数据预测、问卷研究),本书强调以实际应用为主,每个知识点均通过通俗的文字表达,并附以案例及软件操作界面进行详细解读,可用于数据分析、实证研究和学术写作等,适合高等院校本科生、研究生,以及行业研究者学习和使用,也适合从事科研分析培训、数据分析咨询的相关工作者参考。
周俊北京大学市场营销硕士,中央财经大学国际项目部统计学讲师,人大经济论坛培训师,问卷星平台数据分析首席顾问,SPSSAU数据研究部首席顾问,《问卷数据分析:破解SPSS软件的六类分析思路》书籍作者。马世澎网名数据小兵,统计学/数据分析博主,SPSS统计咨询公众号作者,网易云课堂数据分析类课程讲师。其为统计分析爱好者和实践者,具有十余年SPSS统计软件的使用经验,主要从事数据统计分析教学、统计咨询工作,长期致力于统计分析方法、统计软件工具的应用实践,并且专注业务数据分析与挖掘,曾在国内知名零售集团、省级新闻网站和省级电视媒体从事商业、新媒体、收视市场数据分析工作。
目录
第一篇 数据分析入门
第1 章 SPSSAU 平台概述 . 2
1.1 SPSSAU 平台简介 . 2
1.2 SPSSAU 平台使用 . 4
1.3 获得帮助 . 9
第2 章 数据探索及分析 . 12
2.1 分析方法数据格式 . 12
2.2 探索数据特征 . 14
2.2.1 两种数据类型 . 14
2.2.2 定类数据探索分析 . 15
2.2.3 定量数据探索分析 . 15
2.2.4 小结 . 18
2.3 数据分布之正态性分析 . 19
2.3.1 正态分布图示法 . 19
2.3.2 正态分布检验法 . 21
2.3.3 正态分布转换处理 . 22
2.3.4 小结 . 23
2.4 常用分析方法选择 . 23
2.4.1 定类或定量数据分析方法 . 24
2.4.2 定类和定类数据分析方法 . 26
2.4.3 定类和定量数据分析方法 . 27
2.4.4 定量和定量数据分析方法 . 29
2.4.5 小结 . 30
第3 章 数据清理 . 31
3.1 数据标签设置 . 31
3.2 数据编码 . 34
3.3 异常值处理 . 36
3.4 生成变量 . 38
3.4.1 常用处理 . 38
3.4.2 量纲处理 . 39
3.4.3 科学计算 . 42
3.4.4 汇总处理 . 42
3.4.5 日期相关处理 . 42
3.4.6 其他 . 43
3.5 标题处理 . 44
第二篇 常用研究方法应用
第4 章 差异关系研究 . 48
4.1 t 检验 . 49
4.1.1 正态分布与方差齐性 . 50
4.1.2 t 检验分析步骤 . 51
4.1.3 单样本t 检验 52
4.1.4 配对样本t 检验 53
4.1.5 独立样本t 检验 54
4.1.6 概要t 检验 55
4.2 方差分析 . 57
4.2.1 方法概述 . 58
4.2.2 方差分析类型的选择 . 60
4.2.3 单因素方差分析 . 61
4.2.4 双因素及多因素方差分析 . 65
4.2.5 简单效应分析 . 68
4.3 卡方检验 . 69
4.3.1 方法概述 . 69
4.3.2 2×2 四格表卡方检验 71
4.3.3 R×C 列联表卡方检验与多重比较 . 73
4.3.4 fisher 卡方检验 . 76
4.3.5 配对卡方检验 . 78
4.3.6 分层卡方检验 . 79
4.3.7 卡方拟合优度检验 . 83
4.4 非参数秩和检验 . 84
4.4.1 方法介绍 . 84
4.4.2 单样本Wilcoxon 检验 . 85
4.4.3 两组独立样本Mann-Whitney 检验 . 86
4.4.4 多组独立样本Kruskal-Wallis 检验 . 87
4.4.5 配对样本Wilcoxon 秩和检验 . 89
4.4.6 多样本Friedman 检验 91
第5 章 相关影响关系研究 93
5.1 相关分析 . 94
5.1.1 相关关系概述 . 94
5.1.2 相关分析步骤 . 96
5.1.3 两个变量相关实例分析 . 97
5.1.4 偏相关实例分析 . 101
5.2 线性回归 . 103
5.2.1 线性回归模型与检验 . 104
5.2.2 线性回归适用条件 . 105
5.2.3 线性回归的一般步骤 . 106
5.2.4 多重线性回归的实例分析 . 107
5.2.5 逐步线性回归的实例分析 . 114
5.2.6 有哑变量的线性回归 . 117
5.3 Logistic 回归 . 120
5.3.1 方法概述 . 121
5.3.2 二元Logistic 回归 123
5.3.3 多分类Logistic 回归 129
5.3.4 有序Logistic 回归 132
5.3.5 条件Logistic 回归 136
5.4 曲线与非线性回归 . 138
5.4.1 方法概述 . 138
5.4.2 曲线回归 . 139
5.4.3 非线性回归 . 143
第6 章 信息浓缩及聚类研究 147
6.1 因子分析 . 148
6.1.1 基本原理 . 148
6.1.2 分析步骤 . 149
6.1.3 因子分析实例分析 . 151
6.2 主成分分析 . 156
6.2.1 思想与应用 . 156
6.2.2 与因子分析的区别 . 157
6.2.3 分析步骤 . 158
6.2.4 主成分实例分析 . 159
6.3 对应分析 . 164
6.3.1 方法概述 . 164
6.3.2 简单对应分析 . 166
6.3.3 多重对应分析 . 169
6.4 多维尺度分析 . 171
6.4.1 方法概述 . 171
6.4.2 矩阵数据实例分析 . 173
6.4.3 原始数据实例分析 . 175
6.5 聚类分析 . 177
6.5.1 聚类方法的选择 . 177
6.5.2 K-means 聚类 180
6.5.3 K-prototype 聚类 . 184
6.5.4 分层聚类 . 188
第三篇 数据综合评价及预测
第7 章 权重关系研究 . 192
7.1 权重计算方法 . 192
7.1.1 主观赋权法 . 193
7.1.2 客观赋权法 . 193
7.2 主成分分析法 . 194
7.2.1 权重计算步骤 . 194
7.2.2 主成分分析法权重计算实例 . 195
7.3 熵值法 . 197
7.3.1 基本原理 . 198
7.3.2 熵值法权重计算实例 . 199
7.4 层次分析法 . 202
7.4.1 原理介绍 . 202
7.4.2 层次分析法流程 . 205
7.4.3 层次分析法实例分析 . 206
7.5 其他权重法 . 210
7.5.1 CRITIC 权重法 . 210
7.5.2 独立性权重法 . 213
7.5.3 信息量权重法 . 215
第8 章 数据预测分析 . 218
8.1 ARIMA 模型 . 219
8.1.1 ARMA 模型分析流程 219
8.1.2 ARMA 模型案例 225
8.2 指数平滑法 . 230
8.2.1 一次指数平滑法 . 231
8.2.2 二次指数平滑法 . 233
8.2.3 三次指数平滑法 . 235
8.3 灰色预测模型 . 238
8.3.1 灰色预测模型原理 . 238
8.3.2 灰色预测模型分析 . 240
8.4 马尔可夫预测 . 243
第9 章 优劣决策分析 . 247
9.1 TOPSIS 法 . 247
9.1.1 TOPSIS 法原理 . 247
9.1.2 TOPSIS 法案例 . 249
9.1.3 TOPSIS 法问题探讨 . 252
9.2 熵权TOPSIS 法 254
9.2.1 熵权TOPSIS 法原理 254
9.2.2 熵权TOPSIS 法案例 255
9.3 秩和比法 . 259
9.3.1 秩和比原理 . 259
9.3.2 RSR 案例 260
9.4 Vikor 法 . 264
9.4.1 Vikor 法原理 . 264
9.4.2 Vikor 法案例 . 265
第10 章 常用综合评价分析 271
10.1 灰色关联法 . 272
10.1.1 灰色关联法原理 . 272
10.1.2 灰色关联法案例 . 273
10.1.3 广义关联度 . 277
10.2 模糊综合评价法 . 279
10.2.1 模糊综合评价法原理 . 279
10.2.2 模糊综合评价案例 . 280
10.3 数据包络分析 . 284
10.3.1 数据包络分析原理 . 284
10.3.2 数据包络分析案例 . 288
10.4 耦合协调度 . 293
10.4.1 耦合协调度原理 . 293
10.4.2 耦合协调度案例 . 295
10.5 综合指数 . 298
10.6 DEMATEL 302
10.7 ISM 307
第四篇 问卷数据分析
第11 章 问卷研究分析方法 314
11.1 单选题与多选题分析 . 314
11.1.1 分析思路 . 315
11.1.2 频数统计实例分析 . 316
11.1.3 卡方检验实例分析 . 320
11.2 填空题分析 . 321
11.2.1 分析思路 . 321
11.2.2 实例分析 . 322
11.3 项目分析 . 325
11.3.1 原理介绍 . 325
11.3.2 实例分析 . 327
11.4 效度分析 . 329
11.4.1 结构效度 . 329
11.4.2 实例分析 . 330
11.5 信度分析 . 333
11.5.1 信度系数 . 333
11.5.2 实例分析 . 335
11.6 验证性因子分析 . 336
11.6.1 方法概述 . 337
11.6.2 验证性因子分析步骤 . 338
11.6.3 验证性因子分析实例分析 . 342
11.7 路径分析 . 349
11.7.1 方法概述 . 349
11.7.2 实例分析 . 351
11.8 结构方程模型 . 355
11.8.1 方法概述 . 355
11.8.2 实例分析 . 358
11.8.3 结构方程模型分析讨论 . 363
11.9 中介效应分析 . 363
11.9.1 中介变量与中介效应 . 364
11.9.2 中介效应检验流程与实例 . 365
11.9.3 多重中介效应分析与实例 . 369
11.10 调节效应分析 . 372
11.10.1 调节变量与调节效应 . 372
11.10.2 简单斜率与斜率图 . 373
11.10.3 调节效应分析步骤与实例 . 374
11.11 有调节的中介分析 . 378
11.11.1 方法概述 . 378
11.11.2 有调节的中介作用实例 . 382
第12 章 常用市场研究分析 385
12.1 PSM 分析 386
12.1.1 原理介绍 . 386
12.1.2 实例分析 . 388
12.2 联合分析 . 391
12.2.1 基本概念与分析步骤 . 391
12.2.2 联合分析实例 . 394
12.3 NPS 分析 . 399
12.3.1 原理介绍 . 399
12.3.2 NPS 实例分析 . 400
12.4 KANO 模型分析. 402
12.4.1 原理介绍 . 402
12.4.2 KANO 模型实例分析 405
第五篇 医学数据分析
第13 章 医学研究常用方法 410
13.1 比率与风险 . 411
13.1.1 单个比率与两个比率的检验 . 411
13.1.2 优势比与相对危险度 . 414
13.2 剂量反应 . 417
13.2.1 方法概述 . 417
13.2.2 实例分析 . 419
13.3 生存分析 . 421
13.3.1 生存数据与生存分析 . 421
13.3.2 Kaplan-Meier 生存分析 423
13.3.3 Cox 回归分析 . 427
13.4 重复测量方差分析 . 431
13.4.1 方法概述 . 431
13.4.2 单因素重复测量方差分析 . 433
13.4.3 双因素重复测量方差分析 . 437
13.5 Roc 曲线分析 440
13.5.1 诊断试验与Roc 曲线 . 440
13.5.2 Roc 曲线分析步骤与实例 442
13.5.3 Roc 曲线差异比较 445
第14 章 一致性评价检验方法 448
14.1 Kappa 系数 449
14.1.1 Kappa 系数类型 450
14.1.2 简单Kappa 系数 . 451
14.1.3 加权Kappa 系数 . 452
14.1.4 Fleiss′s Kappa 系数 454
14.2 Kendall 协调系数 . 456
14.2.1 概念与适用条件 . 456
14.2.2 实例分析 . 457
14.3 ICC 组内相关系数 . 458
14.3.1 概念与适用条件 . 458
14.3.2 ICC 组内相关系数模型类型 . 459
14.3.3 ICC 组内相关系数实例分析 . 461
14.4 rwg 组内评分者一致性 464
14.4.1 方法概述 . 464
14.4.2 rwg 实例分析 466
14.5 Bland ALtman 图 468
14.5.1 方法概述 . 468
14.5.2 Bland ALtman 图实例分析 469
参考文献 . 472