当前位置:首页 > 其他书籍
IBM SPSS数据分析实战案例精粹  第2版
IBM SPSS数据分析实战案例精粹  第2版

IBM SPSS数据分析实战案例精粹 第2版PDF电子书下载

其他书籍

  • 电子书积分:20 积分如何计算积分?
  • 作 者:张文彤
  • 出 版 社:
  • 出版年份:2020
  • ISBN:
  • 页数:0 页
图书介绍:
《IBM SPSS数据分析实战案例精粹 第2版》目录

第1部分 SPSS数据分析基础 3

第1章 数据分析方法体系简介 3

1.1 数据分析方法论概述 3

1.1.1 严格设计支持下的统计方法论 3

1.1.2 半试验研究支持下的统计方法论 4

1.1.3 偏智能化、自动化分析的数据挖掘应用方法论 5

1.2 统计软件中的数据存储格式 6

1.2.1 二维数据表 7

1.2.2 变量的存储类型 7

1.2.3 变量的测量尺度 8

1.3 数据的统计描述与参数估计 9

1.3.1 连续变量的统计描述 9

1.3.2 连续变量的参数估计 12

1.3.3 分类变量的统计描述和参数估计 14

1.3.4 统计图形体系 17

1.4 常用假设检验方法 20

1.4.1 假设检验的基本原理 21

1.4.2 单变量假设检验方法 22

1.4.3 双变量假设检验方法 24

1.5 多变量模型 28

1.5.1 方差分析模型/一般线性模型 28

1.5.2 广义线性模型和混合线性模型 29

1.5.3 回归模型 30

1.5.4 其他常见模型 33

1.6 多元统计分析模型 35

1.6.1 信息浓缩 35

1.6.2 变量组之间内在关联结构的探讨 35

1.6.3 对数据分类 36

1.6.4 分析各元素间的关联 38

1.7 智能统计分析方法/数据挖掘方法 39

1.7.1 树模型 39

1.7.2 神经网络 40

1.7.3 支持向量机 41

1.7.4 最近邻元素分析 41

1.7.5 关联规则与序列分析 41

第2章 顾客售后满意度监测项目 43

2.1 案例背景 43

2.2 数据文件的读入与变量整理 44

2.2.1 了解SPSS的基本操作界面 44

2.2.2 进行数据准备 46

2.3 问卷数据分析 50

2.3.1 生成频数表 50

2.3.2 计算均值 51

2.3.3 对多选题进行描述 52

2.4 项目总结和讨论 53

第3章 会员购买习惯调查 54

3.1 案例背景 54

3.1.1 项目背景 54

3.1.2 分析思路 56

3.2 问卷录入 56

3.2.1 开放题的定义 56

3.2.2 单选题的定义 57

3.2.3 多选题的定义 57

3.3 问卷质量校验 59

3.3.1 去除重复记录 59

3.3.2 发现异常值 61

3.3.3 逻辑校验 62

3.4 问卷数据分析 64

3.4.1 问卷加权 64

3.4.2 业务分析 68

3.5 项目总结和讨论 69

第4章 基于背景资料的病例对照匹配 71

4.1 案例背景 71

4.2 数据清理 72

4.2.1 数据错误的发现 72

4.2.2 数据错误的更正 76

4.3 数据理解 77

4.4 利用文件合并功能进行案例匹配 80

4.5 利用Python插件直接进行匹配 81

4.5.1 倾向得分匹配 82

4.5.2 个案控制匹配 84

4.6 项目总结和讨论 86

第5章 北京地区雾霾变化趋势分析 87

5.1 案例背景 87

5.1.1 项目背景 87

5.1.2 分析思路 88

5.2 数据准备 89

5.2.1 读入csv格式的数据文件 89

5.2.2 合并数据文件 91

5.2.3 筛选所需数据 93

5.3 数据理解 94

5.3.1 数据分布状况 94

5.3.2 缺失值分布状况 95

5.3.3 考察逐月数据趋势 96

5.4 雾霾变化基本趋势的分析 97

5.4.1 整体平均水平的比较 97

5.4.2 重点考察秋冬季的数据 99

5.4.3 进一步分析爆表天数变化趋势 100

5.5 进一步展现历史波动趋势 101

5.5.1 逐月平均数据的提取 101

5.5.2 建模前的数据准备 102

5.5.3 用季节分解提取长期趋势 104

5.6 项目总结和讨论 107

第2部分 影响因素发现与数值预测 111

第6章 酸奶饮料新产品口味测试研究 111

6.1 案例背景 111

6.1.1 研究项目概况 111

6.1.2 分析思路/商业理解 112

6.2 数据理解 113

6.2.1 研究设计框架复查 113

6.2.2 均值的列表描述 114

6.2.3 均值的图形描述 115

6.3 用方差分析模型考察同一城市内不同品牌的评分差异 116

6.3.1 单因素方差分析模型简介 117

6.3.2 对品牌的作用进行总体检验 118

6.3.3 组间两两比较 120

6.3.4 对模型适用条件的考察:方差齐性检验 122

6.4 用两因素方差分析模型进行分析 123

6.4.1 两因素方差分析模型简介 123

6.4.2 拟合包括交互项的饱和模型 125

6.4.3 拟合只包含主效应的模型 125

6.4.4 组间两两比较 127

6.4.5 尝试将城市指定为随机因素进行分析 128

6.5 分析结论与讨论 130

6.5.1 分析结论 130

6.5.2 Benchmark:用还是不用 131

第7章 偏态分布的激素水平影响因素分析 132

7.1 案例背景 132

7.1.1 研究项目概况 132

7.1.2 分析思路/商业理解 133

7.2 数据理解 133

7.2.1 单变量描述 133

7.2.2 变量关联探索 136

7.3 对因变量变量变换后建模分析 141

7.3.1 常见的变量变换方法 141

7.3.2 本案例的具体操作 142

7.4 秩变换分析 145

7.5 利用Cox模型进行分析 146

7.5.1 Cox回归模型的基本原理 147

7.5.2 本案例的具体操作 148

7.6 项目总结与讨论 150

7.6.1 分析结论 150

7.6.2 八仙过海,谁为独尊 150

第8章 某车企汽车年销量预测 152

8.1 案例背景 152

8.1.1 研究项目概况 152

8.1.2 分析思路/商业理解 153

8.2 数据理解 154

8.3 变量变换后的线性回归 156

8.3.1 线性回归模型简介 156

8.3.2 变量变换后拟合线性回归模型 158

8.3.3 模型拟合效果的判断 160

8.3.4 存储预测值和区间估计值 162

8.4 曲线拟合 163

8.4.1 用曲线估计过程同时拟合多个曲线模型 163

8.4.2 模型拟合效果的判断 166

8.4.3 模型的预测 167

8.5 利用非线性回归进行拟合 168

8.5.1 模型简介 168

8.5.2 构建分段回归模型 169

8.5.3 不同模型效果的比较 171

8.6 项目总结与讨论 172

8.6.1 分析结论 172

8.6.2 行走在理想与现实之间 173

第9章 脑外伤急救后迟发性颅脑损伤影响因素分析 174

9.1 案例背景 174

9.1.1 研究项目概况 174

9.1.2 分析思路/商业理解 175

9.2 数据理解 176

9.2.1 变量关联的图表描述 176

9.2.2 变量关联的单变量检验 178

9.3 构建二分类Logistic回归模型 181

9.3.1 模型简介 181

9.3.2 初步尝试建模 183

9.3.3 构建最终模型 188

9.4 利用树模型发现交互项 189

9.4.1 模型简介 190

9.4.2 进行树模型分析 192

9.5 使用广义线性过程进行分析 195

9.5.1 模型简介 195

9.5.2 构建仅包括主效应的模型 196

9.5.3 在模型中加入交互项 199

9.6 项目总结与讨论 200

9.6.1 分析结论 200

9.6.2 尺有所短,寸有所长 201

第10章 中国消费者信心指数影响因素分析 202

10.1 案例背景 202

10.1.1 项目背景 202

10.1.2 项目问卷 203

10.1.3 分析思路/商业理解 206

10.2 数据理解 207

10.2.1 图形考察时间、地域对信心指数的影响 207

10.2.2 图形考察性别、职业、婚姻状况等对信心指数的影响 209

10.2.3 图形考察年龄对信心指数的影响 210

10.3 标准GLM框架下的建模分析 211

10.3.1 建立总模型 211

10.3.2 两两比较的结果 214

10.4 多元方差分析模型的结果 215

10.4.1 模型简介 216

10.4.2 拟合多元方差分析模型 217

10.5 最优尺度回归 223

10.5.1 方法简介 224

10.5.2 利用最优尺度回归进行分析 225

10.6 多水平模型框架下的建模分析 228

10.6.1 模型简介 229

10.6.2 针对时间拟合多水平模型 230

10.7 项目总结与讨论 235

10.7.1 分析结论 235

10.7.2 什么时候应当运用复杂模型来建模 236

第3部分 信息浓缩、分类与感知图呈现 239

第11章 探讨消费者购买保健品的动机 239

11.1 案例背景 239

11.1.1 研究项目概况 239

11.1.2 分析思路/商业理解 241

11.2 数据理解 241

11.2.1 单变量描述 241

11.2.2 变量关联探索 242

11.3 利用因子分析进行信息浓缩 243

11.3.1 模型简介 243

11.3.2 因子分析的具体操作 245

11.4 基于因子分析结果进行市场细分 251

11.4.1 不同婚姻状况受访者的差异 251

11.4.2 不同品牌保健品使用者的因子偏好差异 253

11.5 项目总结与讨论 255

11.5.1 研究结论 255

11.5.2 因子分析的结果就是一切吗 255

第12章 全国房地产价格指数的估算 257

12.1 案例背景 257

12.1.1 研究项目概况 257

12.1.2 分析思路 258

12.2 计算平均值进行回归预测 259

12.2.1 计算平均值 259

12.2.2 进行回归估计 259

12.2.3 导出模型代码用于预测 260

12.3 提取主成分进行回归预测 261

12.3.1 提取主成分 261

12.3.2 进行主成分回归预测 263

12.4 利用自动线性建模过程预测 265

12.5 项目总结与讨论 266

第13章 1988年汉城奥运会男子十项全能成绩分析 267

13.1 案例背景 267

13.1.1 项目概况 267

13.1.2 分析思路/商业理解 268

13.2 数据理解 269

13.2.1 单变量描述 269

13.2.2 变量关联探索 269

13.2.3 尝试初步建模 270

13.3 利用因子分析进行信息浓缩 272

13.3.1 初步分析 272

13.3.2 因子旋转 274

13.3.3 继续寻找更好的分析结果 276

13.3.4 结果存储/发布 277

13.4 主成分回归 278

13.5 将主成分回归方程还原回原始变量的形式 280

13.6 项目总结与讨论 280

13.6.1 研究结论 280

13.6.2 因子的方差解释比例有实际意义吗 281

第14章 生活形态问卷的信效度分析及改进 282

14.1 案例背景 282

14.1.1 项目概况 282

14.1.2 分析思路/商业理解 284

14.2 问卷的效度分析 285

14.2.1 信效度理论简介 285

14.2.2 用因子分析考察问卷效度 286

14.3 问卷的信度分析与优化 291

14.3.1 用极端组比较方式发现弱关联题项 291

14.3.2 信度分析 293

14.4 项目总结与讨论 295

第15章 打败SARS 296

15.1 案例背景 296

15.1.1 研究项目概况 296

15.1.2 分析思路/商业理解 299

15.2 数据理解与数据准备 300

15.2.1 消费者关注的信息 300

15.2.2 突发事件保险产品购买倾向 302

15.2.3 未来消费者生活方式的变化 304

15.3 “非典”信息关注倾向的多维偏好分析 306

15.3.1 模型简介 306

15.3.2 多维偏好分析的SPSS操作界面介绍 307

15.3.3 尝试初步建模 309

15.3.4 引入更多的背景变量 312

15.4 突发事件险种购买倾向的多重对应分析 315

15.4.1 模型简介 315

15.4.2 简单对应分析 317

15.4.3 多重对应分析 321

15.5 “非典”对未来生活方式的影响 326

15.5.1 采用多维偏好分析进行初步探索 326

15.5.2 换用因子分析进行信息汇总 328

15.6 项目总结与讨论 332

15.6.1 研究结论 332

15.6.2 对多维偏好分析等信息浓缩方法本质的讨论 333

第16章 住院费用影响因素挖掘 336

16.1 案例背景 336

16.1.1 项目概况 336

16.1.2 分析思路/商业理解 339

16.2 数据理解与数据准备 340

16.2.1 费用数据分布 341

16.2.2 变量合并 342

16.2.3 极端值清理 343

16.2.4 病种分布考察 343

16.2.5 变量变换 344

16.3 采用聚类分析寻找费用类型 345

16.3.1 考虑用因子分析汇总信息 345

16.3.2 聚类分析方法简介 347

16.3.3 对费用数据进行聚类分析 349

16.4 住院费用影响因素的神经网络分析 352

16.4.1 模型简介 353

16.4.2 初步尝试用神经网络建模 355

16.4.3 对年龄离散化后重新建模 360

16.4.4 构建双因变量神经网络 362

16.4.5 进一步寻找更清晰的结果解释 364

16.5 不同疗法疗效与费用比较的神经网络分析 365

16.5.1 生成工作用数据集 365

16.5.2 进行神经网络的建模预测 367

16.5.3 模型预测值的比较 369

16.6 项目总结与讨论 370

16.6.1 研究结论 370

16.6.2 如何在数据挖掘方法体系和经典方法体系之间进行取舍 372

附录 Python插件和R插件的安装方法 374

参考文献 377

返回顶部