《探索性数据分析 基于JMP软件 引进版》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)罗伯特·卡弗著;上海财经大学统计与管理学院译
  • 出 版 社:上海:上海财经大学出版社
  • 出版年份:2013
  • ISBN:9787564217105
  • 页数:288 页
图书介绍:本书主要基于JMP软件研究了探索性数据分析的相关问题。探索性数据分析是指对已有的数据在尽量少的先验假定下进行探索的一种数据分析方法,使用JMP软件将有助于探索性数据分析的实现,本书就是探索了相关的方法。

第一章 开始上手:JMP的介绍 1

数据分析的目的:描述和推断 1

数据的类型 2

打开JMP 3

一个简单的数据表 4

红色三角形 7

分析平台——描述性分析 9

行状态 11

导出JMP结果至一个word文档 13

保存结果 13

退出JMP 14

第二章 理解数据 15

总体、过程和样本 15

代表性和抽样 16

简单随机抽样 17

分层抽样、整群抽样和复合抽样 18

非随机抽样 21

横截面和时间序列抽样 21

研究设计:实验、观测、调查 21

实验数据——一个案例 22

观测数据——一个案例 24

调查数据——一个案例 25

把数据写入数据表 27

从键盘输入数据 27

从Excel文件中转移数据至JMP数据表 31

案例 31

第三章 单变量描述 33

分布的概念 33

变量类型及其分布 34

定类变量的分布 35

定量变量的分布 39

选择数据表的一部分 39

连续型数据直方图的构建 40

利用链接的图表优势进行探索性数据分析 44

在直方图中自定义尺度和直条 45

茎叶图 45

单变量的汇总统计量 46

离群值盒形图 48

案例 49

第四章 同时描述两个变量 52

2乘2表:二元数据 52

共同变化描述:两个定类变量 53

共同变化描述:两个连续变量 58

两组比较:一个连续变量,一个定类变量 61

利用图形生成器观察共同变化 62

案例 64

第五章 概率基础与离散分布 68

概率理论与数据分析 68

概率理论基础 69

事件的概率 70

两事件之间的关系 70

概率赋值 71

列联表及概率 71

离散随机变量:从事件到数值 74

三种常见的离散分布 74

离散均匀分布 75

二项分布 76

泊松分布 78

用JMP模拟随机数 78

案例 81

第六章 正态模型 84

连续数据与概率 84

密度函数 85

正态分布 87

正态分布的计算 87

累积概率分布计算 88

逆累积分布计算 90

数据正态性检验 91

正态分位数图 91

模拟正态分布数据 94

案例 94

第七章 抽样和抽样分布 97

为什么要抽样? 97

抽样方法 98

使用JMP选择一个简单随机抽样 98

所有可能的样本:抽样分布 101

样本变化的程度 102

样本比例的抽样分布 103

从模拟到一般化 106

样本均值的抽样分布 106

中心极限定理 109

案例 110

第八章 单个定类变量的统计推断 113

两类统计推断任务 113

统计推断的假设条件 114

置信区间 115

用JMP实现总体比例的估计 115

完整数据情形 115

汇总数据情形 117

用JMP来进行显著性检验 118

关于犯错的一些说明 121

案例 121

第九章 单个连续变量的统计推断 124

统计推断的假设条件 124

用JMP来估计变量的均值参数 125

用JMP来进行显著性检验 126

关于P-值的进一步讨论 128

检验的功效 129

当假设条件不满足时的修正 131

配对问题:单变量、成对测量值 132

案例 133

第十章 连续变量的两样本统计推断 136

统计推断的假设条件 136

用JMP实现两样本的均值比较 137

假定正态分布或者中心极限定理适用 137

考虑抽样加权(可选章节) 140

等方差与异方差 140

处理非正态分布情形 141

用JMP实现两样本方差比较 143

案例 144

第十一章 卡方检验 147

定类变量的进一步推断 147

拟合优度卡方检验 148

检验的假设条件 150

关于两个定类变量的推断 150

再次讨论列联表 151

独立性卡方检验 152

检验的假设条件 154

案例 154

第十二章 方差分析 156

检验的假设条件 156

单因子方差分析 157

检测假设的有效性 159

主效应的因子分析 161

当条件不满足时所采用的方法 164

两因子方差分析 165

评估假设 166

交互作用和主效应 167

案例 170

第十三章 简单线性回归 174

对二元连续型数据进行线性拟合 174

简单线性回归模型 178

线性 179

随机误差 179

经典线性回归模型的假设 180

回归结果的解释 180

拟合概述 181

失拟 181

方差分析 182

参数估计和t-检验 182

对非零斜率的假设检验 183

案例 185

第十四章 回归条件和估计 189

最小二乘估计的条件 189

残差分析 190

线性 191

非线性 193

影响点 193

正态性 195

常数方差 196

独立性 196

估计 197

参数的置信区间 198

Y|X的置信区间 199

Y|X的预测区间 200

案例 201

第十五章 多元回归 204

多元回归模型 204

可视化多元回归 205

模型拟合 206

一个更加复杂的模型 209

拟合模型的残差分析 211

共线性 212

一个没有共线性问题的例子 213

共线性的例子 215

共线性的处理 216

评估替代模型 217

案例 219

第十六章 定类(非数值型)和非线性回归模型 222

引言 222

二分类自变量 223

二分类因变量 225

非线性关系 227

整体模型检验 227

参数估计值 227

效应似然比检验 228

二次模型 229

对数模型 232

案例 235

第十七章 基本预测技术 238

检验随时间变化的趋势 238

平滑方法 240

简单指数平滑 241

线性指数平滑(Holt方法) 243

Winters方法 243

趋势分析 244

自回归模型 245

案例 248

第十八章 实验设计的原理 251

实验性和观察性研究 251

实验设计的目的 252

因子,区组,随机化 253

多因子实验和析因设计 253

区组化 257

部分析因设计 260

响应面设计 263

案例 266

第十九章 质量改进 270

过程和变异 270

控制图 271

单个观测值运行图 272

均值控制图 272

比例控制图 278

能力分析 280

Pareto图 282

案例 283

附录:数据来源 286

简介 286

数据列表及其来源 287

后记 288