《MATLAB数据探索性分析》PDF下载

  • 购买积分:13 如何计算积分?
  • 作  者:(美)温迪·L.马丁内兹(Wendy L. Martinez),(美)安吉尔·R.马丁内兹(Angel R. Martinez),(美)杰弗瑞·L.索卡(Jeffrey L. Solka)著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2018
  • ISBN:9787302474999
  • 页数:352 页
图书介绍:介绍了探索性数据分析的概念和应用。包括维度压缩,聚类和可视化。应用大量实例展示方法。本书适合作为高等学校计算机或者电子信息类专业数据分析课程的参考教材。

第一部分 探索性数据分析综述 3

第1章 绪论 3

1.1何为探索性数据分析 3

1.2全文概述 5

1.3关于符号表示法 6

1.4本书使用的数据集 7

1.4.1非结构化文本文档 7

1.4.2基因表达数据 10

1.4.3Oronsay数据集 14

1.4.4软件检测 15

1.5数据变换 15

1.5.1幂变换 16

1.5.2标准化 17

1.5.3数据球面化 17

1.6深入阅读 19

练习 20

第二部分 模式发现的EDA方法 23

第2章 降维——线性方法 23

2.1简介 23

2.2主成分分析——PCA 25

2.2.1基于样本协方差矩阵的PCA 25

2.2.2基于样本相关矩阵的PCA 27

2.2.3应该保留多少个维度 27

2.3奇异值分解——SVD 31

2.4非负矩阵分解 34

2.5因子分析 37

2.6Fisher线性判别 40

2.7本征维数 44

2.7.1最近邻法 44

2.7.2关联维数 47

2.7.3最大似然法 48

2.7.4包数估计 49

2.8总结与深入阅读 50

练习 51

第3章 降维——非线性方法 55

3.1多维尺度分析——MDS 55

3.1.1度量MDS 56

3.1.2非度量MDS 62

3.2流形学习 68

3.2.1局部线性嵌入 68

3.2.2等距特征映射——ISOMAP 69

3.2.3海赛特征映射 70

3.3人工神经网络方法 73

3.3.1自组织映射 74

3.3.2生成式拓扑映射 76

3.3.3曲元分析 79

3.4总结与深入阅读 82

练习 83

第4章 数据巡查 85

4.1总体巡查法 85

4.1.1Torus Winding法 86

4.1.2伪总体巡查法 89

4.2插值巡查法 91

4.3投影追踪法 92

4.4投影追踪索引 98

4.4.1Posse卡方索引 98

4.4.2矩索引 99

4.5独立成分分析 100

4.6总结与深入阅读 103

练习 104

第5章 发现类 105

5.1简介 105

5.2层次聚类法 107

5.3优化方法——k均值聚类 111

5.4谱聚类 115

5.5文本聚类 117

5.5.1非负矩阵分解——回顾 117

5.5.2概率潜在语义分析 121

5.6聚类评估 124

5.6.1Rand索引 125

5.6.2同型相关 127

5.6.3上尾法 127

5.6.4轮廓图 129

5.6.5间隙统计 131

5.7总结与深入阅读 135

练习 137

第6章 基于模型的聚类 140

6.1基于模型的聚类方法概述 140

6.2有限混合模型 142

6.2.1多元有限混合模型 143

6.2.2分量模型——协方差矩阵约束 144

6.3最大期望算法 149

6.4基于模型的层次聚合聚类 152

6.5基于模型的聚类 154

6.6基于模型聚类的密度估计和判决分析 158

6.6.1模式识别介绍 158

6.6.2贝叶斯决策理论 158

6.6.3基于模型聚类的概率密度估计 160

6.7由混合模型生成随机数据 163

6.8总结与深入阅读 165

练习 167

第7章 平滑散点图 169

7.1简介 169

7.2loess 170

7.3鲁棒loess拟合 177

7.4loess残差分析与诊断 179

7.4.1残差图 180

7.4.2散布平滑 183

7.4.3loess包络——向上和向下平滑 184

7.5平滑样条及应用 185

7.5.1样条回归 185

7.5.2平滑样条 187

7.5.3均匀间隔数据的平滑样条 191

7.6选择平滑参数 193

7.7二元分布平滑 195

7.7.1中间平滑对 196

7.7.2极平滑 198

7.8曲线拟合工具箱 201

7.9总结与深入阅读 202

练习 203

第三部分 EDA的图形方法 209

第8章 聚类可视化 209

8.1树状图 209

8.2树图 211

8.3矩形图 213

8.4ReClus图 216

8.5数据图像 220

8.6总结与深入阅读 223

练习 224

第9章 分布图形 226

9.1直方图 226

9.1.1一元直方图 226

9.1.2二元直方图 231

9.2箱线图 232

9.2.1基本箱线图 233

9.2.2基本箱线图的变形 237

9.3分位数图 240

9.3.1概率图 240

9.3.2q-q图 241

9.3.3分位数图 245

9.4袋状图 246

9.5测距仪箱线图 247

9.6总结与深入阅读 250

练习 251

第10章 多元可视化 253

10.1象形图 253

10.2散点图 255

10.2.1 2D和3D散点图 255

10.2.2散点图矩阵 257

10.2.3六边形分组散点图 259

10.3动态图 260

10.3.1识别数据 261

10.3.2关联 263

10.3.3笔刷 265

10.4协同图 267

10.5点阵图 269

10.5.1基本点阵图 269

10.5.2多路点阵图 270

10.6绘点为线 274

10.6.1平行坐标图 274

10.6.2安德鲁曲线 276

10.6.3安德鲁图像 278

10.6.4其他绘图矩阵 280

10.7再看数据巡查 282

10.7.1总体巡查 282

10.7.2组合巡查 283

10.8双标图 285

10.9总结与深入阅读 287

练习 289

附录A 近似度量 292

A.1定义 292

A.1.1相异性 293

A.1.2相似性度量 294

A.1.3二值数据的相似性度量 294

A.1.4概率密度函数的相异性 295

A.2变换 295

A.3进阶阅读 296

附录B EDA相关软件资源 297

B.1MATLAB程序 297

B.2其他EDA程序 300

B.3EDA工具箱 301

附录C 数据集的描述 302

附录D MATLAB工具使用要点 306

D.1MATLAB简介 306

D.2在MATLAB中获得帮助 307

D.3文件和工作空间管理 307

D.4MATLAB的标点符号 308

D.5算术运算符 309

D.6MATLAB的数据结构 309

D.6.1基本数据结构 309

D.6.2构建数组 309

D.6.3元胞数组 310

D.6.4结构体 311

D.7脚本文件与函数 311

D.8控制流 311

D.8.1for循环 312

D.8.2while循环 312

D.8.3条件分支语句 312

D.8.4开关语句 313

D.9基本绘图 313

D.10如何获取MATLAB信息 315

附录E MATLAB函数 316

E.1MATLAB 316

E.2统计工具箱 318

E.3EDA工具箱 320

E.4EDA图形界面工具箱 322

参考文献 332