第1章 大数据概述 1
一、大数据的数字特征 3
二、大数据的图表示 6
练习1 12
第2章 聚类分析 13
一、相似性度量 13
二、系统聚类法 17
三、变量聚类法 23
四、动态聚类法 28
练习2 29
第3章 判别分析 31
一、距离判别 31
二、费歇判别 38
三、贝叶斯判别 42
练习3 50
第4章 主成分分析 51
一、基本思想 51
二、样本主成分 52
三、特征值因子的筛选 57
四、主成分分类 66
练习4 68
第5章 因子分析 69
一、因子分析模型 70
二、因子旋转 73
三、因子得分 76
练习5 82
第6章 线性模型 83
一、线性模型及参数的最小二乘估计 83
二、最小二乘估计的性质 85
三、线性模型的显著性检验 87
四、正回归 93
练习6 96
第7章 回归诊断 98
一、残差 102
二、残差图 106
三、异常点 110
练习7 113
第8章 有偏估计 115
一、均匀压缩估计 115
二、主成分估计 117
三、岭估计 122
练习8 126
第9章 变量选择 128
一、变量选择准则 128
二、逐步回归 130
三、绝对约束估计 132
四、弹性约束估计 135
五、非负约束估计 139
练习9 142
练习提示与参考答案 143
参考文献 152
附录R应用程序 153