《属性数据分析引论》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:史希来编著
  • 出 版 社:北京:北京大学出版社
  • 出版年份:2006
  • ISBN:7301077262
  • 页数:243 页
图书介绍:本书介绍社会调查中原始数据的处理方法,特别介绍列联表的特点和数据处理的方法。可以解决定性数据处理的统一方法。

第1章 绪论——从多元分析到列联表 1

1.1 结构化的原始数据 2

1.2 对欧氏空间定量观测数据的基本认识 3

1.3 多元分析中定量观测数据的回归分析方法 7

1.3.1 一元线性回归 7

1.3.2 多元线性回归 13

1.3.3 多因变量的线性回归方程组 17

1.4 相关系数矩阵 18

1.5 判别分析 22

1.6 因子分析(R型因子分析或主成分分析) 22

1.7 聚类分析 25

1.8 定性调查数据与列联表 26

1.8.1 从测量尺度上看本质上完全不同的两种数据 26

1.8.2 数量化理论 28

1.8.3 关于事件史分析 29

1.8.4 列联表是怎样产生的 31

思考题 32

第2章 列联表的相关分析 33

2.1 二维列联表的基本结构 33

2.2 与列联表有关的统计学概念 35

2.2.1 条件概率 35

2.2.2 事件的独立性 36

2.2.3 二维列联表概率表中变量独立的定义 37

2.2.4 二项分布与多项分布 38

2.2.5 列联表与多项分布 39

2.2.6 多项分布的x2统计量 40

2.2.7 最大似然估计的基本思想 41

2.2.8 列联表独立性假设检验中自由度的计算 42

2.3 列联表的x2独立性假设检验 43

2.3.1 列联表独立性假设检验的步骤 43

2.3.2 列联表独立性假设检验的例题 44

2.3.3 关于怎样看待x2统计量受个案总数n影响的问题 45

2.4 调查数据相关分析的实用方法与实例 47

思考题 60

第3章 高维列联表与属性空间 61

3.1 列联表的辛普森悖论(Simpson's paradox) 61

3.2 三维列联表及其表示方法 72

3.2.1 三维列联表是怎样形成的 72

3.2.2 三维列联表的表示方法 72

3.3 三维列联表的基本结构 74

3.4 四维以上的列联表及其表示方法 77

3.5 高维列联表与属性空间 78

3.6 组合爆炸 80

3.7 列联表的直观分析方法——马赛克图 82

3.8 马赛克图与列联表的相关分析 85

思考题 86

第4章 列联表的对数线性模型 87

4.1 二因子方差分析的线性模型 87

4.2 二维列联表的对数线性模型 94

4.2.1 概事表的比值 94

4.2.2 2×2表的对数线性模型 95

4.2.3 从2×2表看对数线性模型的基本性质 97

4.2.4 二维I×J表的对数线性模型 98

4.3 23表的对数线性模型 99

4.4 推广到一般列联表的对数线性模型 106

思考题 107

第5章 列联表的模型选择 108

5.1 层次模型与图模型 108

5.1.1 三维列联表与层次模型 108

5.1.2 四维列联表的图模型 109

5.2.1 模型选择的操作 114

5.2 模型选择 114

5.2.2 三维列联表模型选择中值得注意的几个问题 120

5.2.3 利用批作业完成对组合爆炸后的多个列联表的模型选择 125

5.2.4 获取批作业结果文件中有价值信息的方法 130

5.2.5 样本量n(个案数)对模型选择结果的影响 131

5.3 在模型选择基础上对列联表中变量的结构关系进行分析 132

思考题 132

第6章 可压缩定理与三维表的结构模型 133

6.1 三维列联表的可压缩定理 134

6.2 独立模型 134

6.2.1 以Z为层变量的偏表、边缘表、三维表和马赛克图 135

6.2.2 以Y为层变量的偏表、边缘表、三维表和马赛克图 137

6.3 单边模型 139

6.3.1 以Z为层变量的偏表、边缘表、三维表和马赛克图 140

6.3.2 以Y为层变量的偏表、边缘表、三维表和马赛克图 142

6.3.3 以X为层变量的偏表、边缘表、三维表和马赛克图 144

6.4 双边模型 147

6.4.1 以Z为层变量的偏表、边缘表、三维表和马赛克图 147

6.4.2 以Y为层变量的偏表、边缘表、三维表和马赛克图 149

6.4.3 以X为层变量的偏表、边缘表、三维表和马赛克图 151

6.5 三角模型 153

6.5.1 以Z为层变量的偏表、边缘表、三维表和马赛克图 154

6.5.2 以Y为层变量的偏表、边缘表、三维表和马赛克图 156

6.6 饱和模型 158

6.6.1 以Z为层变量的偏表、边缘表、三维表和马赛克图 158

6.6.2 以Y为层变量的偏表、边缘表、三维表和马赛克图 161

6.6.3 以X为层变量的偏表、边缘表、三维表和马赛克图 162

6.7 从各个方向偏表的叉积比看三角模型与饱和模型的区别 164

思考题 166

7.1 三个简单的例题 167

第7章 实例 167

7.2 真实生活中辛普森悖论的例题 172

7.3 调查数据中双边模型的例题 175

7.4 对组合爆炸后的所有三维表的结构关系进行模型选择的新方法 181

7.5 饱和模型的例题 186

7.6 从实例看三角模型与饱和模型的区别 192

7.7 对组合爆炸后四维列联表中有价值的结构关系所进行的分析 196

7.8 组合爆炸后的四维饱和模型 202

第8章 对线性回归方程的再讨论 205

8.1 对一元线性回归方程的讨论 205

8.1.1 第一种情况(自变量是定性的因变量是定量的) 206

8.1.2 第二种情况(自变量是定量的因变量是定性的) 206

8.1.3 第三种情况(自变量与因变量都是定性的) 208

8.2 对多元线性回归方程系数的讨论 209

8.2.1 定量观测数据多元线性回归的范例 209

8.2.2 对属性数据能否使用回归分析方法的讨论 211

8.2.3 Logistic线性回归方程与对数线性模型分析的比较 216

8.2.4 用回归系数比较自变量对因变量作用的例题 218

8.2.5 从一个事件史分析的例题中发现的问题 220

8.3 对回归方程系数标准化问题的讨论 223

8.4 关于多重共线性与回归系数不稳定 225

8.4.1 对产生多重共线性问题的理论认识 225

8.4.2 共线性与非线性对线性回归方程系数的影响 226

8.5 对属性数据进行Logistic线性回归时产生的问题 229

8.5.1 对饱和模型数据进行Logistic线性回归时产生的问题 229

8.5.2 用Logistic线性回归方程分析不同结构模型数据时所出现的问题 230

8.6 样本量对回归系数显著性的影响 231

8.7 引入了很多自变量的多元线性回归方程中会产生的问题 235

8.8 对社会调查数据分析不宜采用线性回归方程进行拟合的总结 236

8.9 关于其他统计学方法的解释说明 238

主要参考文献 243