《统计分析方法 SAS实例精选》PDF下载

  • 购买积分:15 如何计算积分?
  • 作  者:曲庆云,赵晓梅,阮桂海等编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2004
  • ISBN:7302091293
  • 页数:486 页
图书介绍:本书采用对话框法与编程法对照的方式介绍了各种基本统计分析法,及SAS在其中的应用。

1.1调查研究的主要方法 1

第1章 社会调查的方法 1

1.2问卷调查法 2

1.2.1问卷的主要类型 2

1.2.2问卷的基本结构 3

1.2.3问卷设计的原则 9

1.2.4问卷中问题的设计与答案的构思 9

1.2.5问卷设计中的常见错误 13

1.3社会调查的量表法 14

1.3.1量表法的作用 14

1.3.2利克特量表的应用 15

习题 16

第2章 SAS系统功能简介 17

2.1 SAS的运行条件 17

2.3.1一个简单的SAS程序例子 18

2.2 SAS自身的程序结构 18

2.3 SAS的程序行 18

2.3.2 SAS的操作命令 21

2.3.3 SAS的数据编码 22

2.3.4另一个简单的SAS编程 24

习题 26

第3章 SAS的数据定义与数据变换 27

3.1 SAS的数据定义 27

3.2定义自由格式的数据 28

3.3定义固定格式的数据 28

3.4一行多个观察值的数据(自由格式的扩充) 30

3.5数据的读取与显示 31

3.5.1缺失值的表示法 31

3.5.2 LIST命令 31

3.6用INFILE命令调用外部数据文件 32

3.5.3通过CARDS命令(或DATALINES命令)读取数据 32

3.7用IF命令语句进行条件转换 33

3.8用DELETE命令语句进行有条件删除 34

3.9用GO TO命令语句作为有条件的“转移” 34

3.10用LABEL命令定义变量标签 35

3.11用FORMAT过程定义数值标签 35

3.12用RETAIN命令预置变量值 36

3.13创建新变量以及用SUM等函数求和 36

3.13.1创建“求和”的新变量名 37

3.13.2用“SUM函数”累加法包含缺失值的累加 38

3.14数据的重新编码 39

3.15命令用法综述 41

习题 42

4.1 Analyst对话框(第1个视窗) 43

第4章 采用SAS对话框进行数据输入管理与统计 43

4.2 ASSIST视窗 44

4.2.1进入ASSIST视窗 44

4.2.2 ASSIST视窗介绍 45

4.2.3 REPORTWRITING模块 46

4.2.4 GRAPHICS模块 47

4.3LAB视窗 48

4.3.1进入LAB视窗 48

4.3.2 LAB功能的应用实例 49

4.4在LAB视窗中新建SAS数据集的利弊 51

4.4.1进入LAB的编辑区 51

4.4.2新数据集的建立 52

4.5在Work工作区中直接输入SAS数据集的利弊 54

习题 55

5.1总体与样本 56

5.2参数与统计量 56

第5章 SAS统计分析的预备知识 56

5.3正态分布 57

5.4经验规则的应用 58

5.5正态分布的假设检验 58

5.5.1检验正态性的重要统计量 59

5.5.2检验正态性的其他附加方法 60

5.6显著性水平与a(Alpha)值 62

习题 63

第6章 SAS程序设计技巧及报表的汉化 64

6.1用PUT语句改变输出的格局 64

6.2用SET语句复制数据集 65

6.3用DATA语句与BY语句定义数据集 66

6.4用_NULL_快速运行程序 67

6.5输出结果的汉化 68

6.5.1可汉化的命令语句 68

6.6.1数据行排序的语法规则 69

6.5.2汉化报表的步骤 69

6.6数据行排序 69

6.6.2采用ASSIST视窗中的SORT菜单排序 71

6.7一个完整的程序例子 75

习题 76

第7章 编程法绘图与对话框法绘图的效果对比 77

7.1采用编程法和对话框法绘制条形图 77

7.1.1SAS程序的编辑及数据集的生成 77

7.1.2采用编程法产生的条形图 78

7.1.3采用对话框法所产生的条形图 79

7.1.4条形图的对比 81

7.2采用编程法和对话框法绘制圆形图 81

7.2.1采用编程法绘制圆形图 81

7.3.1采用编程法绘制等高线图 82

7.3采用编程法和对话框法绘制等高线图 82

7.2.3圆形图的对比 82

7.2.2对话框法绘制的圆形图 82

7.3.2采用对话框法绘制等高线图 84

7.3.3等高线图的对比 85

7.4采用编程法和对话框法绘制空间立体图形 86

7.4.1采用编程法绘制“牛仔帽” 86

7.4.2采用对话框法绘制的“牛仔帽” 87

7.4.3“牛仔帽”的对比 87

习题 88

第8章 SAS平面图形 89

8.1绘制曲线散点图 89

8.1.1采用ASSIST视窗中的GRPHICS对话框绘制曲线散点图 89

8.1.2调用PLOT过程制作散点图 90

8.2调用CHART过程的VBAR及HBAR命令绘制条形图 91

8.2.1命令格式 91

8.2.2 SUMVAR关键词的使用 92

8.2.3 SUMVAR子命令与DISCRETE关键词的搭配 94

8.2.4 SUBGROUP与GROUP关键词的搭配 95

8.3调用CHART过程的BLOCK命令绘图 98

8.3.1区域图与条形图、圆形图、星点图的公共选择项 98

8.3.2采用BLOCK语句绘制区域图 99

8.3.3调用CHART过程的PIE命令绘制圆形图 102

8.4采用GRAPHICS对话框绘制实心圆形图 104

习题 106

第9章 频数统计 107

9.1采用Analyst中的对话框统计频数 107

9.1.1数据与标签 107

9.1.2采用Analyst对话框统计sex和edc的频数分布 108

9.2调用FREQ过程中的TABLES命令统计频率表 110

9.2.2格式的顺序 111

9.2.1TABLES命令(语句)格式 111

9.3.1UNIVARITE的命令格式 114

9.3.2 UNIVARITE命令格式的应用 114

9.3调用UNIVARITE过程统计更详尽的频率表 114

9.3.3对UNIVARITE输出结果的分析 115

9.3.4分析UNIVARITE命令所产生的图形 116

习题 118

第10章 交叉汇总表及相关测量 119

10.1采用Analyst对话框进行双变量的交叉汇总分析 119

10.1.1数据与统计方法 119

10.1.2结果分析 123

10.2采用编程法进行双变量的交叉汇总分析 124

10.2.1双变量交叉汇总的命令格式 125

10.2.2关键字注释 125

10.2.3程序及输出结果 126

10.3附加控制变量的交叉汇总表及结合测量 128

10.2.4结果分析 128

10.4分析交叉汇总表中的单元内容 130

10.5两个地区的老年人与受教育水平相互关系的比较 131

10.5.1东城区的老年人与受教育水平的相互关系 131

10.5.2西城区的老年人与受教育水平的相互关系 132

习题 132

第11章 调用MEANS进行描述性统计 133

11.1采用Analyst中的对话框计算均值分布 133

11.2采用PROC MEANS计算均值分布 136

11.2.1 PROC MEANS过程的格式 136

11.2.2格式说明 136

11.2.3程序与图例 138

11.2.4结果分析 140

习题 141

12.2皮尔逊积差相关(用于“比例-比例”型变量) 142

第12章 相关矩阵及各种相关分析 142

12.1 4种类型的变量 142

12.2.1皮尔逊相关系数R的计算公式 143

12.2.2皮尔逊相关系数的测量 143

12.2.3皮尔逊相关系数R的分析 146

12.3皮尔逊二分“点-距”相关(用于“二分-区间以上”变量) 146

12.4肯氏等级相关系数τb(用于“次序-次序”型等级变量) 146

12.4.1计算肯氏等级相关系数的数据 147

12.4.2采用Analyst对话框计算肯氏相关系数τb 148

12.4.3肯氏相关系数τb的结果分析 151

12.5肯氏另一相关系数(用于“次序-比率”型变量) 151

12.5.1次序-比率数据的例子 151

12.5.2计算“次序-比率”数据的肯氏相关系数 152

12.6.1斯皮尔曼等级相关系数的计算公式 155

12.6.2首先采用Analyst对话框进行统计 155

12.6斯皮尔曼等级相关(“次序-次序”等级变量) 155

12.5.3肯氏相关系数τb的结果分析 155

12.6.3 Spearman相关系数的分析 157

12.7 Phi系数和V系数(用于“标称-标称”型变量) 157

12.8 Cronbach的Alpha系数 158

12.9 Hoeffding的相关系数D 158

12.10调用PROC CORR过程进行各种相关分析(编程法) 159

12.10.1 PROC CORR的语句格式 159

12.10.2 PROC CORR语句中的选择项 160

12.10.3 PROC CORR后面的5种语句 161

习题 166

第13章 独立组样本与配对组样本的T检验 168

13.1从独立组的样本中概括数据 168

13.1.1首先采用PROC SORT和PROC MEANS语句描述数据 168

13.1.2采用PROC CHART过程进行组间图形比较 169

13.2.1采用对话框进行独立组样本TTEST 171

13.2独立组样本TTEST的假设与检验 171

13.2.2采用过程PROC TTEST语句进行独立样本T检验 174

13.3两组独立样本的Wilcoxon秩和检验 175

13.4从配对组样本中概括数据 177

13.4.1首先用Means和Chart语句概括配对差值 178

13.4.2配对组差值的描述 179

13.5配对差值的T检验 179

13.5.1配对差值T检验的假设检验 179

13.5.2采用PROC UNIVARIATE过程进行配对差值T检验的程序 180

13.5.3对UNIVARIATE过程的结果进行配对差值T检验 180

13.6.1仍用PROC UNIVARIATE过程进行Wilcoxon秩和检验 181

13.6.2配对差值的Wilcoxon秩和检验 181

13.6配对差值的Wilcoxon秩和检验 181

13.6.3配对差值的Wilcoxon秩和检验小结 182

13.7两组均值比较的总结 182

习题 183

第14章 多因素二水平排列组合方差分析(ANOVA应用一) 185

14.1 2×2排列组合式方差分析 185

14.1.1编程进行2×2排列组合方差分析 185

14.1.2结果与分析 186

14.2 3因素2水平排列组合式方差分析 187

14.2.1首先用语句进行3因素2水平组合的方差分析 188

14.2.2结果与分析 189

14.3 3个随机配伍组设计的方差分析 190

14.3.1建立SAS语句文件 191

14.3.2结果与分析 192

14.3.3单击对话框进行随机块方差分析 194

14.4.1实验例子 197

14.4多个随机实验组与一个对照组的均值比较 197

14.4.2结果分析 198

14.4.3单击对话框进行随机块方差分析 199

习题 199

第15章 方差分析(ANOVA应用二) 201

15.1方差分析的条件 201

15.1.1方差分析的假定 201

15.1.2方差分析的检验 201

15.1.3功能模块 202

15.2采用ANOVA的主对话框进行方差分析 202

15.3单因素方差分析实例 204

15.3.1打开One-Way ANOVA对话框 204

15.3.2设置单因素方差分析的变量 205

15.3.3设置单因素方差分析中的Means 205

15.3.5设置单因素方差分析(One-Way ANOVA)中的Plots 208

15.3.4设置单因素方差分析中的Tests 208

15.3.6 One-Way ANOVA的输出结果 209

15.3.7单因素ANOVA的结果分析 212

15.3.8采用ANOVA语句进行One-Way ANOVA分析 213

15.4双因素方差分析(ANOVA) 215

15.4.1双因素方差分析的模型概述 216

15.4.2双因素方差分析的假设与检验 217

15.4.3采用Analyst对话框进行双因素方差分析 218

15.5多因变量方差分析MANOVA 222

15.5.1MANOVA应用实例 222

15.5.2采用Analyst对话框进行多因变量方差分析 223

15.5.3多因变量方差分析的输出结果及其分析 224

15.5.4采用MANOVA语句进行多因变量方差分析 227

15.6方差反复测量(Repeated ANOVA) 229

15.6.1采用Analyst对话框进行方差反复测量分析 229

156.2方差反复测量的结果分析 231

习题 233

15.6.3采用REPEATED语句进行方差的反复测量 233

第16章 因子分析 235

16.1具有共性的元素 235

16.2因子分析的模型 236

16.3因子分析的4个阶段 236

16.4抽取因子(Factor extraction)的方法 236

16.5抽取前两三个因子 237

16.6对前3个因子的进一步研究 238

16.7转轴方式 240

16.8因子分析与因子得分 241

16.8.1因子分析 241

16.8.2因子得分 242

16.9.1 FACTOR语句格式 243

16.9.2 FACTOR主语句中常用的任选项 243

16.9运行过程FACTOR 243

16.9.3应用实例 244

16.10存储因子得分 244

16.11主成分分析(过程PINCOMP) 247

16.11.1主成分分析实例(犯罪率实例) 247

16.11.2采用Analyst对话框进行主成分分析 248

16.11.3采用编程法进行主成分分析 251

习题 258

第17章 判别分析 261

17.1判别分析的原理 261

17.2 3种主要的判别分析法 261

17.3一般判别分析法实例 261

17.3.1编程法 262

17.3.2一般判别分析的输出结果 263

17.3.3结果分析 266

17.4采用逐步判别分析法 268

习题 269

17.5采用典型判别分析法 269

第18章 聚类分析 270

18.1 4种聚类方法 270

18.2 CLUSTER凝聚算法 270

18.3 CLUSTER过程的命令语句 271

18.3.1 CLUSTER语句格式 271

18.3.2 PROC CLUSTER主语句中的选项 271

18.3.3OUTTREE输出说明 272

18.3.4CLUSTER应用实例 272

18.3.5CLUSTER实例分析之一:统计量 274

18.3.6CLUSTER实例分析之二:树形图 275

18.4.1FASTCLUS的语句格式 276

18.4.2任选项 276

18.4大样本的观察值聚类法(过程FASTCLUS的应用) 276

18.4.3注意事项 277

18.4.4 FASTCLUS过程实例 278

18.5对变量的R聚类(Varclus语句) 280

18.5.1 VARCLUS语句格式 280

18.5.2 PROC VARCLUS主语句中的任选项 280

18.5.3注意要点 282

18.5.4 VARCLUS应用实例 283

18.5.5 VARCLUS过程产生的冰柱图 286

18.6树形结构图 286

18.6.1 PROC TREE语句格式 286

18.6.2 PROC TREE主语句中的任选项 287

18.6.3 PROC TREE的医学应用实例 288

习题 290

第19章 时间序列分析 291

19.1季节性调整 291

19.1.1采用ASSIST对话框进行统计分析 292

19.1.2结果分析 297

19.1.3实际的患者人次与季节化预测的患者人次 298

19.2从回归分析中建立回归预测模型 298

19.21回归分析的程序 299

19.2.2回归分析的输出与预测分析 299

习题 300

第20章 采用REG过程进行多元线性回归分析 301

20.1采用Analyst对话框进行多元线性回归分析 301

20.2采用REG过程进行多元线性回归分析 306

20.2.1REG程序中的语句及其任选项 307

20.2.2 REG程序中主要语句及关键词的分解 307

20.3应用REG过程的进一步实例 311

20.4 MAXR回归法和RSQUARE回归法 317

20.4.1MAXR回归法 317

20.4.3实用程序及图例 318

20.4.2 RSQUARE回归法 318

习题 322

第21章 SAS与SPSS及数据库之间的数据互动 323

21.1采用PROC DBF过程调用数据库数据进行统计 323

21.1.1 PROC DBF过程的语句格式 323

21.1.2应用举例 323

21.2采用SAS对话框调用数据库数据进行统计 324

21.2.1在SAS对话框中调用数据库数据 324

21.2.2统计分析数据库的数据 326

21.3采用SAS对话框调用SPSS的目标数据*SAV 326

21.3.1在SPSS系统存储Delimited类型的文件 327

21.3.2调用定界型的文件(B96Tab.dat)到SAS系统 328

21.4采用对话框将SAS数据集转换为SPSS的*.SAV数据 329

21.4.1暂存为Delimited File类型 331

21.4.2将Delimited类型的数据转换成SPSS的*.SAV目标数据 331

21.4.3检验数据是否转换成功 334

习题 335

第22章 用Conjoint Analysis研究品牌 336

22.1结合分析的基本原理与思路 336

22.2通过正交设计建立卡片 336

22.3精品购物的问卷调查例子 337

22.4如何做好结合分析 338

22.5结合分析的结果研究 339

22.6市场预测与决策 341

习题 342

第23章 高级绘图系统GRAPH 343

23.1GRAPH模块中的应用过程 343

23.1.1GRAPH绘图系统的环境及输出方式 344

23.1.2GRAPH的系统环境 344

23.1.3GRAPH的输出方式 345

23.2.1GSLIDE主语句格式 346

23.2采用GSLIDE过程修饰图形 346

23.2.2GSLIDE主语句中的任选项1 347

23.2.3辅助语句中的任选项2 347

23.3采用GCHART过程绘制各种彩图 349

23.3.1GCHART中的语句 349

23.3.2主语句GCHART中的任选项1 349

23.3.3HBAR和VBAR语句中的任选项2 349

23.3.4BLOCK(区域图)中的选项3 352

23.3.5PIE和STAR语句的任选项 352

23.3.6PATTERN语句中的选项 353

23.4采用GPLOT过程绘制曲线图 354

23.4.1GPLOT过程中的语句格式 355

23.4.2主语句GPLOT中的选项 355

23.4.3绘图语句PLOT中的选项1 355

23.4.4BUBBLE语句中的选项2 356

23.4.5 SYMBOL语句中的选项3 357

23.5采用G3D过程绘制三维图形 359

23.5.1 G3D中的语句格式 359

23.5.2 G3D中的PLOT语句及其选项1 359

23.5.3 SCATTER语句中的选项2 361

23.6采用G3GRID过程内插网格点 363

23.6.1主语句G3GRID中的选项1 364

23.6.2 GRID语句中选项2 364

23.7采用GCONTOUR过程绘制等高线图 366

23.7.1 GCONTOUR过程语句 366

23.7.2 PLOT语句及其选项2 366

23.8用对话框绘制图形的弊病 369

23.9命令法与对话框法绘制等高线图的对比 372

第24章 路径分析 373

24.1用以路径分析的数据和程序 373

24.2图形输出 374

24.3路径图的分析方法 377

习题 378

第25章 非线性回归分析之一(对数与多项式回归) 379

251对数曲线回归 379

25.1.1选择对数曲线回归的数据及程序 379

25.1.2对数曲线回归的运行法 380

25.2对数曲线回归分析 380

25.3拟合抛物线的多项式回归 384

25.3.1多项式回归分析的原始数据 384

25.3.2多项式回归的方程式 384

25.3.3多项式回归的SAS程序 384

25.4多项式回归的结果与分析 385

25.4.1编程法多项式回归的结果分析 385

25.4.2用Analyst对话框法替代编程法的多项式回归分析 387

习题 390

25.4.3大学生生长发育拟合二次曲线模型 390

第26章 非线性回归之二(Logistic回归与指数回归) 392

26.1拟合Logistic曲线回归(人口增长方面的一个例子) 392

26.2从Logistic曲线模型解出初始值 393

26.2.1建立非线性回归模型 393

26.2.2拟合Logistic曲线回归中初始值A、B、C的解 393

26.2.3将A、B、C系数代入Logistic曲线模型 394

26.3拟合Logistic曲线回归的分析 395

26.3.1参数估计 395

26.3.2参数近似的置信区间 396

26.3.3采用Logistic曲线预测人口 398

26.4负指数生长曲线回归 398

26.4.1何时采用负指数生长曲线模型 398

26.4.2负指数生长的数据例子 398

26.4.5通过编程建立负指数生长曲线模型 399

26.4.4将B0、B1值代入负指数生长曲线模型 399

26.4.3拟合负指数生长曲线的初始值的解 399

26.5拟合负指数生长曲线的回归分析 400

26.5.1参数估计 400

26.5.2负指数生长曲线的模型 403

26.6拟合指数曲线Y=AeBx回归 403

26.6.1建立指数曲线Y=AeBx的回归模型 403

26.6.2指数曲线Y=AeBx的回归结果与分析 404

26.6.3指数曲线的预测 406

习题 406

第27章 Logistic Regression过程的应用 407

27.1 Logistic Regression模型 407

27.2 Logistic Regression对变量及其数据的要求 408

27.3采用Analyst对话框进行Logistic回归 409

27.4采用PROC Logistic编程法进行逻辑斯谛回归 413

27.5.1回归系数的假设检验 415

27.5假设与检验 415

27.5.3偏相关系数R 416

27.6对回归系数的解释 416

27.5.2不能拒绝原假设 416

27.6.1用Log值解释Odds(优势)值 417

27.6.2用“概率比”解释回归模型 417

27.7概率预测 417

27.8多分变量的编码 418

习题 419

第28章 四方格Logistic Regression分析 420

28.1四方格Logistic Regression模型 420

28.2四方格Logistic Regression的变量及其数据 420

28.3采用Analyst对话框进行四方格Logistic回归 421

28.4四方格Logistic回归分析 425

习题 426

29.1最小平方法的原理 427

第29章 采用GLM过程进行回归分析和协方差分析 427

29.1.1方差分析 428

29.1.2 F统计量 429

29.1.3回归系数B的计算法 429

29.1.4相关矩阵R与相关系数 429

29.1.5判定系数R2 430

29.1.6残差分析 430

29.1.7 DW(Durbin-Watson)统计量D 430

29.2 GLM过程的命令语句 431

29.3 GLM过程中各语句的使用说明 431

29.3.1主语句PROC GLM的说明 432

29.3.2 CLASS语句 432

29.3.3 MODEL语句 432

29.3.4 CONTRAST(对照)语句 434

29.3.6 LSMEANS语句 435

29.3.5 ESTIMATE语句 435

29.3.8 OUTPUT语句 436

29.3.7 MANOVA语句 436

29.3.9 RANDOM语句 437

29.3.10 REPEATED语句 437

29.3.11其他语句 437

29.4调用GLM过程进行一元线性回归 437

29.4.1数据与程序 438

29.4.2输出结果 439

29.4.3结果分析 441

29.4.4写回归方程 443

29.5调用GLM程序进行多元线性回归分析 443

29.5.1GLM的源程序 443

29.5.2 GLM的输出结果 444

29.6.1多项式回归的一般模型 445

29.6.2多项式回归的实例 445

29.6调用GLM程序进行多项式回归 445

29.5.3 GLM的结果分析 445

29.7虚拟变量的用法 448

习题 449

第30章 多个随机实验组的协方差分析(GLM的应用) 451

30.1两组随机数据的协方差分析 451

30.1.1建立SAS语句文件 451

30.1.2结果与分析 452

30.2多因变量协方差分析 454

30.2.1建立SAS程序文件 455

30.2.2结果与分析 455

习题 457

附录 458

附录A 习题参考答案 458