《SAS统计分析应用 第2版》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:董大钧主编
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2014
  • ISBN:9787121227936
  • 页数:446 页
图书介绍:SAS是用于决策支持的大型集成信息系统,也是用来管理、分析数据和编写报告的组合软件系统。在数据挖掘技术、商业智能领域和统计分析领域中几乎处于垄断地位,是国际上最流行的标准企业管理软件。本书主要介绍SAS/BASE和SAS/STAT两部分内容以及SAS/GRAPH、SAS/INSIGHT等模块中的部分内容,并介绍了利用SAS/EM进行数据挖掘的简单用法。该书通过大量实例详细介绍了如何使用SAS语言编写程序,以及SAS统计软件包中许多基本统计过程的使用方法和结果分析。

绪论 1

第1章 SAS系统概述 3

1.1 SAS窗口系统 3

1.1.1 SAS系统的启动和退出 3

1.1.2 SAS窗口环境 4

1.1.3 程序编辑器(Editor)窗口 6

1.1.4 日志(LOG)窗口 8

1.1.5 输出(OUTPUT)窗口 8

1.1.6 结果(Results)窗口 9

1.1.7 改变窗口显示 9

1.1.8 打印和保存SAS活动窗口中的内容 9

1.1.9 KEYS窗口 10

1.2 SAS数据集 11

1.2.1 SAS数据集 11

1.2.2 数据集名 11

1.2.3 SAS逻辑库概述 11

1.2.4 创建逻辑库 12

1.2.5 用LIBNAME语句指定逻辑库引用名 13

1.2.6 创建逻辑库成员 13

1.2.7 删除逻辑库 14

1.3 SAS程序的输入与运行 14

1.3.1 SAS程序结构 14

1.3.2 SAS程序的输入、修改和运行 15

1.3.3 中断SAS会话 20

1.3.4 终止SAS过程 20

1.3.5 使用X语句或X指令运行Windows指令 20

1.4 SAS编程基础 20

1.4.1 观测 20

1.4.2 变量 20

1.4.3 常量 22

1.4.4 函数 24

1.4.5 操作符 29

1.4.6 SAS表达式 30

习题 31

第2章 建立数据集 33

2.1 SAS数据集 33

2.2 利用工具建立数据集 34

2.2.1 用Viewtable建立和编辑数据集 34

2.2.2 使用分析数据表 36

2.3 数据步建立数据集的基本语句 38

2.3.1 DATA语句 38

2.3.2 INPUT语句 40

2.3.3 INFILE语句 48

2.3.4 DATALINES和DATALINES4语句 59

2.4 数据步流程 61

2.5 提供信息的几个语句 61

2.5.1 LENGTH语句 61

2.5.2 LABEL语句 62

2.5.3 LOSTCARD语句 62

2.5.4 INFORMAT语句与FORMAT语句及SAS输入格式与输出格式 64

2.5.5 MISSING语句 70

2.5.6 注释语句 71

2.5.7 OPTIONS语句 71

2.6 建立数据集的另外几种途径 72

2.6.1 从外部文本数据文件中读入数据 72

2.6.2 从已建立的数据集中读入数据 72

2.6.3 从数据库文件中导入数据 73

习题 79

第3章 整理数据集 83

3.1 数据集中的数据格式 83

3.2 建立、删除与保留变量 84

3.2.1 赋值语句建立变量 84

3.2.2 求和语句 85

3.2.3 RETAIN语句 86

3.2.4 DROP语句删除变量 87

3.2.5 KEEP语句保留变量 87

3.3 条件语句 88

3.3.1 条件IF语句 88

3.3.2 求子集IF语句 93

3.4 SELECT语句 94

3.4.1 根据读入的值进行不同的计算 94

3.4.2 SELECT语句中使用DO组 95

3.4.3 SELECT判断用复合表达式 96

3.5 WHERE语句 97

3.6 删除观测 98

3.6.1 用DELETE语句删除观测 98

3.6.2 删除SAS数据集中的重复值 99

3.7 GOTO语句 100

3.8 RETURN语句 101

3.9 LINK语句 102

3.10 循环 103

3.10.1 利用GOTO实现循环 103

3.10.2 DO/END循环 103

3.10.3 DO WHILE循环 104

3.10.4 DO UNTIL循环 105

3.11 数组 106

3.11.1 数组与下标变量 106

3.11.2 在DO循环中使用数组 109

3.11.3 多维数组 110

3.12 数据排序 111

3.12.1 PROC SORT过程 111

3.12.2 分组控制 113

3.13 数据集连接 114

3.13.1 SET语句 114

3.13.2 利用MERGE语句进行数据集的横向合并 117

3.14 输出信息 120

3.14.1 PUT语句格式 121

3.14.2 输出形式 121

3.15 FILENAME语句 124

3.16 FILE语句 127

3.17 OUTPUT语句 131

3.17.1 在一个数据步中创建一个以上的数据集 131

3.17.2 从一个输入行中创建几个观测 132

3.17.3 从几个记录合并信息 133

3.17.4 拆分数据集 134

3.18 DATASETS过程 135

3.18.1 PROC DATASETS过程语法 135

3.18.2 PROC DATASETS语句 136

3.18.3 APPEND语句 136

3.18.4 CHANGE语句 137

3.18.5 COPY语句 137

3.18.6 SELECT语句 137

3.18.7 CONTENTS语句 138

3.18.8 MODIFY语句 139

3.18.9 FORMAT语句 139

3.18.10 INFORMAT语句 140

3.18.11 LABEL语句 140

3.18.12 RENAME语句 140

习题 141

第4章 SAS过程步中的常用语句 148

4.1 PROC语句 148

4.2 BY语句 148

4.3 CLASS语句 149

4.4 VAR语句 149

4.5 WEIGHT语句 150

4.6 FREQ语句 150

4.7 ID语句 151

4.8 OUTPUT语句 152

4.9 TITLE语句 153

习题 153

第5章 SAS实用过程 154

5.1 PRINT过程 154

5.1.1 语句说明 154

5.1.2 应用举例 155

5.2 FORMAT过程 157

5.2.1 概述 157

5.2.2 语法说明 158

5.2.3 举例 161

5.3 TRANSPOSE过程 166

5.3.1 概述 166

5.3.2 语句说明 167

5.4 查询数据 172

5.4.1 概述 172

5.4.2 PROC SQL语句 174

5.4.3 CREATE TABLE语句 174

5.4.4 用INSERT INTO语句向表中插入数据 175

5.4.5 用SELECT语句进行查询 176

5.4.6 CREATE VIEW语句 178

5.4.7 DELETE语句 178

5.4.8 DROP语句 178

5.4.9 举例 178

5.5 PROC PRINTTO过程 180

习题 182

第6章 ODS输出交付系统 185

6.1 ODS概述 185

6.1.1 ODS LISTINC语句 186

6.1.2 ODS OUTPUT语句 187

6.1.3 ODS TRACE语句 188

6.1.4 选择或排除部分输出 189

6.1.5 ODS HTML语句 190

6.1.6 ODS PDF语句 193

6.1.7 ODS RTF语句 194

6.1.8 ODS PRINTER语句 195

6.1.9 ODS_all_CLOSE语句 195

6.2 PROC DOCUMENT过程 195

6.3 TEMPLATE过程简介 198

习题 199

第7章 描述性统计过程 201

7.1 统计概念简介 201

7.1.1 总体和样本 201

7.1.2 定位测量 201

7.1.3 离散程度测量 201

7.1.4 形状测量 202

7.1.5 正态分布 203

7.1.6 样本均值的分布 203

7.1.7 置信度和置信区间 203

7.1.8 统计关键字 203

7.1.9 单变量统计对数据的要求 204

7.2 MEANS过程 205

7.2.1 语句说明 205

7.2.2 举例 206

7.3 FREQ过程 208

7.3.1 简介 208

7.3.2 语句说明 211

7.3.3 列联表卡方检验 213

7.3.4 举例 213

7.4 TABULATE过程 215

7.4.1 简介 215

7.4.2 用菜单制作汇总表 217

7.4.3 语句说明 219

7.4.4 举例 221

7.5 UNIVARIATE过程 224

7.5.1 简介 224

7.5.2 语句说明 224

7.5.3 使用输出交付系统ODS 226

7.5.4 应用举例 227

7.6 PLOT过程 231

7.6.1 简介 231

7.6.2 语句说明 232

7.6.3 举例 233

7.7 CHART过程 235

7.7.1 简介 235

7.7.2 语句说明 236

7.7.3 选项说明 238

7.7.4 举例 240

7.8 RANK过程 242

7.8.1 简介 242

7.8.2 语句说明 242

7.8.3 应用 243

7.8.4 举例 244

习题 246

第8章 假设检验 248

8.1 假设检验简介 248

8.1.1 两样本均数差别的统计意义检验 248

8.1.2 t检验及类型 248

8.1.3 关于非正态分布资料均数差别的检验 249

8.1.4 双侧检验和单侧检验 249

8.2 用MEANS过程进行t检验 250

8.2.1 已知均值比较的t检验 250

8.2.2 配对比较的t检验 250

8.3 用TTEST过程进行t检验 251

8.3.1 TTEST过程格式 251

8.3.2 单样本t检验 253

8.3.3 成组实验的t检验 255

8.3.4 配对比较t检验 256

8.4 NPAR1WAY过程 258

8.4.1 语句说明 258

8.4.2 举例 259

习题 261

第9章 方差分析 263

9.1 概述 263

9.2 均衡数据的方差分析(ANOVA过程) 264

9.2.1 ANOVA过程的主要语句 264

9.2.2 语句说明 265

9.2.3 输出结果 266

9.3 ANOVA过程应用实例 267

9.3.1 完全随机设计资料的方差分析(单因素方差分析) 267

9.3.2 随机区组设计资料的方差分析(两因素方差分析) 270

9.3.3 拉丁方资料的方差分析 272

9.3.4 正交实验设计的方差分析 274

9.3.5 析因实验设计——三因素实验分析 275

9.3.6 R*C析因设计资料的方差分析(有交互因素的方差分析) 277

9.4 GLM过程 278

9.4.1 概述 278

9.4.2 过程使用的语句 278

9.4.3 四种类型的可估计函数 280

9.4.4 举例 280

9.5 协方差分析 283

9.5.1 协方差分析简介 283

9.5.2 举例 283

习题 287

第10章 相关与回归 289

10.1 概述 289

10.1.1 相关分析 289

10.1.2 回归分析 290

10.2 CORR过程 290

10.2.1 语句说明 290

10.2.2 举例 291

10.3 CANCORR过程 295

10.3.1 CANCORR过程介绍 295

10.3.2 应用举例 296

10.4 REG过程 302

10.4.1 REG过程使用的语句 302

10.4.2 举例 304

10.5 STEPWISE过程 308

10.5.1 STEPWISE过程简介 308

10.5.2 STEPWISE过程使用的语句 308

10.5.3 举例 309

10.6 非线性回归NLIN过程 311

10.6.1 非线性回归概述 311

10.6.2 过程说明 312

10.6.3 可能出现的问题 313

10.6.4 输出内容 314

10.6.5 举例 314

10.7 LOGISTIC过程 316

10.7.1 Logistic回归简介 316

10.7.2 模型的选择 317

10.7.3 LOGISTIC过程使用的语句 318

10.7.4 使用注意 320

10.7.5 LOGISTIC过程的应用 321

习题 326

第11章 判别分析 328

11.1 判别分析概述 328

11.2 DISCRIM过程 329

11.2.1 概述 329

11.2.2 DISCRIM过程使用的语句 330

11.2.3 DISCRIM过程的输出 332

11.2.4 应用举例 332

11.3 STEPDISC过程 340

11.3.1 概述 340

11.3.2 STEPDISC过程使用的语句 341

11.3.3 STEPDISC过程应用举例 342

习题 345

第12章 聚类分析 348

12.1 概述 348

12.1.1 聚类方法 348

12.1.2 SAS提供的聚类过程 349

12.1.3 聚类过程的输出及聚类类数的确定 349

12.1.4 散点图和树形图 350

12.2 CLUSTER过程 350

12.2.1 简介 350

12.2.2 语句说明 350

12.2.3 举例 352

12.3 FASTCLUS过程 356

12.3.1 简介 356

12.3.2 过程语句说明 356

12.3.3 过程输出数据集说明 357

12.3.4 举例 358

12.4 VARCLUS过程 362

12.4.1 简介 362

12.4.2 VARCLUS过程使用的语句 362

12.4.3 举例 364

12.4.4 输出结果的进一步说明 367

12.5 TREE过程 370

12.5.1 简介 370

12.5.2 过程使用的语句 370

12.5.3 补充说明 371

12.5.4 举例 371

习题 374

第13章 因子分析 377

13.1 因子分析的简单原理 377

13.2 FACTOR过程 378

13.2.1 FACTOR过程所用的语句 378

13.2.2 输出内容 380

13.2.3 举例 382

13.3 PRINCOMP过程 389

13.3.1 语句格式说明 390

13.3.2 举例 390

习题 393

第14章 生存分析 400

14.1 概述 400

14.1.1 什么是生存分析 400

14.1.2 生存分析的过程 401

14.1.3 生存分析中使用的术语 401

14.2 LIFEREG过程 401

14.2.1 简介 401

14.2.2 LIFEREG过程使用的语句 402

14.2.3 补充说明 403

14.2.4 生存回归应用举例 403

14.3 LIFETEST过程 408

14.3.1 简介 408

14.3.2 LIFETEST过程用的语句 409

14.3.3 举例 410

14.3.4 单变量Wilcoxon和logrank检验 413

14.3.5 多变量Wilcoxon和logrank检验 417

14.4 PHREG过程 420

14.4.1 PHREG过程概述 420

14.4.2 PHREG过程使用的语句 421

14.4.3 实例 423

习题 424

第15章 分类资料分析 427

15.1 概述 427

15.2 CATMOD过程的基本原理 427

15.2.1 单总体 427

15.2.2 多总体 428

15.2.3 参数估计及假设检验 428

15.3 CATMOD过程语句 429

15.3.1 CATMOD过程语句 429

15.3.2 关于设计矩阵 431

15.4 举例 432

习题 442

参考文献 445