第1章 SAS系统简介 1
1.1 系统简介 1
1.1.1 SAS系统与商务智能系统 1
1.1.2 SAS系统与其他数据库的数据交换 1
1.1.3 SAS语言与SAS系统 2
1.1.4 SAS 9浏览窗口简介 3
1.2 一个简单的编程实例 4
1.2.1 编写一个SAS程序 4
1.2.2 提交一个SAS程序 5
1.2.3 保存和打开一个SAS程序 6
1.3 DATA步的数据指针和PDV流程 6
1.3.1 数据指针和PDV流程 6
1.3.2 DATA步执行次数 7
第2章 SAS编程基础 9
2.1 SAS逻辑库 10
2.1.1 创建SAS逻辑库 10
2.1.2 删除SAS逻辑库 12
2.1.3 永久逻辑库和临时逻辑库 13
2.2 SAS数据集 13
2.2.1 SAS数据集命名规则 13
2.2.2 永久SAS数据集和临时SAS数据集 13
2.2.3 SAS数据集结构 15
2.2.4 SAS数据集形式 16
2.3 SAS索引 17
2.3.1 创建索引 17
2.3.2 删除索引 18
2.4 SAS目录 18
2.5 数据字典 18
2.6 SAS变量 21
2.6.1 变量属性 21
2.6.2 变量列表 21
2.6.3 自动变量 21
第3章 数据获取与数据集操作 23
3.1 数据获取 23
3.1.1 LIBNAME方式 23
3.1.2 PASSTHROUGH方式 24
3.1.3 IMPORT方式 25
3.1.4 INPUT方式 25
3.2 SET语句 26
3.2.1 语法说明 26
3.2.2 实例详解 26
3.2.3 商业实践 33
3.3 BY语句 36
3.3.1 语法说明 36
3.3.2 实例详解 36
3.4 MERGE语句 38
3.4.1 语法说明 38
3.4.2 实例详解 38
3.5 UPDATE语句 41
3.5.1 语法说明 41
3.5.2 实例详解 41
3.6 MODIFY语句 42
3.6.1 语法说明 42
3.6.2 实例详解 44
3.6.3 商业实践 47
3.7 PUT语句 49
3.7.1 语法说明 49
3.7.2 实例详解 51
3.7.3 商业实践 54
3.8 FILE语句 55
3.8.1 语法说明 56
3.8.2 实例详解 57
3.8.3 商业实践 59
3.9 INFILE语句 60
3.9.1 语法说明 60
3.9.2 实例详解 61
3.9.3 商业实践 62
第4章 SAS变量操作 64
4.1 赋值语句和累加语句 64
4.1.1 赋值语句 64
4.1.2 累加语句 66
4.2 KEEP语句和DROP语句 67
4.2.1 KEEP语句 67
4.2.2 DROP语句 68
4.3 RETAIN语句 68
4.3.1 语法说明 69
4.3.2 实例详解 69
4.3.3 商业实践 70
4.4 ARRAY语句 75
4.4.1 语法说明 75
4.4.2 实例详解 77
4.4.3 商业实践 77
4.5 其他语句 84
4.5.1 RENAME语句 84
4.5.2 LENGTH语句 85
4.5.3 LABEL语句 86
第5章 SAS观测值操作 87
5.1 OUTPUT语句 87
5.1.1 语法说明 87
5.1.2 实例详解 88
5.2 子集IF语句 89
5.2.1 语法说明 89
5.2.2 实例详解 90
5.2.3 子集IF与OUTPUT语句比较 90
5.3 WHERE语句 92
5.3.1 语法说明 92
5.3.2 实例详解 92
5.3.3 子集IF与WHERE语句比较 94
5.4 REPLACE语句和REMOVE语句 94
5.4.1 REPLACE语句 94
5.4.2 REMOVE语句 94
5.4.3 REPLACE、REMOVE与OUTPUT应用 95
5.5 DELETE语句与STOP语句 96
5.5.1 DELETE语句 96
5.5.2 STOP语句 97
第6章 SAS数据集管理 98
6.1 APPEND过程 98
6.1.1 语法说明 98
6.1.2 实例详解 100
6.2 SORT过程 101
6.2.1 语法说明 102
6.2.2 实例详解 102
6.2.3 商业实践 103
6.3 TRANSPOSE过程 104
6.3.1 语法说明 104
6.3.2 实例详解 105
6.4 CONTENTS过程 107
6.4.1 语法说明 107
6.4.2 实例详解 107
6.5 DATASETS过程 108
6.5.1 语法说明 108
6.5.2 实例详解 110
第7章 DATA步循环与控制 112
7.1 IF-THEN/ELSE语句与SELECT语句 112
7.1.1 IF-THEN/ELSE语句 112
7.1.2 SELECT语句 115
7.2 DO语句 118
7.2.1 DO组语句 118
7.2.2 DO循环语句 119
7.2.3 DO WHILE语句 121
7.2.4 DO UNTIL语句 121
7.2.5 DO OVER语句 122
7.2.6 商业实践 123
7.3 各种控制语句 127
7.3.1 GO TO语句 127
7.3.2 CONTINUE语句与LEAVE语句 128
7.3.3 RETURN语句 129
第8章 常用全程语句 131
8.1 COMMENT语句 131
8.2 X语句 131
8.3 FILENAME语句 132
8.4 %INCLUDE语句 134
8.5 TITLE语句 135
8.6 FOOTNOTE语句 136
第9章 输出控制 137
9.1 LOG窗口输出控制 137
9.2 OUTPUT窗口输出控制 138
9.3 常用ODS输出控制 138
9.3.1 ODS LISTING 139
9.3.2 ODS RESULTS 141
9.3.3 ODS TRACE 142
9.3.4 ODS OUTPUT 144
9.3.5 ODS HTML 146
9.3.6 ODS CSVALL 148
9.3.7 ODS SELECT 149
9.3.8 ODS EXCLUDE 151
第10章 SAS宏变量 152
10.1 宏运行的内在机制 152
10.2 宏变量 154
10.2.1 定义宏变量 154
10.2.2 显示宏变量 155
10.2.3 引用宏变量 155
10.3 宏程序 157
10.3.1 定义宏 158
10.3.2 调用宏 158
10.3.3 宏内宏 158
10.3.4 宏存储 158
10.4 宏参数 159
10.4.1 创建参数 159
10.4.2 参数赋值 160
10.5 宏函数 160
10.5.1 通配函数 160
10.5.2 计算函数 162
10.5.3 字符函数 163
10.5.4 引用函数 165
10.6 宏语句 166
10.6.1 %IF-%THEN/%ELSE语句 167
10.6.2 %DO组语句 168
10.6.3 %DO循环语句 168
10.6.4 %DO%WHILE循环语句 169
10.6.5 %DO%UNTIL循环语句 170
10.7 宏应用 171
10.7.1 创建宏变量的八种方法 171
10.7.2 宏程序一般应用 173
10.7.3 宏程序高级应用 174
第11章 SQL过程 178
11.1 单表操作 178
11.2 多表操作 180
11.2.1 多表关联 180
11.2.2 子查询 182
11.2.3 合并查询 183
11.2.4 MERGE与SQL比较 184
11.3 创建、更新与删除表操作 187
11.3.1 创建表 187
11.3.2 行操作 188
11.3.3 列操作 190
11.3.4 删除表 191
11.4 使用SQL注意的几个问题 191
第12章 数据处理实践 192
12.1 随机抽样 192
12.1.1 简单无重复随机抽样 192
12.1.2 分层等比例随机抽样 193
12.1.3 分层不等比例随机抽样 194
12.1.4 随机抽样MACRO 196
12.2 HASH对象 200
12.2.1 HASH对象的引例 201
12.2.2 HASH对象的语法 203
12.2.3 HITER对象的引例 204
12.2.4 HITER对象的语法 205
12.2.5 商业实践 205
12.3 FORMAT综述 210
12.3.1 PROC步创建 210
12.3.2 DATA步创建 211
12.3.3 永久存储及调用 212
12.4 正则表达式 213
12.4.1 语法说明 214
12.4.2 常用函数 215
12.4.3 实例详解 216
12.5 宏在SAS与Excel转换中的应用 220
12.5.1 SAS数据集转换成Excel 220
12.5.2 Excel转换成SAS数据集 221
第13章 数据挖掘概念、任务和流程 223
13.1 数据挖掘概念 223
13.2 数据挖掘任务 224
13.3 数据挖掘流程 225
13.3.1 定义商业目标 225
13.3.2 编制需求文档 228
13.3.3 选择数据源 231
13.3.4 建模流程图 232
13.4 LOGISTIC建模及结果详解 233
13.4.1 数学模型 233
13.4.2 参数估计 234
13.4.3 模型评价指标 235
13.4.4 回归系数 237
13.4.5 变量筛选方法 238
13.4.6 应用举例及输出结果详解 239
13.4.7 多值LOGISTIC模型 242
第14章 响应模型:定位新客户 244
14.1 前期准备 244
14.1.1 商业需求 245
14.1.2 定义目标 245
14.1.3 选择变量 245
14.2 数据获取与数据处理 246
14.2.1 创建建模数据集 248
14.2.2 变量首次筛选 249
14.2.3 数据探索 252
14.2.4 数据清洗 254
14.2.5 变量二次筛选 259
14.2.6 变量三次筛选 266
14.2.7 字符变量压缩 269
14.3 模型开发 271
14.3.1 全模型法选择所有候选模型 271
14.3.2 逐步回归法筛选候选模型 272
14.3.3 创建两个重要数据集 273
14.3.4 创建LIFT图 274
14.3.5 创建评分卡文件 278
14.4 模型验证 279
14.4.1 评分卡文件导入 280
14.4.2 LIFT图比较 281
14.4.3 模型确认 283
14.5 模型实施与监控 283
14.5.1 模型实施 283
14.5.2 模型监控 284
14.6 小结 285
第15章 行为建模:客户行为属性分析 286
15.1 前期准备 286
15.1.1 商业需求 286
15.1.2 定义目标 286
15.1.3 选择建模方法 288
15.2 数据获取与处理 288
15.3 模型开发 294
15.4 模型验证 296
15.5 模型打分 296
15.6 模型预测 298
15.7 模型实施 301
15.8 小结 302
第16章 文本挖掘:Web文本分析 303
16.1 文本挖掘概念与流程 303
16.1.1 文本挖掘概念 303
16.1.2 文本挖掘流程 303
16.2 商业案例 308
16.2.1 商业需求 308
16.2.2 建模框架设计 308
16.2.3 结合朴素贝叶斯文本分类的EM迭代 309
16.2.4 数据获取与数据预处理 313
16.2.5 文本特征化 318
16.2.6 模型开发:产生文本分类器 321
16.2.7 模型验证:测试分类器效果 336
16.2.8 模型评估:计算混淆矩阵 342
16.2.9 模型应用:对用户查询关键字进行分类 343
16.2.10 小结与展望 343
参考文献 345