第一部分 社会调查者的数据管理 2
第1章 导言 2
1.1 数据管理不被重视 2
1.2 数据管理内容不清 2
1.3 数据管理工作主体不明 3
1.4 数据伦理 3
1.5 本书简介和使用说明 4
第2章 数据管理的流程及内容 6
2.1 数据管理的工作流程 6
2.1.1 收集数据前的数据管理 6
2.1.2 收集数据中的数据管理 7
2.1.3 数据回收后的数据管理 7
2.2 数据管理的工作标准 8
2.3 数据管理的工作规范 9
第3章 概念与术语 11
3.1 和计算机及软件有关的术语 11
3.2 和统计有关的术语 12
3.3 和社会调查有关的术语 14
3.4 Stata的一些术语及使用通则 15
3.4.1 Stata中的常用术语 16
3.4.2 Stata命令中的通则 27
3.4.3 Stata的帮助文件 29
3.4.4 Stata 14的特点 30
3.4.5 Stata的其他帮助资源 30
3.5 中国综合社会调查 30
第4章 收集数据前的数据管理 37
4.1 问卷设计与数据管理 37
4.1.1 问卷设计的基本要素 37
4.1.2 问卷设计的注意事项 38
4.2 抽样设计与数据管理 44
4.3 数据管理人员的安排 44
4.4 访问员和数据管理 45
4.5 制定编码手册 45
4.5.1 把问题转化成变量 47
4.5.2 确定变量的取值范围 49
4.5.3 给取值贴标签 50
4.5.4 确定缺失值的取值和取值标签 50
4.5.5 制作编码手册 50
第5章 收集数据中的数据管理 53
5.1 问卷填答 53
5.1.1 纸笔调查 53
5.1.2 计算机辅助调查 55
5.2 问卷回收与保存 55
5.3 问卷审核 56
5.4 问卷提交 57
第6章 数据录入 58
6.1 提交录入 58
6.1.1 给录入方一份问卷提交清单 58
6.1.2 给录入方一份问卷编码手册 58
6.1.3 签订数据保密协议 59
6.2 录入格式 59
6.2.1 单选题的录入 59
6.2.2 多选题的录入 59
6.2.3 开放题的录入 60
6.3 双录与双校 60
6.4 用Stata双录并双校数据 60
6.4.1 交互模式录入 60
6.4.2 用命令input输入 65
6.4.3 用命令cf双校 66
6.5 提交最终的录入数据 68
6.6 如何处理已经录完的问卷 69
6.7 数据合并 69
6.7.1 append——纵向合并 70
6.7.2 merge——横向合并 90
6.7.3 joinby——横向配对合并 114
6.7.4 cross——交叉合并 116
第7章 数据的初步清理 121
7.1 检查提交的录入数据 121
7.1.1 查看观测值和变量的数量 122
7.1.2 转换数据格式 122
7.1.3 把数据读入Stata 123
7.1.4 查看识别变量 131
7.1.5 检查有无重复观测值(重复录入) 134
7.1.6 数据标签 137
7.1.7 数据注释 138
7.1.8 数据排序 140
7.2 检查数据中的变量 145
7.2.1 变量名 146
7.2.2 变量标签 149
7.2.3 变量的存储类型 153
7.2.4 变量的显示格式 156
7.2.5 给变量添加注释 159
7.3 检查数据中的取值 161
7.3.1 检查单变量取值 161
7.3.2 检查多个变量之间的逻辑一致性 177
7.4 给取值添加多套不同语种的标签 180
7.5 给数据添加变量 183
7.6 删除数据中的敏感变量 184
7.7 保存数据及相关资料 184
7.7.1 保存数据及相关资料的基本原则 184
7.7.2 在Stata里保存数据 185
7.8 如果问卷设计时没有编制编码手册,该怎么办 189
第二部分 数据使用者的数据管理 198
第8章 数据的深度清理 198
8.1 抽取数据 198
8.1.1 选取观测值 198
8.1.2 选取变量 204
8.1.3 选取观测值和变量 205
8.1.4 随机抽取一个子数据集 207
8.2 检验多个变量之间的逻辑关系 210
8.2.1 跳问逻辑 211
8.2.2 地理变量间的逻辑 212
8.3 创建新变量 220
8.3.1 依据字符型变量生成数值型变量 221
8.3.2 依据数值型变量生成字符型变量 226
8.3.3 用表达式生成新变量 230
8.3.4 用函数生成新变量 236
8.4 分组计算 266
8.4.1 观测值组内计算——观测值分组 266
8.4.2 观测值组间计算——变量分组 271
8.5 转换数据形状 276
8.5.1 宽数据转换成长数据 278
8.5.2 长数据转换成宽数据 286
第9章 数据的保存和存档 294
9.1 保存数据 294
9.1.1 存储格式 295
9.1.2 存储介质 295
9.2 数据存档 295
9.2.1 文档名 296
9.2.2 文件夹名及文件夹层次——目录结构 298
9.2.3 存档记录清单 298
第10章 数据发布 302
10.1 发布时间 302
10.2 发布格式 302
10.3 发布内容 302
10.4 Q&A 302
10.5 数据更新/更正 303
总结 304
附录 305
附录A CGSS第二期抽样方案 305
附录B 国家行政区划代码及转码小程序 315
后记 321
参考资料 322