第1章 绪论 1
1.1 选题的背景和意义 1
1.1.1 选题的背景 1
1.1.2 选题的意义 4
1.2 大数据研究概况 6
1.2.1 大数据研究的发展概况 7
1.2.2 大数据背景下有关抽样的研究概况 11
1.2.3 大数据背景下有关推断的研究概况 12
1.3 论文研究的基本框架 14
1.3.1 论文研究的思路 14
1.3.2 论文研究的结构及主要内容 15
1.3.3 论文的创新点 16
第2章 大数据流下的抽样调查 17
2.1 大数据分析系统的建立 17
2.1.1 大数据的产生 17
2.1.2 大数据的取得 17
2.1.3 大数据的存储 18
2.1.4 大数据的分析 18
2.2 大数据背景下抽样的意义 19
2.3 适合大数据背景的抽样方法 21
2.4 本章总结 29
第3章 大数据流下“推断灾难” 30
3.1 维度问题 31
3.1.1 问题的引入 31
3.1.2 “维度问题”的解决办法 32
3.2 结构问题 36
3.2.1 问题的引入 37
3.2.2 大数据结构的刻画 38
3.2.3 大数据冲击影响的刻画 40
3.2.4 统计模拟验证 42
3.3 本章总结 50
第4章 “结构问题”下的两种处理方法 52
4.1 解决路径一:SIMEX方法 52
4.1.1 处理问题的思路 52
4.1.2 SIMEX的理论展开 54
4.1.3 SIMEX方法的模拟验证 57
4.2 解决路径二:Regression Calibration方法 66
4.2.1 处理问题的思路 66
4.2.2 Regression Calibration的理论展开 67
4.2.3 Regression Calibration方法的模拟验证 71
4.2.4 辅助变量的选择 77
4.3 本章总结 78
4.3.1 SIMEX方法总结 79
4.3.2 Regression Calibration方法总结 80
第5章 大数据处理中的因子分析逻辑 81
5.1 问题的引人 81
5.2 多元数据流下的统计模型 82
5.2.1 多元数据流下的统计模型建立 83
5.2.2 多元数据流下的统计模型估计 85
5.3 因子分析思路的实际验证 93
5.3.1 问题的介绍 93
5.3.2 指标和数据说明 93
5.3.2 模型的建立与估计 94
5.4 本章总结 94
第6章 结论与展望 96
6.1 讨论与结论 96
6.2 研究展望 97
参考文献 98