《大数据流下调查数据的统计分析》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:张哲
  • 出 版 社:北京:中国社会科学出版社
  • 出版年份:2018
  • ISBN:9787520328098
  • 页数:105 页
图书介绍:大数据像是一把双刃剑,给统计学科的发展既带来机遇又同时提出挑战。本文正是基于此问题进行讨论,在大数据背景下,确立大数据的分析逻辑体系,根据大数据时代的数据特征,提出了在数据时代抽样调查还是有存在意义的观点。在获得抽样数据之后对大数据流下的调查数据进行统计分析会遇到什么问题,作者提出了大数据流下“推断灾难”体系,由“维度问题”和“结构问题”构成。对“维度问题”进行了归纳和总结,包括其含义和解决方法。而对于“结构问题”,根据大数据的特性,将大数据流信息看作是真实数据和虚假信息的汇总,构建了大数据下的结构模型,并通过数理证明得到了大数据下模型参数估计会减小的结论,并将其命名为大数据流下的结构问题。

第1章 绪论 1

1.1 选题的背景和意义 1

1.1.1 选题的背景 1

1.1.2 选题的意义 4

1.2 大数据研究概况 6

1.2.1 大数据研究的发展概况 7

1.2.2 大数据背景下有关抽样的研究概况 11

1.2.3 大数据背景下有关推断的研究概况 12

1.3 论文研究的基本框架 14

1.3.1 论文研究的思路 14

1.3.2 论文研究的结构及主要内容 15

1.3.3 论文的创新点 16

第2章 大数据流下的抽样调查 17

2.1 大数据分析系统的建立 17

2.1.1 大数据的产生 17

2.1.2 大数据的取得 17

2.1.3 大数据的存储 18

2.1.4 大数据的分析 18

2.2 大数据背景下抽样的意义 19

2.3 适合大数据背景的抽样方法 21

2.4 本章总结 29

第3章 大数据流下“推断灾难” 30

3.1 维度问题 31

3.1.1 问题的引入 31

3.1.2 “维度问题”的解决办法 32

3.2 结构问题 36

3.2.1 问题的引入 37

3.2.2 大数据结构的刻画 38

3.2.3 大数据冲击影响的刻画 40

3.2.4 统计模拟验证 42

3.3 本章总结 50

第4章 “结构问题”下的两种处理方法 52

4.1 解决路径一:SIMEX方法 52

4.1.1 处理问题的思路 52

4.1.2 SIMEX的理论展开 54

4.1.3 SIMEX方法的模拟验证 57

4.2 解决路径二:Regression Calibration方法 66

4.2.1 处理问题的思路 66

4.2.2 Regression Calibration的理论展开 67

4.2.3 Regression Calibration方法的模拟验证 71

4.2.4 辅助变量的选择 77

4.3 本章总结 78

4.3.1 SIMEX方法总结 79

4.3.2 Regression Calibration方法总结 80

第5章 大数据处理中的因子分析逻辑 81

5.1 问题的引人 81

5.2 多元数据流下的统计模型 82

5.2.1 多元数据流下的统计模型建立 83

5.2.2 多元数据流下的统计模型估计 85

5.3 因子分析思路的实际验证 93

5.3.1 问题的介绍 93

5.3.2 指标和数据说明 93

5.3.2 模型的建立与估计 94

5.4 本章总结 94

第6章 结论与展望 96

6.1 讨论与结论 96

6.2 研究展望 97

参考文献 98