高等院校研究生用书 复杂数据统计方法 基于R的应用PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:吴喜之编著
- 出 版 社:北京:中国人民大学出版社
- 出版年份:2015
- ISBN:9787300215945
- 页数:315 页
第一章 引言 1
1.1作为科学的统计 1
1.2数据分析的实践 3
1.3数据的形式以及可能用到的模型 4
1.3.1横截面数据:因变量为实轴上的数量变量 5
1.3.2横截面数据:因变量为分类变量、频数或定序变量 5
1.3.3纵向数据、多水平数据、面板数据、重复观测数据 5
1.3.4多元数据各变量之间的关系:多元分析 6
1.3.5抽样调查数据中垃圾比例的计算 6
1.3.6路径模型/结构方程模型 6
1.3.7贝叶斯网络 7
1.3.8多元时间序列数据 7
1.4 R软件入门 7
1.4.1简介 7
1.4.2安装和运行小贴士 8
1.4.3动手 9
1.5国内统计教学(课本)的若干误区 10
1.5.1假设检验的误区:不能拒绝就接受 10
1.5.2假设检验的误区:p值小于0.05就显著 11
1.5.3置信区间的误区 12
1.5.4最小二乘线性回归中的误区 12
1.5.5样本量是多少才算大样本 15
1.5.6用31个省、直辖市、自治区数据能做什么 16
1.5.7汇总数据(比如部分均值)和原始观测值的区别 16
第二章 横截面数据回归:经典方法 18
2.1简单回归回顾 18
2.1.1对例2.1数据的简单拟合 19
2.1.2对例2.1数据的进一步分析 20
2.1.3对简单线性回归的一些讨论 23
2.1.4损失函数及分位数回归简介 24
2.2简单线性模型中的指数变换 27
2.3生存分析数据的Cox回归模型 31
2.4数据出现多重共线性情况:岭回归、lasso回归、适应性lasso回归、偏最小二乘回归 34
2.4.1岭回归 35
2.4.2 lasso回归 36
2.4.3适应性lasso回归 38
2.4.4偏最小二乘回归 39
第三章 横截面数据回归:机器学习方法 41
3.1没有任何先验假定的数据:机器学习回归方法 41
3.2决策树回归(回归树) 43
3.2.1拟合全部数据 43
3.2.2交叉验证 45
3.3 boosting回归 46
3.4 bagging回归 47
3.5随机森林回归 48
3.6支持向量机回归 49
3.6.1 SVM 49
3.6.2 SVR 49
3.6.3交叉验证 50
3.7人工神经网络回归 51
3.7.1确定合适的隐藏层节点数目 52
3.7.2交叉验证 53
3.8 10折交叉验证结果汇总及方法稳定性讨论 54
第四章 横截面数据分类:经典方法 57
4.1 logistic回归和probit回归 57
4.1.1广义线性模型简单回顾 57
4.1.2脊柱数据例子 58
4.1.3 logistic回归 59
4.1.4 probit回归 63
4.2经典判别分析 64
4.2.1关于例4.1 column.2C.csv数据的两分类判别 65
4.2.2例4.1 column.2C.csv数据两分类判别诸方法的10折交叉验证结果 66
4.2.3关于例4.1 column.3C.csv数据的三分类判别 68
4.2.4关于例4.1 column.3C.csv数据的三分类判别的三种方法的10折交叉验证结果 70
第五章 横截面数据分类:机器学习方法 72
5.1对变量没有任何限制:机器学习分类方法 72
5.1.1概论和例子 72
5.1.2产生交叉验证数据集 72
5.2决策树分类(分类树) 74
5.2.1拟合全部数据 74
5.2.2交叉验证 76
5.3 adaboost分类 76
5.3.1拟合全部数据 77
5.3.2交叉验证 79
5.4 bagging分类 80
5.4.1拟合全部数据 80
5.4.2交叉验证 81
5.5随机森林分类 82
5.5.1拟合全部数据 82
5.5.2交叉验证 85
5.6支持向量机分类 85
5.6.1拟合全部数据 85
5.6.2交叉验证 86
5.7最近邻方法分类 87
5.8神经网络分类 88
5.8.1拟合 88
5.8.2神经网络对于不同参数的拟合效果分析 89
5.9分类方法10折交叉验证结果汇总 90
第六章 横截面数据:计数或有序因变量 92
6.1概要和例子 92
6.2经典的Poisson对数线性模型回顾 93
6.3使用Poisson对数线性模型时的散布问题 95
6.4零膨胀时的Poisson回归 98
6.5用机器学习的算法模型拟合计数因变量数据 101
6.5.1随机森林拟合例6.1数据的10折交叉验证 101
6.5.2决策树(回归树)拟合例6.1数据的10折交叉验证 101
6.5.3支持向量机拟合例6.1数据的10折交叉验证 102
6.5.4各种方法拟合例6.1数据的10折交叉验证结果比较和一些讨论 102
6.6多项logit模型及多项分布对数线性模型回顾 104
6.6.1多项logit模型回顾 104
6.6.2多项分布对数线性模型回顾 107
6.7有序变量的比例优势模型 110
第七章纵 向数据(多水平模型、面板数据) 119
7.1线性随机效应混合模型 121
7.2广义线性随机效应混合模型 125
7.3决策树及随机效应模型 127
7.4纵向生存数据分析 130
7.4.1 Cox随机效应混合模型 130
7.4.2分步联合建模 134
7.5计量经济学家的视角:面板数据 141
第八章 多元分析 147
8.1实数轴上的数据:经典多元分析内容回顾 147
8.1.1主成分分析及因子分析 147
8.1.2分层聚类及k均值聚类 156
8.1.3典型相关分析 164
8.1.4对应分析 168
8.2非经典多元数据分析:可视化 171
8.2.1主成分分析 173
8.2.2对应分析 174
8.2.3多重对应分析 175
8.2.4多重因子分析 176
8.2.5分层多重因子分析 178
8.2.6基于主成分分析的分层聚类 179
第九章 多元数据的关联规则分析 181
9.1问题的提出 181
9.2数据的初步处理 182
9.3一些基本概念 183
9.4频数和规则 185
第十章调查数据中垃圾比例的计算 188
10.1动机 188
10.2我们的着眼点在于数据本身 189
10.3解剖一个数据 190
10.4计算例10.1Income2000.csv数据中各种比例及置信区间 193
10.4.1一些计算准备工作 193
10.4.2主要函数 194
10.4.3更多的计算 196
10.5通过一个简单人造数值例子解释本章代码的意义 201
第十一章 路径建模(结构方程建模)数据的PLS分析 207
11.1路径模型概述 207
11.1.1路径模型 207
11.1.2路径模型的两种主要方法 208
11.2 PLS方法:顾客满意度的例子 210
11.3协方差方法简介 215
11.4结构方程模型的一些问题 222
第十二章贝叶斯网络 224
12.1引言 224
12.2贝叶斯网络涉及的一些基本概念 227
12.2.1贝叶斯网络 227
12.2.2贝叶斯网络中的条件独立性概念 227
12.3通过贝叶斯网络做推断 229
12.4学习贝叶斯网络 231
12.4.1网络学习算法的种类 231
12.4.2几种可能面对的问题 232
12.5贝叶斯网络的数值例子及计算 236
12.5.1全部变量是离散变量的情况 236
12.5.2全部变量是连续变量的情况 240
12.5.3连续变量和离散变量混合的情况 241
第十三章 多元时间序列数据 245
13.1时间序列的基本概念及单变量时间序列方法的回顾 245
13.1.1时间序列的一些定义和基本概念 245
13.1.2常用的一元时间序列方法 252
13.2单位根检验、协整检验及Granger因果检验 262
13.2.1概述 262
13.2.2单位根检验 264
13.2.3协整检验 266
13.2.4 Granger因果检验 272
13.3 VAR模型、VARX模型与状态空间模型 273
13.3.1 VAR模型的拟合与预测 273
13.3.2 VARX模型的拟合与预测 276
13.3.3状态空间模型的拟合与预测 278
13.3.4模型的比较 280
13.4非线性时间序列 283
13.4.1引言 283
13.4.2线性AR模型 285
13.4.3自门限自回归模型 286
13.4.4 Logistic平滑过渡自回归模型 290
13.4.5神经网络模型 293
13.4.6可加AR模型 294
13.4.7模型的比较 294
13.4.8门限协整 295
附录练习:熟练使用R软件 300
参考文献 309
- 《建筑施工企业统计》杨淑芝主编 2008
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《全国高等中医药行业“十三五”创新教材 中医药学概论》翟华强 2019
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《高等数学试题与详解》西安电子科技大学高等数学教学团队 2019
- 《21世纪法学系列教材 配套辅导用书 行政法与行政诉讼法练习题集 第5版》李元起主编 2018
- 《高等院校摄影摄像经典教材 摄影构图教程》崔毅 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019