复杂数据统计方法 基于R的应用PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:吴喜之编著
- 出 版 社:北京:中国人民大学出版社
- 出版年份:2012
- ISBN:9787300163994
- 页数:228 页
第1章 引 言 1
1.1 作为科学的统计 1
1.2 数据分析的实践 3
1.3 数据的形式以及可能用到的模型 4
1.3.1 横截面数据:因变量为实轴上的数量变量 5
1.3.2 横截面数据:因变量为分类(定性)变量或者频数 5
1.3.3 纵向数据,多水平数据,面板数据,重复观测数据 6
1.3.4 多元数据各变量之间的关系:多元分析 6
1.3.5 路径模型/结构方程模型 6
1.3.6 多元时间序列数据 7
1.4 R软件入门 7
1.4.1 简介 7
1.4.2 动手 10
第2章 横截面数据:因变量为实数轴上的数量变量 11
2.1 简单回归回顾 11
2.2 简单线性模型不易处理的横截面数据 18
2.2.1 标准线性回归中的指数变换 19
2.2.2 生存分析数据的Cox回归模型 22
2.2.3 数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归 25
2.2.4 无法做任何假定的数据:机器学习回归方法 33
2.2.5 决策树回归(回归树) 35
2.2.6 boosting回归 38
2.2.7 bagging回归 39
2.2.8 随机森林回归 40
2.2.9 人工神经网络回归 41
2.2.10 支持向量机回归 43
2.2.11 几种回归方法五折交叉验证结果 45
2.2.12 方法的稳定性及过拟合 46
第3章 横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况 48
3.1 经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾 49
3.1.1 logistic回归和probit回归 49
3.1.2 经典判别分析 54
3.2 因变量为分类变量,自变量含有分类变量:机器学习分类方法 56
3.2.1 决策树分类(分类树) 57
3.2.2 adaboost分类 60
3.2.3 bagging分类 62
3.2.4 随机森林分类 64
3.2.5 支持向量机分类 67
3.2.6 最近邻方法分类 68
3.2.7 分类方法五折交叉验证结果 69
3.3 因变量为频数(计数)的情况 70
3.3.1 经典的Poisson对数线性模型回顾 71
3.3.2 使用Poisson对数线性模型时的散布问题 74
3.3.3 零膨胀计数数据的Poisson回归 76
3.3.4 使用机器学习的算法模型拟合计数数据 79
3.3.5 多项logit模型及多项分布对数线性模型回顾 83
第4章 纵向数据(多水平数据,面板数据) 90
4.1 纵向数据:线性随机效应混合模型 92
4.2 纵向数据:广义线性随机效应混合模型 97
4.3 纵向数据:决策树及随机效应模型 99
4.4 纵向数据:纵向生存数据 102
4.4.1 Cox随机效应混合模型 103
4.4.2 分步联合建模 106
4.5 计量经济学家的视角:面板数据 114
第5章 多元分析(不区分因变量及自变量) 122
5.1 实数轴上的数据:经典多元分析内容回顾 122
5.1.1 主成分分析及因子分析 122
5.1.2 分层聚类及K均值聚类 131
5.1.3 典型相关分析 134
5.1.4 对应分析 138
5.2 非经典多元数据分析:可视化 141
5.2.1 主成分分析 143
5.2.2 对应分析 144
5.2.3 多重对应分析 145
5.2.4 多重因子分析 146
5.2.5 分层多重因子分析 149
5.2.6 基于主成分分析的聚类 150
5.3 多元数据的关联规则分析 152
第6章 路径建模(结构方程建模)数据的PLS分析 159
6.1 路径模型概述 159
6.1.1 路径模型 159
6.1.2 路径模型的两种主要方法 160
6.2 PLS方法:顾客满意度的例子 162
6.3 协方差方法简介 169
6.4 结构方程模型的一些问题 173
第7章 多元时间序列数据 175
7.1 时间序列的基本概念及单变量时间序列方法回顾 176
7.1.1 时间序列的一些定义和基本概念 176
7.1.2 常用的一元时间序列方法 183
7.2 单位根及协整检验 194
7.2.1 概述 195
7.2.2 单位根检验 196
7.2.3 协整检验 198
7.3 VARX模型与状态空间模型 204
7.3.1 VARX模型拟合 205
7.3.2 状态空间模型拟合 208
7.3.3 模型的比较和预测 210
附录 练习:熟练使用R软件 214
参考文献 225
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《建筑施工企业统计》杨淑芝主编 2008
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《数学物理方法与仿真 第3版》杨华军 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Helmholtz方程的步进计算方法研究》李鹏著 2019
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019