大数据挖掘与统计机器学习PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:吕晓玲,宋捷主编
- 出 版 社:北京:中国人民大学出版社
- 出版年份:2016
- ISBN:7300231013
- 页数:230 页
第1章 概述 1
1.1 名词演化 1
1.2 基本内容 2
1.3 数据智慧 4
第2章 线性回归方法 7
2.1 多元线性回归 7
2.2 压缩方法:岭回归与Lasso 16
2.3 Lasso模型的求解与理论性质 22
2.4 损失函数加罚的建模框架 25
2.5 上机实践 30
第3章 线性分类方法 39
3.1 分类问题综述与评价准则 39
3.2 Logistic回归 42
3.3 线性判别 46
3.4 上机实践 49
第4章 模型评价与选择 60
4.1 基本概念 60
4.2 理论方法 63
4.3 数据重利用方法 67
4.4 上机实践 70
第5章 决策树与组合方法 78
5.1 决策树 78
5.2 Bagging 81
5.3 Boosting 86
5.4 随机森林 98
5.5 上机实践 100
第6章 神经网络与深度学习 114
6.1 神经网络 115
6.2 深度学习 127
6.3 上机实践 135
第7章 支持向量机 148
7.1 线性可分支持向量机 148
7.2 软间隔支持向量机 151
7.3 一些拓展 153
7.4 上机实践 155
第8章 聚类分析 163
8.1 基于距离的聚类 163
8.2 基于模型和密度的聚类 168
8.3 稀疏聚类 170
8.4 双向聚类 173
8.5 上机实践 174
第9章 推荐系统 182
9.1 基于邻居的推荐 183
9.2 潜在因子与矩阵分解算法 188
9.3 上机实践 192
第10章 大数据案例分析 197
10.1 智能手机用户监测数据案例分析 197
10.2 美国航空数据案例分析 211
参考文献 227
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《全国职业院校工业机器人技术专业规划教材 工业机器人现场编程》(中国)项万明 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019