Python数据分析实战PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:吕云翔,李伊琳,张雅素等编著
- 出 版 社:北京:清华大学出版社
- 出版年份:2019
- ISBN:9787302518389
- 页数:186 页
第1章 数据分析是什么 1
1.1海量数据背后蕴藏的知识 1
1.2数据分析与数据挖掘的关系 2
1.3机器学习与数据分析的关系 2
1.4数据分析的基本步骤 2
1.5 Python和数据分析 3
第2章 Python——从了解Python开始 5
2.1 Python的发展史 5
2.2 Python及Pandas、scikit-learn、Matplotlib的安装 6
2.2.1 Windows环境下Python的安装 6
2.2.2 Mac环境下Python的安装 6
2.2.3 Pandas、scikit-learn和Matplotlib的安装 7
2.2.4使用科学计算发行版Python进行快速安装 7
2.3 Python基础知识 8
2.3.1缩进很重要 9
2.3.2模块化的系统 9
2.3.3注释 10
2.3.4语法 10
2.4重要的Python库 11
2.4.1 Pandas 11
2.4.2 scikit-learn 11
2.4.3 Matplotlib 11
2.4.4其他 11
2.5 Jupyter 12
第3章 数据预处理——不了解数据一切都是空谈 14
3.1了解数据 15
3.2数据质量 17
3.2.1完整性 18
3.2.2一致性 18
3.2.3准确性 19
3.2.4及时性 20
3.3数据清洗 20
3.4特征工程 22
3.4.1特征选择 22
3.4.2特征构建 23
3.4.3特征提取 23
第4章 NumPy——数据分析基础工具 25
4.1多维数组对象ndarray 26
4.1.1 ndarray的创建 26
4.1.2 ndarray的数据类型 29
4.2 ndarray的索引、切片和迭代 29
4.3 ndarray的shape的操作 32
4.4 ndarray的基础操作 32
第5章 Pandas——处理结构化数据 35
5.1基本数据结构 36
5.1.1 Series 36
5.1.2 DataFrame 38
5.2基于Pandas的Index对象的访问操作 45
5.2.1 Pandas的Index对象 45
5.2.2索引的不同访问方式 48
5.3数学统计和计算工具 52
5.3.1统计函数:协方差、相关系数、排序 52
5.3.2窗口函数 54
5.4数学聚合和分组运算 60
5.4.1 agg()函数的聚合操作 63
5.4.2 transform()函数的转换操作 64
5.4.3使用apply()函数实现一般的操作 65
第6章 数据分析与知识发现——一些常用的方法 67
6.1分类分析 67
6.1.1逻辑回归 68
6.1.2线性判别分析 68
6.1.3支持向量机 69
6.1.4决策树 70
6.1.5 K近邻 71
6.1.6朴素贝叶斯 72
6.2关联分析 72
6.2.1基本概念 72
6.2.2典型算法 74
6.3聚类分析 80
6.3.1 K均值算法 80
6.3.2 DBSCAN 81
6.4回归分析 82
6.4.1线性回归分析 83
6.4.2支持向量回归 84
6.4.3 K近邻回归 84
第7章 scikit-learn——实现数据的分析 85
7.1分类方法 85
7.1.1 Logistic回归 85
7.1.2 SVM 87
7.1.3 Nearest neighbors 88
7.1.4 Decision Tree 89
7.1.5随机梯度下降 90
7.1.6高斯过程分类 91
7.1.7神经网络分类(多层感知器) 91
7.1.8朴素贝叶斯示例 92
7.2回归方法 93
7.2.1最小二乘法 93
7.2.2岭回归 94
7.2.3 Lasso 94
7.2.4贝叶斯岭回归 95
7.2.5决策树回归 96
7.2.6高斯过程回归 96
7.2.7最近邻回归 97
7.3聚类方法 98
7.3.1 K-means 98
7.3.2 Affinity propagation 100
7.3.3 Mean-shift 101
7.3.4 Spectral clustering 101
7.3.5 Hierarchical clustering 102
7.3.6 DBSCAN 103
7.3.7 Birch 104
第8章 Matplotlib——交互式图表绘制 106
8.1基本布局对象 106
8.2图表样式的修改以及装饰项接口 111
8.3基础图表的绘制 116
8.3.1直方图 116
8.3.2散点图 118
8.3.3饼图 119
8.3.4柱状图 120
8.3.5折线图 125
8.3.6表格 126
8.3.7不同坐标系下的图像 127
8.4 matplot3D 128
8.5 Matplotlib与Jupyter结合 130
第9章 实例:科比职业生涯进球分析 134
9.1预处理 134
9.2分析科比的命中率 138
9.3分析科比的投篮习惯 155
第10章 实例:世界杯 162
10.1数据说明 162
10.2世界杯观众 164
10.3世界杯冠军 170
10.4世界杯参赛队伍与比赛 173
10.5世界杯进球 180
参考文献 185
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《分析化学》陈怀侠主编 2019
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《Python3从入门到实战》董洪伟 2019
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019