普通高等院校应用型人才培养“十三五”规划教材 Python数据分析PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:周海燕责任编辑;(中国)吴道君,朱家荣
- 出 版 社:北京:中国铁道出版社
- 出版年份:2019
- ISBN:9787113258719
- 页数:200 页
第1章 Python数据分析概述 1
1.1 数据分析的概念、流程和应用 1
1.1.1 数据分析的概念 1
1.1.2 数据分析的流程 2
1.1.3 数据分析的应用 2
1.2 数据分析工具 3
1.2.1 常用工具 4
1.2.2 Python数据分析 4
1.3 Python数据分析环境 5
小结 9
习题 9
实验 10
第2章 NumPy数值计算 15
2.1 NumPy多维数组 15
2.1.1 数组创建 15
2.1.2 数组对象属性 22
2.1.3 数组数据类型 23
2.2 数组操作 24
2.2.1 修改数组形状 24
2.2.2 翻转数组 26
2.2.3 连接数组 27
2.2.4 分割数组 28
2.2.5 数组元素添加与删除 30
2.3 数组索引与切片 32
2.3.1 数组索引 32
2.3.2 数组切片 33
2.3.3 布尔型索引 34
2.3.4 花式索引 35
2.4 数组的运算 35
2.4.1 数组和标量间的运算 35
2.4.2 广播 36
2.4.3 算术函数 37
2.4.4 集合运算 40
2.4.5 统计运算 41
2.4.6 排序 43
2.4.7 搜索 44
2.5 线性代数 45
2.5.1 数组相乘 46
2.5.2 矩阵行列式 46
2.5.3 逆矩阵 46
2.5.4 线性方程组 47
2.5.5 特征值和特征向量 47
2.6 数组的存取 48
小结 48
习题 48
实验 51
第3章 Matplotlib数据可视化 54
3.1 线形图 54
3.1.1 绘制线形图 54
3.1.2 颜色设置 55
3.1.3 线型设置 56
3.1.4 坐标点设置 57
3.1.5 线宽设置 59
3.2 其他图形 59
3.2.1 散点图 59
3.2.2 柱形图 61
3.2.3 条形图 63
3.2.4 饼图 64
3.2.5 直方图 65
3.2.6 箱线图 67
3.3 自定义设置 69
3.3.1 图例设置 69
3.3.2 坐标网格设置 70
3.3.3 坐标系设置 71
3.3.4 样式设置与注解 72
3.3.5 RC设置 73
3.4 子图 74
3.4.1 创建子图 74
3.4.2 子图坐标系设置 76
3.4.3 图形嵌套 77
3.5 绘制三维图形 78
小结 81
习题 82
实验 82
第4章 Pandas数据分析 89
4.1 Pandas数据结构 89
4.2 DataFrame基本功能 94
4.3 读取外部数据 95
4.3.1 CSV文件 96
4.3.2 Sqlite数据库 98
4.4 数据帧的列操作和行操作 99
4.4.1 列操作 99
4.4.2 行操作 101
4.5 高级索引 103
4.5.1 重建索引 103
4.5.2 更换索引 106
4.5.3 层次化索引 107
4.6 Pandas数据运算 108
4.6.1 算术运算 108
4.6.2 函数应用与映射运算 109
4.6.3 排序 111
4.6.4 迭代 113
4.6.5 唯一值与值计数 115
4.7 统计函数 116
4.7.1 描述性统计 116
4.7.2 变化率 119
4.7.3 协方差 120
4.7.4 相关性 120
4.7.5 数据排名 121
4.8 分组与聚合 122
4.8.1 分组 122
4.8.2 聚合 124
4.9 透视表与交叉表 127
4.9.1 透视表 127
4.9.2 交叉表 128
小结 129
习题 129
实验 129
第5章 数据预处理 134
5.1 数据清洗 134
5.1.1 重复值 134
5.1.2 缺失值 135
5.1.3 异常值 140
5.2 合并连接与重塑 142
5.2.1 merge合并 142
5.2.2 concat合并 144
5.2.3 combine-first合并 146
5.2.4 数据重塑 147
5.3 数据变换 149
5.3.1 虚拟变量 149
5.3.2 函数变换 150
5.3.3 连续属性离散化 151
5.3.4 规范化 152
5.3.5 随机采样 154
小结 156
习题 156
实验 156
第6章 Sklearn机器学习 162
6.1 术语 162
6.2 Sklearn 164
6.2.1 Sklearn数据集 165
6.2.2 Sklearn常用算法 171
6.2.3 数据预处理 175
6.2.4 数据集拆分 177
6.2.5 模型评估 177
6.2.6 Sklearn常用方法 178
6.2.7 模型的保存和载入 179
6.3 降维 179
6.3.1 PCA(主成分分析) 179
6.3.2 LDA(线性评价分析) 181
6.4 回归 182
6.4.1 线性回归 183
6.4.2 逻辑回归 184
6.4.3 回归决策树 185
6.5 分类 186
6.5.1 朴素贝叶斯 187
6.5.2 分类决策树 188
6.5.3 SVM(支持向量机) 189
6.5.4 神经网络 190
6.5.5 K-近邻算法 191
6.6 聚类 192
6.6.1 K-means算法 193
6.2.2 DBSCAN 194
小结 195
习题 195
实验 196
参考文献 200
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《分析化学》陈怀侠主编 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《国学经典诵读》(中国)严琼燕 2019
- 《思维导图 超好用英语单词书》(中国)王若琳 2019
- 《东北民歌文化研究及艺术探析》(中国)杨清波 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《两京烟云》陈诗泳,赖秀俞责任编辑;(中国)千慧 2019
- 《HTML5从入门到精通 第3版》(中国)明日科技 2019
- 《反常识》张娟责任编辑;(美国)邓肯·J.瓦茨 2019
- 《MBA大师.2020年MBAMPAMPAcc管理类联考专用辅导教材 数学考点精讲》(中国)董璞 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《花时间 我的第一堂花艺课 插花基础技法篇》(日)花时间编辑部编;陈洁责编;冯莹莹译 2020
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《清至民国中国西北戏剧经典唱段汇辑 第8卷》孔令纪 2018
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018