Python数据科学导论概念技术与应用PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:(西)劳拉·伊瓜尔,(西)桑蒂·塞吉等著;章宗长,王艺深等译
- 出 版 社:北京:机械工业出版社
- 出版年份:2018
- ISBN:9787111604648
- 页数:190 页
第1章 数据科学概述 1
1.1 什么是数据科学 1
1.2 关于本书 2
第2章 数据专家的工具箱 4
2.1 引言 4
2.2 为什么选择Python 4
2.3 数据专家的基本Python库 5
2.3.1 数值和科学计算:NumPy和SciPy 5
2.3.2 Scikit-learn : Python中的机器学习库 5
2.3.3 Pandas:Python数据分析库 5
2.4 数据科学生态系统的安装 6
2.5 集成开发环境 6
2.5.1 网络集成开发环境:Jupyter 7
2.6 数据专家从Python开始 7
2.6.1 读取 11
2.6.2 选择数据 13
2.6.3 筛选数据 14
2.6.4 筛选缺失的数据 15
2.6.5 处理数据 15
2.6.6 排序 19
2.6.7 分组数据 20
2.6.8 重排数据 21
2.6.9 对数据进行排名 22
2.6.10 绘图 23
2.7 小结 24
第3章 描述统计学 25
3.1 引言 25
3.2 数据准备 25
3.2.1 Adult数据集示例 26
3.3 探索性数据分析 28
3.3.1 汇总数据 28
3.3.2 数据分布 31
3.3.3 离群点的处理 33
3.3.4 测量不对称性:偏度和皮尔逊中值偏度系数 36
3.3.5 连续分布 38
3.3.6 核密度 39
3.4 估计 41
3.4.1 样本和估计均值、方差和标准记分 41
3.4.2 协方差、皮尔逊相关和斯皮尔曼秩相关 42
3.5 小结 44
参考文献 45
第4章 统计推断 46
4.1 引言 46
4.2 统计推断:频率论方法 46
4.3 测量估计的差异性 47
4.3.1 点估计 47
4.3.2 置信区间 50
4.4 假设检验 53
4.4.1 用置信区间检验假设 53
4.4.2 使用p值检验假设 55
4.5 效应E是真实的吗 57
4.6 小结 57
参考文献 58
第5章 监督学习 59
5.1 引言 59
5.2 问题 60
5.3 第一步 60
5.4 什么是学习? 69
5.5 学习曲线 70
5.6 训练、验证和测试 73
5.7 两种学习模型 76
5.7.1 学习三要素 76
5.7.2 支持向量机 77
5.7.3 随机森林 79
5.8 结束学习过程 80
5.9 商业案例 81
5.10 小结 83
参考文献 83
第6章 回归分析 84
6.1 引言 84
6.2 线性回归 84
6.2.1 简单线性回归 85
6.2.2 多元线性回归和多项式回归 90
6.2.3 稀疏模型 90
6.3 逻辑斯蒂回归 97
6.4 小结 99
参考文献 99
第7章 无监督学习 100
7.1 引言 100
7.2 聚类 100
7.2.1 相似度和距离 101
7.2.2 什么是一个好的聚类?定义衡量聚类质量的度量 101
7.2.3 聚类技术的分类标准 104
7.3 案例学习 113
7.4 小结 118
参考文献 119
第8章 网络分析 120
8.1 引言 120
8.2 图的基本定义 121
8.3 社交网络分析 122
8.3.1 NetworkX基础 122
8.3.2 实际案例:Facebook数据集 123
8.4 中心性 125
8.4.1 在图中绘制中心性 130
8.4.2 PageRank 132
8.5 自我网络 134
8.6 社区发现 138
8.7 小结 139
参考文献 139
第9章 推荐系统 140
9.1 引言 140
9.2 推荐系统如何工作? 140
9.2.1 基于内容的过滤 141
9.2.2 协作过滤 141
9.2.3 混合推荐系统 141
9.3 建模用户偏好 142
9.4 评估推荐系统 142
9.5 实际案例 143
9.5.1 MovieLens数据集 143
9.5.2 基于用户的协作过滤 145
9.6 小结 153
参考文献 153
第10章 用于情感分析的统计自然语言处理 154
10.1 引言 154
10.2 数据清洗 155
10.3 文本表示 158
10.3.1 二元组和n元组 163
10.4 实际案例 163
10.5 小结 168
参考文献 168
第11章 并行计算 169
11.1 引言 169
11.2 架构 170
11.2.1 入门指南 171
11.2.2 连接到集群(引擎) 171
11.3 多核编程 172
11.3.1 引擎的直接视图 172
11.3.2 引擎的负载均衡视图 175
11.4 分布式计算 176
11.5 实际应用:纽约出租车旅行 177
11.5.1 直接视图非阻塞方案 178
11.5.2 实验结果 180
11.6 小结 182
参考文献 182
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《当代翻译美学的理论诠释与应用解读》宁建庚著 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《手工咖啡 咖啡爱好者的完美冲煮指南》(美国)杰茜卡·伊斯托,安德烈亚斯·威尔霍夫 2019
- 《写给孩子的趣味天文学》(俄)雅科夫·伊西达洛维奇·别莱利曼著 2019
- 《写给孩子的趣味物理学》(俄)雅科夫·伊西达洛维奇·别莱利曼著 2019
- 《三个世界的西班牙人》(西)胡安·拉蒙·希梅内斯 2018
- 《猫咪之书》(俄罗斯)阿列克谢·伊古德斯曼 2018
- 《极线杀手 来自严寒》(西)维克托·桑托斯 2019
- 《会飞的猪》(俄罗斯)阿列克谢·伊古德斯曼 2018
- 《巴拉巴西成功定律》匈牙利)艾伯特-拉斯洛?巴拉巴西 2019
- 《吉他自学一本通 吉他弹唱·独奏·乐理教程》陈飞,伊家林 2020
- 《动物园 2》(俄罗斯)阿列克谢·伊古德斯曼,王澎 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019