Python数据科学实践指南PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:纪路著
- 出 版 社:北京:机械工业出版社
- 出版年份:2017
- ISBN:7111566526
- 页数:241 页
第0章 发现、出发 1
0.1 何谓数据科学 1
0.1.1 海量的数据与科学的方法 2
0.1.2 数据科学并不是新概念 3
0.1.3 数据科学是一个系统工程 3
0.2 如何成为数据科学家 4
0.3 为什么是Python 6
0.4 一个简单的例子 8
第1章 Python介绍 9
1.1 Python的版本之争 10
1.2 Python解释器 11
1.2.1 Mac OS X系统 11
1.2.2 Linux系统 11
1.2.3 Windows系统 12
1.3 第一段Python程序 14
1.4 使用Python shell调试程序 15
第2章 Python基础知识 19
2.1 应当掌握的基础知识 19
2.1.1 基础数据类型 19
2.1.2 变量和赋值 21
2.1.3 操作符及表达式 22
2.1.4 文本编辑器 23
2.2 字符串 27
2.3 获取键盘输入 29
2.4 流程控制 30
2.4.1 条件判断 30
2.4.2 循环 31
2.4.3 缩进、空白和注释 33
第3章 函数及异常处理 35
3.1 函数和函数的参数 36
3.1.1 定义函数 37
3.1.2 关键字参数和默认参数 38
3.1.3 可变数量的参数 39
3.1.4 递归 40
3.2 闭包 41
3.3 异常和断言 44
第4章 高级字符串处理 47
4.1 字符集和字符编码 47
4.1.1 ASCII字符集和编码 48
4.1.2 Unicode字符集及UTF-8编码 49
4.2 字符串操作和格式化 51
4.2.1 字符串的基本操作 51
4.2.2 字符串分割 52
4.2.3 字符串格式化 52
4.3 正则表达式 53
4.3.1 正则表达式入门 54
4.3.2 在Python中使用正则表达式 57
第5章 容器和collections 60
5.1 元组 60
5.2 列表 62
5.2.1 引用传递 64
5.2.2 列表解析式 65
5.3 字典 66
5.4 collections 69
5.4.1 namedtuple 69
5.4.2 Counter 70
5.4.3 defaultdict 71
5.4.4 OrderedDict 71
第6章 Python标准库简介 73
6.1 math模块 73
6.1.1 常见常量 73
6.1.2 无穷 74
6.1.3 整数转换 75
6.1.4 绝对值和符号 76
6.1.5 常用计算 77
6.1.6 指数和对数 77
6.2 time 79
6.3 random 82
6.3.1 随机数生成器 82
6.3.2 取样 84
6.4 glob和fileinput 85
6.5 bz2和gzip 87
6.6 pprint 88
6.7 traceback 90
6.8 JSON 91
第7章 用Python读写外部数据 93
7.1 CSV文件的读写 94
7.1.1 读取CSV文件 94
7.1.2 创建CSV文件 95
7.1.3 处理方言 96
7.1.4 将读取的结果转换成字典 97
7.2 Excel文件的读写 98
7.2.1 读取Excel文件 98
7.2.2 写Excel文件 99
7.3 MySQL的读写 101
7.3.1 写入MySQL 103
7.3.2 读取MySQL 105
第8章 统计编程 106
8.1 描述性统计 106
8.1.1 人口普查数据 106
8.1.2 均值和中位数 110
8.1.3 方差和标准差 111
8.1.4 分布 113
8.2 数据可视化入门 116
8.2.1 pyplot基础 116
8.2.2 柱状图和饼图 119
8.3 概率 122
第9章 爬虫入门 124
9.1 网络资源及爬虫的基本原理 124
9.2 使用request模块获取HTML内容 127
9.2.1 关于HTTP协议 127
9.2.2 使用requests的get方法获取HTML内容 129
9.3 使用Xpath解析HTML中的内容 133
9.3.1 HTML的层级和Xpath的基本概念 134
9.3.2 使用谷歌浏览器快速创建Xpath路径 137
9.3.3 使用谷歌浏览器复制需要JS渲染的HTML页面 138
9.4 实战:爬取京东商品品类及品牌列表 144
第10章 数据科学的第三方库介绍 149
10.1 Numpy入门和实战 149
10.1.1 Numpy基础 150
10.1.2 Numpy基本运算 153
10.1.3 Numpy高级特性 159
10.1.4 kNN实战 162
10.2 Pandas的入门和实战 167
10.2.1 Pandas基础 168
10.2.2 泰坦尼克号生存率分析实战 176
10.3 Scikit-learn入门和实战 180
10.3.1 机器学习术语 181
10.3.2 Scikit-learn基础 183
10.3.2 实战 186
第11章 利用Python进行图数据分析 193
11.1 图基础 193
11.2 NetworkX入门 194
11.2.1 基本操作 194
11.2.2 为图中的元素添加属性 196
11.2.3 有向图及节点的度数 197
11.2.4 构建图及图的操作 197
11.3 使用NetworkX进行图分析 199
11.3.1 利用联通子图发现社区 199
11.3.2 通过三角计算强化社区发现 201
11.3.3 利用PageRank发现影响力中心 202
第12章 大数据工具入门 204
12.1 Hadoop 204
12.1.1 Hadoop的计算原理 205
12.1.2 在Hadoop上运行Python程序 208
12.2 Spark 211
12.2.1 为什么需要Spark 211
12.2.2 如何学习Spark 212
12.3 大数据与数据科学的区别 215
附录A 编写Python 2与Python 3兼容的代码 217
附录B 安装完整的Python开发环境 225
附录C 常用的Python技巧 235
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《语文教育教学实践探索》陈德收 2018
- 《彼得·布鲁克导演实践研究》邓小玲著 2019
- 《反思性实践》胡红梅, 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《高含硫气藏开发腐蚀控制技术与实践》唐永帆,张强 2018
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《吹哨人》薛晓路著 2019
- 《四书白话英语新译 上》王方路著 2019
- 《四书白话英语新译 下》王方路著 2019
- 《全球化与人文学术的现代性》王晓路著 2019
- 《人生哲理诗》于路著 2011
- 《职工教育统计学》韩路著 1989
- 《天堂十记》曹征路著 2013
- 《点点滴滴在心头》骆宾路著 2010
- 《风景摄影史》林路著 2014
- 《刁兵张晓峰》张玉红,曾明路著 2013
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019