本书简介 1
基础编 1
1 数据科学简介 3
1.1 什么是数据科学 3
1.2 如何学习数据科学 4
1.3 什么是数据科学家 4
1.4 数据科学家需要掌握的技能 6
1.5 Python与数据科学 7
1.6 数据科学领域常用的Python包 9
本章小结 12
参考文献 12
2 Python基础知识 13
2.1 Python基本概念 13
2.2 序列和基本语句 27
2.3 函数和模块 45
本章小结 63
习题 63
参考文献 64
分析编 65
3 Python数据获取与数据预处理 67
3.1 Python数据获取 67
3.2 Python数据预处理 92
本章小结 128
习题 129
参考文献 129
4 利用Python进行数据分析 130
4.1 数据分析与Python 130
4.2 基本统计分析 145
4.3 主成分分析(PCA) 155
4.4 线性回归 160
本章小结 166
习题 166
参考文献 167
挖掘编 169
5 利用Python进行数据挖掘 171
5.1 数据挖掘与Python 171
5.2 k最近邻 176
5.3 决策树 184
5.4 朴素贝叶斯 197
5.5 逻辑回归 204
5.6 Apriori算法 214
5.7 聚类分析 222
5.8 随机森林 238
本章小结 243
习题 244
参考文献 246
6 利用Python进行文本挖掘 247
6.1 文本挖掘简介 247
6.2 Python与文本分类 266
6.3 Python与文本聚类 274
6.4 Python与文本情感分析 281
6.5 Python与全文检索 286
本章小结 293
习题 294
参考文献 294
提高编 297
7 Python与海量数据处理简介 299
7.1 Spark简介 299
7.2 PageRank 305
7.3 Python与推荐系统 322
本章小结 341
习题 341
参考文献 342