第1章 什么是数据科学 1
第1单元 数据分析步骤 2
第2单元 数据获取途径 3
第3单元 报告的结构 4
轮到你了 5
第2章 数据科学的Python核心 6
第4单元 理解基本的字符串函数 6
第5单元 选择合适的数据结构 8
第6单元 通过列表推导式理解列表 9
第7单元 使用计数器 10
第8单元 使用文件 11
第9单元 上网 12
第10单元 使用正则表达式实现模式匹配 13
第11单元 globbing文件名与其他字符串 17
第12单元 Pickling和Unpickling数据 18
轮到你了 18
第3章 使用文本数据 20
第13单元 处理HTML文件 20
第14单元 处理CSV文件 24
第15单元 读取JSON文件 25
第16单元 处理自然语言中的文本 27
轮到你了 31
第4章 使用数据库 33
第17单元 设置MySQL数据库 33
第18单元 使用MySQL数据库:命令行 36
第19单元 使用MySQL数据库:pymysql 39
第20单元 改善文档存储:MongoDB 41
轮到你了 44
第5章 使用表格形式的数值数据 45
第21单元 创建数组 46
第22单元 转置和重排 48
第23单元 索引和切片 49
第24单元 广播 51
第25单元 揭秘通用函数 52
第26单元 理解条件函数 54
第27单元 数组的聚合与排序 54
第28单元 将数组用作集合 56
第29单元 数组的保存和读取 57
第30单元 生成合成正弦波 57
轮到你了 59
第6章 使用series和frame 61
第31单元 pandas数据结构 62
第32单元 数据重塑 67
第33单元 处理缺失数据 72
第34单元 组合数据 75
第35单元 数据的排序和描述 78
第36单元 数据转换 82
第37单元 掌握pandas的文件读写功能 87
轮到你了 90
第7章 使用网络数据 91
第38单元 概念剖析 91
第39单元 网络分析序列 94
第40单元 使用networkx 95
轮到你了 101
第8章 绘图 103
第41单元 使用PyPlot进行基本绘图 104
第42单元 了解其他绘图类型 106
第43单元 精通绘图装饰 107
第44单元 用pandas绘图 109
轮到你了 111
第9章 概率与统计 113
第45单元 回顾概率分布 113
第46单元 回顾统计度量 115
第47单元 以Python的方式完成统计 117
轮到你了 120
第10章 机器学习 122
第48单元 设计预测实验 122
第49单元 线性回归拟合 124
第50单元 用k均值聚类实现数据分组 129
第51单元 在随机决策森林中生存 131
轮到你了 133
附录1 扩展阅读 135
附录2 单星项目的解决方案 137
参考文献 146