《图灵程序设计丛书 Python数据科学入门》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:(俄)德米特里·齐诺维耶夫(Dmitry Zinoviev)著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2017
  • ISBN:9787115470607
  • 页数:146 页
图书介绍:本书涵盖数据采集、清洗、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python核心特性,文本数据、数据库、表格形式的数值等大数据的采集、清洗、可视化和分析,概率和统计,机器学习。

第1章 什么是数据科学 1

第1单元 数据分析步骤 2

第2单元 数据获取途径 3

第3单元 报告的结构 4

轮到你了 5

第2章 数据科学的Python核心 6

第4单元 理解基本的字符串函数 6

第5单元 选择合适的数据结构 8

第6单元 通过列表推导式理解列表 9

第7单元 使用计数器 10

第8单元 使用文件 11

第9单元 上网 12

第10单元 使用正则表达式实现模式匹配 13

第11单元 globbing文件名与其他字符串 17

第12单元 Pickling和Unpickling数据 18

轮到你了 18

第3章 使用文本数据 20

第13单元 处理HTML文件 20

第14单元 处理CSV文件 24

第15单元 读取JSON文件 25

第16单元 处理自然语言中的文本 27

轮到你了 31

第4章 使用数据库 33

第17单元 设置MySQL数据库 33

第18单元 使用MySQL数据库:命令行 36

第19单元 使用MySQL数据库:pymysql 39

第20单元 改善文档存储:MongoDB 41

轮到你了 44

第5章 使用表格形式的数值数据 45

第21单元 创建数组 46

第22单元 转置和重排 48

第23单元 索引和切片 49

第24单元 广播 51

第25单元 揭秘通用函数 52

第26单元 理解条件函数 54

第27单元 数组的聚合与排序 54

第28单元 将数组用作集合 56

第29单元 数组的保存和读取 57

第30单元 生成合成正弦波 57

轮到你了 59

第6章 使用series和frame 61

第31单元 pandas数据结构 62

第32单元 数据重塑 67

第33单元 处理缺失数据 72

第34单元 组合数据 75

第35单元 数据的排序和描述 78

第36单元 数据转换 82

第37单元 掌握pandas的文件读写功能 87

轮到你了 90

第7章 使用网络数据 91

第38单元 概念剖析 91

第39单元 网络分析序列 94

第40单元 使用networkx 95

轮到你了 101

第8章 绘图 103

第41单元 使用PyPlot进行基本绘图 104

第42单元 了解其他绘图类型 106

第43单元 精通绘图装饰 107

第44单元 用pandas绘图 109

轮到你了 111

第9章 概率与统计 113

第45单元 回顾概率分布 113

第46单元 回顾统计度量 115

第47单元 以Python的方式完成统计 117

轮到你了 120

第10章 机器学习 122

第48单元 设计预测实验 122

第49单元 线性回归拟合 124

第50单元 用k均值聚类实现数据分组 129

第51单元 在随机决策森林中生存 131

轮到你了 133

附录1 扩展阅读 135

附录2 单星项目的解决方案 137

参考文献 146