《Python数据分析从入门到精通》PDF下载

  • 购买积分:12 如何计算积分?
  • 作  者:张啸宇,李静编著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2018
  • ISBN:9787121336133
  • 页数:316 页
图书介绍:本书主要介绍如何使用Python进行数据分析。前8章主要介绍学习数据分析必要的一些Python语法基础,包括Python的安装、数据类型、数据结构、模块、类、异常处理,然后还有如何使用pip安装Python需要的一些工具。第9~13章主要介绍Python在数据处理和科学计算方面的工具和方法,包括IPython交互式壳的使用、jupter notebook的使用和Numpy的使用,还介绍了Python的核心数据处理分析库pandas,和Python著名的2D绘图库Matplotlib。第14~15章通过数据挖掘和大数据分析两个案例总结和应用前面的所学。

第1篇 Python数据分析语法入门 1

第1章 初识Python 1

1.1 Python是什么 2

1.2 Python有什么优点 3

1.2.1 Python是自由开源的软件 3

1.2.2 Python是跨平台的 3

1.2.3 Python功能强大 4

1.2.4 Python是可扩展的 4

1.2.5 Python易学易用 5

1.3 其他程序设计语言中的Python 5

1.3.1 Jython 5

1.3.2 Python for.NET 6

1.3.3 IronPython 6

1.4 快速搭建Python开发环境 7

1.4.1 Python的下载和安装 7

1.4.2 用Visual Studio编译Python源代码 9

1.4.3 Python开发工具:Vim 10

1.4.4 Python开发工具:Emacs 15

1.4.5 Python开发工具:PythonWin 18

1.4.6 其他的Python开发工具 20

1.5 第一个Python程序 22

1.5.1 从“Hello,Python!”开始 22

1.5.2 Python的交互式命令行 24

1.6 本章小结 25

第2章 Python起步必备 27

2.1 Python代码的组织形式和注释方式 27

2.1.1 用缩进来分层 28

2.1.2 代码的两种注释方式 29

2.1.3 Python语句的断行 30

2.2 Python的基本输入/输出函数 31

2.2.1 接收输入的input()函数 31

2.2.2 输出内容的print()函数 32

2.3 Python对中文的支持 33

2.3.1 Python 3之前的版本如何使用中文 33

2.3.2 更全面的中文支持 36

2.4 简单实用的Python计算器 37

2.4.1 直接进行算术运算 37

2.4.2 math模块提供丰富的数学函数 38

2.4.3 Python对大整数的支持 39

2.5 本章小结 40

第3章 Python的数据类型与流程控制语句 41

3.1 Python数据类型:数字 42

3.1.1 整型和浮点型 42

3.1.2 运算符 43

3.2 Python数据类型:字符串 45

3.2.1 Python中的字符串 45

3.2.2 字符串中的转义字符 46

3.2.3 操作字符串 46

3.2.4 字符串的索引和分片 49

3.2.5 格式化字符串 50

3.2.6 字符串、数字类型的转换 50

3.2.7 原始字符串 51

3.3 Python数据类型:列表和元组 52

3.3.1 创建和操作列表 52

3.3.2 创建和操作元组 53

3.4 Python数据类型:字典 54

3.5 Python数据类型:文件 55

3.6 Python数据类型:布尔值 56

3.7 Python的流程控制语句 56

3.7.1 分支结构:if语句 57

3.7.2 循环结构:for语句 59

3.7.3 循环结构:while语句 62

3.8 本章小结 63

第4章 可复用的函数与模块 64

4.1 Python自定义函数 65

4.1.1 函数的定义 65

4.1.2 函数调用 66

4.2 参数让函数更有价值 67

4.2.1 有默认值的参数 67

4.2.2 参数的传递方式 69

4.2.3 如何传递任意数量的参数 70

4.2.4 用参数返回计算结果 70

4.3 变量的作用域 71

4.4 最简单的函数:使用lambda表达式定义函数 72

4.5 可重用结构:Python模块 73

4.5.1 Python模块的基本用法 73

4.5.2 Python在哪里查找模块 75

4.5.3 是否需要编译模块 77

4.5.4 模块也可独立运行 78

4.5.5 如何查看模块提供的函数名 79

4.6 用包来管理多个模块 80

4.6.1 包的组成 80

4.6.2 包的内部引用 81

4.7 本章小结 81

第5章 数据结构与算法 82

5.1 表、栈和队列 82

5.1.1 表 83

5.1.2 栈 84

5.1.3 队列 86

5.2 树和图 88

5.2.1 树 88

5.2.2 二叉树 89

5.2.3 图 93

5.3 查找与排序 95

5.3.1 查找 96

5.3.2 排序 97

5.4 本章小结 100

第6章 面向对象的Python 101

6.1 面向对象编程概述 101

6.1.1 Python中的面向对象思想 102

6.1.2 类和对象 102

6.2 在Python中定义和使用类 103

6.2.1 类的定义 104

6.2.2 类的使用 105

6.3 类的属性和方法 106

6.3.1 类的属性 107

6.3.2 类的方法 108

6.4 类的继承 111

6.4.1 使用继承 111

6.4.2 Python的多重继承 112

6.5 在类中重载方法和运算符 114

6.5.1 方法重载 114

6.5.2 运算符重载 115

6.6 在模块中定义类 117

6.7 本章小结 119

第7章 异常处理与程序调试 120

7.1 异常的处理 120

7.1.1 使用try语句捕获异常 121

7.1.2 常见异常的处理 123

7.1.3 多重异常的捕获 124

7.2 用代码引发异常 125

7.2.1 使用raise语句引发异常 126

7.2.2 assert——简化的raise语句 127

7.2.3 自定义异常类 128

7.3 使用pdb模块调试Python脚本 128

7.3.1 调试语句块 129

7.3.2 调试表达式 129

7.3.3 调试函数 130

7.3.4 设置断点 131

7.3.5 pdb调试命令 131

7.4 在PythonWin中调试脚本 134

7.5 本章小结 136

第8章 Pip软件包管理 137

8.1 安装pip 137

8.2 更新pip 138

8.3 pip常用操作 138

8.3.1 安装软件包 138

8.3.2 卸载软件包 139

8.3.3 更新软件包 139

8.3.4 显示本地所有已经安装的软件包 139

8.3.5 显示软件包的细节 139

8.3.6 搜索软件包 140

8.3.7 通过wheel文件安装软件包 141

8.4 本章小结 141

第2篇 Python数据分析工具入门 142

第9章 IPython科学计算库 142

9.1 IPython简介 143

9.2 安装IPython及其他相关库 144

9.2.1 使用Anaconda安装 144

9.2.2 使用pip安装 145

9.3 IPython壳基础 146

9.3.1 自动补全 147

9.3.2 检查 149

9.3.3 %run命令 150

9.3.4 快捷键 150

9.3.5 异常和错误定位 151

9.3.6 魔法方法 151

9.3.7 和操作系统交互 152

9.3.8 代码分析:00966B00run和%run 153

9.3.9 目录标签系统 155

9.3.10 嵌入IPython 155

9.4 融合Matplotlib库和Pylab模型 156

9.5 输入和输出变量 157

9.6 交互式调试器 158

9.7 计时功能 159

9.8 重新载入模块 160

9.9 配置IPython 161

9.10 Jupyter 162

9.10.1 基于Qt的控制台 162

9.10.2 Jupyter Notebook 165

9.11 IPython和Jupyter Notebook的关系 170

9.12 本章小结 173

第10章 Numpy科学计算库 174

10.1 Numpy基础 174

10.1.1 数组对象介绍 175

10.1.2 生成数组 176

10.1.3 数组对象数据类型 180

10.1.4 打印数组 182

10.2 数组的基本操作 184

10.3 基本的分片和索引操作 186

10.4 高级索引 189

10.4.1 整数索引 189

10.4.2 布尔索引 190

10.4.3 布尔索引的简单应用 192

10.5 改变数组的形状 193

10.6 组装、分割数组 195

10.7 数组的基本函数 196

10.8 复制和指代 198

10.9 线性代数 199

10.10 使用数组来处理数据 201

10.11 Numpy的where()函数和统计函数 203

10.11.1 where()函数 203

10.11.2 统计函数 205

10.12 输入与输出 206

10.12.1 二进制文件 206

10.12.2 文本文件 207

10.13 生成随机数 208

10.14 数组的排序和查找 210

10.14.1 排序 210

10.14.2 查找 212

10.15 扩充转换 213

10.16 本章小结 215

第11章 pandas数据分析处理库 216

11.1 pandas数据结构介绍 217

11.1.1 序列 217

11.1.2 数据框 221

11.2 索引对象 226

11.3 核心的基本函数 227

11.4 索引和旋转 229

11.5 算术运算与对齐 232

11.6 处理默认值 233

11.7 多级索引 237

11.8 读/写数据 239

11.9 组合数据 243

11.10 数据分组操作 247

11.11 时间序列 249

11.11.1 时间序列介绍 250

11.11.2 使用时间序列作图 253

11.12 本章小结 259

第12章 Matplotlib数据可视化 260

12.1 Pyplot模块介绍 261

12.1.1 plot()函数 261

12.1.2 绘制子图 264

12.1.3 添加注释 266

12.1.4 其他的坐标轴类型 268

12.2 应用Pyplot模块 269

12.3 Artist模块 275

12.3.1 Artist模块概述 275

12.3.2 Artist的属性 277

12.4 使用pandas绘图 283

12.5 本章小结 287

第3篇 Python数据分析案例实战 288

第13章 案例1:数据挖掘 288

13.1 贝叶斯理论介绍 288

13.2 贝叶斯分类器的实现 290

13.3 协同过滤推荐系统 295

13.3.1 相似度计算 296

13.3.2 协同过滤推荐系统的实现 300

13.4 本章小结 304

第14章 案例2:玩转大数据 305

14.1 案例概述 306

14.1.1 了解大数据的处理方式 306

14.1.2 处理日志文件 307

14.1.3 案例目标 308

14.2 日志文件的分割 309

14.3 编写Map()函数处理小文件 311

14.4 编写Reduce()函数 313

14.5 本章小结 315