《利用Python进行数据分析》PDF下载

  • 购买积分:15 如何计算积分?
  • 作  者:(美)麦金尼著;唐学韬等译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2014
  • ISBN:9787111436737
  • 页数:452 页
图书介绍:本书首先阐述了为什么选择Python进行数据分析;通过示例来阐述如何使用数据;深入介绍了IPython——一个交互式的计算和开发环境,包括IPython的基础、功能、特性、运行环境、代码开发,以及基于Qt的丰富的GUI控制台、matplotlib集成和pylab模式、使用命令查看、搜索和重用历史记录;并且介绍了NumPy的基础:数组和矢量化计算;通过pandas数据结构分析介绍Python在数据分析方面的优势;在数据加载、存储和文件格式章节介绍了阅读和写作中的文本格式的数据,包括读取、写入、以及分割文本文件;数据处理:清洁、转换、合并和重塑,包括:合并和合并数据集、合并数据库风格DataFrame、结合数据与重叠等;通过分析与汇总数据来绘图和可视化数据,包括关于大熊猫的数据可视化、线图、直方图和密度图、散点图等;数据汇总和分析;时间序列,日期和时间数据类型和工具;金融和经济数据应用;先进的numpy,ndarray对象内部、numpy的DTYPE层次;附录部分介绍了Python语言,包括:Python解释器、基础知识、语言的语义、标量类型、控制流、数据结构和序列、元组、表等。

前言 1

第1章 准备工作 5

本书主要内容 5

为什么要使用Python进行数据分析 6

重要的Python库 7

安装和设置 10

社区和研讨会 16

使用本书 16

致谢 18

第2章 引言 20

来自bit.ly的1.usa.gov数据 21

MovieLens 1M数据集 29

1880—2010年间全美婴儿姓名 35

小结及展望 47

第3章 IPython:一种交互式计算和开发环境 48

IPython基础 49

内省 51

使用命令历史 60

与操作系统交互 63

软件开发工具 66

IPython HTML Notebook 75

利用IPython提高代码开发效率的几点提示 77

高级IPython功能 79

致谢 81

第4章 NumPy基础:数组和矢量计算 82

NumPy的ndarray:一种多维数组对象 83

通用函数:快速的元素级数组函数 98

利用数组进行数据处理 100

用于数组的文件输入输出 107

线性代数 109

随机数生成 111

范例:随机漫步 112

第5章 pandas入门 115

pandas的数据结构介绍 116

基本功能 126

汇总和计算描述统计 142

处理缺失数据 148

层次化索引 153

其他有关pandas的话题 158

第6章 数据加载、存储与文件格式 162

读写文本格式的数据 162

二进制数据格式 179

使用HTML和Web API 181

使用数据库 182

第7章 数据规整化:清理、转换、合并、重塑 186

合并数据集 186

重塑和轴向旋转 200

数据转换 204

字符串操作 217

示例:USDA食品数据库 224

第8章 绘图和可视化 231

matplotlib API入门 231

pandas中的绘图函数 244

绘制地图:图形化显示海地地震危机数据 254

Python图形化工具生态系统 260

第9章 数据聚合与分组运算 263

GroupBy技术 264

数据聚合 271

分组级运算和转换 276

透视表和交叉表 288

示例:2012联邦选举委员会数据库 291

第10章 时间序列 302

日期和时间数据类型及工具 303

时间序列基础 307

日期的范围、频率以及移动 311

时区处理 317

时期及其算术运算 322

重采样及频率转换 327

时间序列绘图 334

移动窗口函数 337

性能和内存使用方面的注意事项 342

第11章 金融和经济数据应用 344

数据规整化方面的话题 344

分组变换和分析 355

更多示例应用 361

第12章 NumPy高级应用 368

ndarray对象的内部机理 368

高级数组操作 370

广播 378

ufunc高级应用 383

结构化和记录式数组 386

更多有关排序的话题 388

NumPy的matrix类 393

高级数组输入输出 395

性能建议 397

附录A Python语言精要 401