Python数据分析实战PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:(印)伊凡·伊德里斯著;冯博,严嘉阳译
- 出 版 社:北京:机械工业出版社
- 出版年份:2017
- ISBN:9787111576402
- 页数:330 页
第1章 为可重复的数据分析奠定基础 1
1.1 简介 1
1.2 安装Anaconda 2
1.3 安装数据科学工具包 3
1.4 用virtualenv和virtualenvwrapper创建Python虚拟环境 5
1.5 使用Docker镜像沙盒化Python应用 6
1.6 在IPython Notebook中记录软件包的版本和历史 8
1.7 配置IPython 11
1.8 学习为鲁棒性错误校验记录日志 13
1.9 为你的代码写单元测试 16
1.10 配置pandas 18
1.11 配置matplotlib 20
1.12 为随机数生成器和NumPy打印选项设置种子 23
1.13 使报告、代码风格和数据访问标准化 24
第2章 创建美观的数据可视化 28
2.1 简介 28
2.2 图形化安斯库姆四重奏 28
2.3 选择Seaborn的调色板 31
2.4 选择matplotlib的颜色表 33
2.5 与IPython Notebook部件交互 35
2.6 查看散点图矩阵 38
2.7 通过mpld3使用d3.js进行可视化 40
2.8 创建热图 41
2.9 把箱线图、核密度图和小提琴图组合 44
2.10 使用蜂巢图可视化网络图 45
2.11 显示地图 47
2.12 使用类ggplot2图 49
2.13 使用影响图高亮数据 51
第3章 统计数据分析和概率 53
3.1 简介 53
3.2 将数据拟合到指数分布 53
3.3 将聚合数据拟合到伽马分布 55
3.4 将聚合计数拟合到泊松分布 57
3.5 确定偏差 59
3.6 估计核密度 61
3.7 确定均值、方差和标准偏差的置信区间 64
3.8 使用概率权重采样 66
3.9 探索极值 68
3.10 使用皮尔逊相关系数测量变量之间的相关性 71
3.11 使用斯皮尔曼等级相关系数测量变量之间的相关性 74
3.12 使用点二列相关系数测量二值变量和连续变量的相关性 77
3.13 评估变量与方差分析之间的关系 78
第4章 处理数据和数值问题 81
4.1 简介 81
4.2 剪辑和过滤异常值 81
4.3 对数据进行缩尾处理 84
4.4 测量噪声数据的集中趋势 85
4.5 使用Box-Cox变换进行归一化 88
4.6 使用幂阶梯转换数据 90
4.7 使用对数转换数据 91
4.8 重组数据 93
4.9 应用logit()来变换比例 95
4.10 拟合鲁棒线性模型 97
4.11 使用加权最小二乘法考虑方差 99
4.12 使用任意精度进行优化 101
4.13 使用任意精度的线性代数 103
第5章 网络挖掘、数据库和大数据 107
5.1 简介 107
5.2 模拟网页浏览 108
5.3 网络数据挖掘 110
5.4 处理非ASCⅡ文本和HTML实体 112
5.5 实现关联表 114
5.6 创建数据库迁移脚本 117
5.7 在已经存在的表中增加一列 117
5.8 在表创建之后添加索引 118
5.9 搭建一个测试Web服务器 120
5.10 实现具有事实表和维度表的星形模式 121
5.11 使用Hadoop分布式文件系统 126
5.12 安装配置Spark 127
5.13 使用Spark聚类数据 128
第6章 信号处理和时间序列 132
6.1 简介 132
6.2 使用周期图做频谱分析 132
6.3 使用Welch算法估计功率谱密度 134
6.4 分析峰值 136
6.5 测量相位同步 138
6.6 指数平滑法 140
6.7 评估平滑法 142
6.8 使用Lomb-Scargle周期图 145
6.9 分析音频的频谱 146
6.10 使用离散余弦变换分析信号 149
6.11 对时序数据进行块自举 151
6.12 对时序数据进行动态块自举 153
6.13 应用离散小波变换 155
第7章 利用金融数据分析选择股票 159
7.1 简介 159
7.2 计算简单收益率和对数收益率 159
7.3 使用夏普比率和流动性对股票进行排名 161
7.4 使用卡玛和索提诺比率对股票进行排名 162
7.5 分析收益统计 164
7.6 将个股与更广泛的市场相关联 166
7.7 探索风险与收益 169
7.8 使用非参数运行测试检验市场 170
7.9 测试随机游走 173
7.10 使用自回归模型确定市场效率 175
7.11 为股票价格数据库建表 177
7.12 填充股票价格数据库 178
7.13 优化等权重双资产组合 183
第8章 文本挖掘和社交网络分析 186
8.1 简介 186
8.2 创建分类的语料库 186
8.3 以句子和单词标记化新闻文章 189
8.4 词干提取、词形还原、过滤和TF-IDF得分 189
8.5 识别命名实体 193
8.6 提取带有非负矩阵分解的主题 194
8.7 实现一个基本的术语数据库 196
8.8 计算社交网络密度 200
8.9 计算社交网络接近中心性 201
8.10 确定中介中心性 202
8.11 评估平均聚类系数 203
8.12 计算图的分类系数 204
8.13 获得一个图的团数 205
8.14 使用余弦相似性创建文档图 206
第9章 集成学习和降维 209
9.1 简介 209
9.2 递归特征消除 210
9.3 应用主成分分析来降维 211
9.4 应用线性判别分析来降维 213
9.5 多模型堆叠和多数投票 214
9.6 学习随机森林 217
9.7 使用RANSAC算法拟合噪声数据 220
9.8 使用Bagging来改善结果 222
9.9 用于更好学习的Boosting算法 224
9.10 嵌套交叉验证 227
9.11 使用joblib重用模型 229
9.12 层次聚类数据 231
9.13 Theano之旅 232
第10章 评估分类器、回归器和聚类 235
10.1 简介 235
10.2 直接使用混淆矩阵分类 235
10.3 计算精度、召回率和F1分数 237
10.4 检测接收器操作特性和曲线下的面积 240
10.5 可视化拟合优度 242
10.6 计算均方误差和中值绝对误差 243
10.7 用平均轮廓系数评估聚类 245
10.8 将结果与伪分类器进行比较 247
10.9 确定平均绝对百分误差和平均百分误差 250
10.10 与伪回归器进行比较 252
10.11 计算平均绝对误差和残差平方和 254
10.12 检查分类的kappa系数 256
10.13 运用Matthews相关系数 258
第11章 图像分析 261
11.1 简介 261
11.2 安装OpenCV 261
11.3 应用尺度不变特征变换(SIFT) 264
11.4 使用加速鲁棒特征检测特征 265
11.5 量化颜色 267
11.6 图像降噪 269
11.7 提取图像区域 270
11.8 使用Haar级联进行面部识别 272
11.9 搜索明亮的星星 275
11.10 从图像中提取元数据 278
11.11 从图像中提取纹理特征 280
11.12 对图像应用层次聚类 282
11.13 使用光谱聚类分割图像 283
第12章 并行和性能 285
12.1 简介 285
12.2 使用Numba做即时编译 286
12.3 使用Numexpr加速数值表达式 288
12.4 使用线程模块运行多线程 289
12.5 使用concurrent.futures模块启动多任务 291
12.6 使用asyncio模块异步访问资源 294
12.7 使用execnet做分布式处理 297
12.8 分析内存使用情况 299
12.9 计算平均值、方差、偏度和峰度 300
12.10 使用最近最少使用算法进行缓存 304
12.11 缓存HTTP请求 306
12.12 使用Count-min sketch进行流式统计 308
12.13 充分利用GPU和OpenGL 310
附录A 术语表 313
附录B 函数参考 317
附录C 在线资源 323
附录D 命令行和其他工具的一些提示和技巧 326
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《分析化学》陈怀侠主编 2019
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《Python3从入门到实战》董洪伟 2019
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019