数据科学导论 Python语言实现PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:(意)阿尔贝托·博斯凯蒂(Alberto Boschetti),(意)卢卡·马萨罗(Luca Massaron)著;于俊伟,靳小波译
- 出 版 社:北京:机械工业出版社
- 出版年份:2016
- ISBN:9787111544340
- 页数:180 页
第1章 新手上路 1
1.1 数据科学与Python简介 1
1.2 Python的安装 2
1.2.1 Python 2还是Python 3 3
1.2.2 分步安装 3
1.2.3 Python核心工具包一瞥 4
1.2.4 工具包的安装 7
1.2.5 工具包升级 9
1.3 科学计算发行版 9
1.3.1 Anaconda 10
1.3.2 Enthought Canopy 10
1.3.3 PythonXY 10
1.3.4 WinPython 10
1.4 IPython简介 10
1.4.1 IPython Notebook 12
1.4.2 本书使用的数据集和代码 18
1.5 小结 25
第2章 数据改写 26
2.1 数据科学过程 26
2.2 使用pandas进行数据加载与预处理 27
2.2.1 数据快捷加载 27
2.2.2 处理问题数据 30
2.2.3 处理大数据集 32
2.2.4 访问其他数据格式 36
2.2.5 数据预处理 37
2.2.6 数据选择 39
2.3 使用分类数据和文本数据 41
2.4 使用NumPy进行数据处理 49
2.4.1 NumPy中的N维数组 49
2.4.2 NumPy ndarray对象基础 50
2.5 创建NumPy数组 50
2.5.1 从列表到一维数组 50
2.5.2 控制内存大小 51
2.5.3 异构列表 52
2.5.4 从列表到多维数组 53
2.5.5 改变数组大小 54
2.5.6 利用NumPy函数生成数组 56
2.5.7 直接从文件中获得数组 57
2.5.8 从pandas提取数据 57
2.6 NumPy快速操作和计算 58
2.6.1 矩阵运算 60
2.6.2 NumPy数组切片和索引 61
2.6.3 NumPy数组堆叠 63
2.7 小结 65
第3章 数据科学流程 66
3.1 EDA简介 66
3.2 特征创建 70
3.3 维数约简 72
3.3.1 协方差矩阵 72
3.3.2 主成分分析 73
3.3.3 一种用于大数据的PCA变型——Randomized PCA 76
3.3.4 潜在因素分析 77
3.3.5 线性判别分析 77
3.3.6 潜在语义分析 78
3.3.7 独立成分分析 78
3.3.8 核主成分分析 78
3.3.9 受限玻耳兹曼机 80
3.4 异常检测和处理 81
3.4.1 单变量异常检测 82
3.4.2 EllipticEnvelope 83
3.4.3 OneClassSVM 87
3.5 评分函数 90
3.5.1 多标号分类 90
3.5.2 二值分类 92
3.5.3 回归 93
3.6 测试和验证 93
3.7 交叉验证 97
3.7.1 使用交叉验证迭代器 99
3.7.2 采样和自举方法 100
3.8 超参数优化 102
3.8.1 建立自定义评分函数 104
3.8.2 减少网格搜索时间 106
3.9 特征选择 108
3.9.1 单变量选择 108
3.9.2 递归消除 110
3.9.3 稳定性选择与基于L1的选择 111
3.10 小结 112
第4章 机器学习 113
4.1 线性和逻辑回归 113
4.2 朴素贝叶斯 116
4.3 K近邻 118
4.4 高级非线性算法 119
4.4.1 基于SVM的分类算法 120
4.4.2 基于SVM的回归算法 122
4.4.3 调整SVM 123
4.5 组合策略 124
4.5.1 基于随机样本的粘合策略 125
4.5.2 基于弱组合的分袋策略 125
4.5.3 随机子空间和随机分片 126
4.5.4 模型序列——AdaBoost 127
4.5.5 梯度树提升 128
4.5.6 处理大数据 129
4.6 自然语言处理一瞥 136
4.6.1 词语分词 136
4.6.2 词干提取 137
4.6.3 词性标注 137
4.6.4 命名实体识别 138
4.6.5 停止词 139
4.6.6 一个完整的数据科学示例——文本分类 140
4.7 无监督学习概述 141
4.8 小结 146
第5章 社会网络分析 147
5.1 图论简介 147
5.2 图的算法 152
5.3 图的加载、输出和采样 157
5.4 小结 160
第6章 可视化 161
6.1 matplotlib基础介绍 161
6.1.1 曲线绘图 162
6.1.2 绘制分块图 163
6.1.3 散点图 164
6.1.4 直方图 165
6.1.5 柱状图 166
6.1.6 图像可视化 167
6.2 pandas的几个图形示例 169
6.2.1 箱线图与直方图 170
6.2.2 散点图 171
6.2.3 平行坐标 173
6.3 高级数据学习表示 174
6.3.1 学习曲线 174
6.3.2 验证曲线 176
6.3.3 特征重要性 177
6.3.4 GBT部分依赖关系图 179
6.4 小结 180
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《物联网导论》张翼英主编 2020
- 《程序逻辑及C语言编程》卢卫中,杨丽芳主编 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《材料导论》张会主编 2019
- 《化工传递过程导论 第2版》阎建民,刘辉 2020
- 《星图 通往天空的旅程》(意)埃琳娜·帕西瓦迪 2019
- 《鲍勃·迪伦》(意)马克·波利佐提著洪兵译 2020
- 《阿德勒》(奥)阿尔弗雷德·阿德勒著 2019
- 《文明的衰落与复兴》张娜责编;陈维政总主编;孙林译者;(德)阿尔伯特·史怀哲 2019
- 《艺术中的经典文学形象与故事》(意)弗兰切斯卡·佩莱格里诺,(意)费代里科·皮波莱蒂 2019
- 《给演员的简单手册》(意)达里奥·福,(意)弗兰卡·拉梅(Franca Rame)著 2019
- 《大话西方艺术史》意公子著 2020
- 《量子系统的非平衡多体理论》(意)G.斯蒂芬尼茨,(德)R.冯·莱文 2019
- 《CCNA网络安全运营SECFND 210-250认证考试指南》(美)奥马尔·桑托斯(OmarSantos),约瑟夫·穆尼斯(JosephMuniz),(意) 2019
- 《牙髓病学 生物学与临床视角》(意)多米尼科·里库奇,(巴西)小约瑟·斯奎拉编;陈刚,殷欣,苏阳责编;刘贺,汪林译 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019