大数据分析 数据科学应用场景与实践精髓PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:(英)贝森斯著
- 出 版 社:北京:人民邮电出版社
- 出版年份:2016
- ISBN:9787115407450
- 页数:232 页
第1章 大数据及其分析 1
1.1 大数据的业务应用场景 2
1.2 基本的专业术语 4
1.3 分析过程模型 5
1.4 分析建模活动中的任务及角色 6
1.5 分析技术 7
1.6 分析模型的要求 9
1.7 本章参考文献 11
第2章 数据采集、抽样和预处理 13
2.1 数据源的类型 13
2.2 数据抽样 15
2.3 数据类型 17
2.4 数据可视化及探索性统计分析 17
2.5 缺失值的处理 19
2.6 异常值检测及处理 20
2.7 数据标准化 24
2.8 粗分类(Categorization)处理 25
2.9 WOE值的计算 29
2.10 变量的选择 30
2.11 细分 33
2.12 本章参考文献 34
第3章 预测分析 35
3.1 定义目标变量 35
3.2 线性回归 38
3.3 Logistic回归 39
3.4 决策树 42
3.5 神经网络 48
3.6 支持向量机 57
3.7 集成算法 64
3.7.1 套袋算法(Bagging) 65
3.7.2 Boosting方法 65
3.7.3 随机森林 67
3.8 多类分类技术 68
3.8.1 多类Logistic回归 68
3.8.2 多类决策树 70
3.8.3 多类神经网络 70
3.8.4 多类支持向量机 70
3.9 预测模型的评估 72
3.9.1 数据集的分割 72
3.9.2 分类模型的性能评估 74
3.9.3 回归模型的性能评估 83
3.10 本章参考文献 84
第4章 描述性分析 89
4.1 关联规则 89
4.1.1 基本概念及假设 90
4.1.2 支持度和置信度 91
4.1.3 关联规则的挖掘 91
4.1.4 提升度的度量 93
4.1.5 关联规则的后处理 94
4.1.6 关联规则的扩展 94
4.1.7 关联规则的应用 95
4.2 序列规则 95
4.3 细分技术 97
4.3.1 分层聚类 98
4.3.2 K-Means聚类 102
4.3.3 自组织映射图(SOM) 102
4.3.4 聚类解决方案的应用及解释 104
4.4 本章参考文献 104
第5章 生存分析 107
5.1 生存分析的基本概念和函数 108
5.2 卡普兰·梅尔分析 111
5.3 参数法生存分析 113
5.4 比例风险回归模型 117
5.5 生存分析模型的扩展 119
5.6 生存分析模型的评估 120
5.7 本章参考文献 121
第6章 社交网络分析 123
6.1 社交网络的定义 123
6.2 社交网络的度量 125
6.3 社交网络学习 127
6.4 关系近邻分类器 128
6.5 概率关系近邻分类器 129
6.6 关系逻辑回归 130
6.7 共同模式推断 131
6.8 自中心网络(EGO NETS) 132
6.9 偶图/二分图 133
6.10 本章参考文献 135
第7章 从分析到生产力 137
7.1 模型的后验测试 138
7.1.1 分类模型的后验测试 139
7.1.2 回归模型的后验测试 147
7.1.3 聚类模型的后验测试 148
7.1.4 设计后验测试方案 148
7.2 参照管理 150
7.3 数据质量 154
7.4 软件工具 158
7.5 隐私保护 159
7.6 模型设计相关文档 163
7.7 公司治理 163
7.8 本章参考文献 164
第8章 实践与案例 167
8.1 信用风险建模 167
8.2 欺诈检测 172
8.3 净响应提升建模 175
8.4 流失预测 178
8.4.1 流失预测模型 179
8.4.2 流失预测流程 181
8.5 推荐系统 182
8.5.1 协同过滤推荐 182
8.5.2 基于内容的推荐 184
8.5.3 基于人口统计信息的推荐 185
8.5.4 基于知识的推荐 186
8.5.5 组合推荐 187
8.5.6 推荐系统的评价 188
8.5.7 案例介绍 189
8.6 网页分析 191
8.6.1 网页数据收集 191
8.6.2 Web KPI指标 195
8.6.3 从Web KPI到行动洞察力 198
8.6.4 导航分析 199
8.6.5 搜索引擎营销分析 200
8.6.6 A/B测试和多变量测试 201
8.7 社会化媒体分析 202
8.7.1 社交网站:B2B广告工具 204
8.7.2 情感分析 207
8.7.3 网络分析 209
8.8 业务流程分析 211
8.8.1 流程智能 213
8.8.2 流程挖掘和分析 215
8.8.3 形成闭环:全流程的整合数据分析 222
8.9 本章参考文献 226
译者后记 231
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《激光加工实训技能指导理实一体化教程 下》王秀军,徐永红主编;刘波,刘克生副主编 2017
- 《分析化学》陈怀侠主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《古代巴比伦》(英)莱昂纳德·W.金著 2019
- 《BBC人体如何工作》(英)爱丽丝.罗伯茨 2019
- 《一个数学家的辩白》(英)哈代(G.H.Hardy)著;李文林,戴宗铎,高嵘译 2019
- 《莎士比亚全集 2》(英)莎士比亚著,朱生豪等译 2002
- 《莎士比亚戏剧精选集》(英)威廉·莎士比亚(William Shakespeare)著 2020
- 《莎士比亚 叙事诗·抒情诗·戏剧》(英)威廉·莎士比亚著 2019
- 《亚历山大继业者战争 上 将领与战役》(英)鲍勃·本尼特,(英)麦克·罗伯茨著;张晓媛译 2019
- 《孩子们的音乐之旅 1 宝宝睡觉 幼儿版》包菊英主编 2016
- 《超级参与者》王金强责编;赵磊译者;(澳)杰里米·海曼斯,(英)亨利·蒂姆斯 2020
- 《物联网导论》张翼英主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《办好人民满意的教育 全国教育满意度调查报告》(中国)中国教育科学研究院 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《人民院士》吴娜著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《中国人民的心》杨朔著;夕琳编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中华人民共和国成立70周年优秀文学作品精选 短篇小说卷 上 全2册》贺邵俊主编 2019
- 《指向核心素养 北京十一学校名师教学设计 数学 九年级 上 配人教版》周志英总主编 2019
- 《中华人民共和国成立70周年优秀文学作品精选 中篇小说卷 下 全3册》洪治纲主编 2019