轻松学大数据挖掘 算法、场景与数据产品PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:汪榕著
- 出 版 社:北京:电子工业出版社
- 出版年份:2018
- ISBN:9787121329265
- 页数:198 页
第1章 数据情怀篇 1
1.1数据之禅 1
1.2数据情怀 1
1.2.1数据情怀这股劲 2
1.2.2对数据情怀的理解 2
1.3大数据时代的我们 4
1.4成为DT时代的先驱者 6
1.4.1数据没有寒冬 6
1.4.2数据生态问题 7
1.4.3健康的数据生态 8
1.4.4结尾 8
第2章 数据入门 9
2.1快速掌握SQL的基础语法 9
2.1.1初识SQL 9
2.1.2学会部署环境 10
2.1.3常用的SQL语法(上篇) 13
2.1.4常用的SQL语法(下篇) 17
2.2在Windows 7操作系统上搭建IPython Notebook 25
2.2.1学习Python的初衷 25
2.2.2搭建IPython Notebook 26
2.2.3 IPython.exe Notebook的使用说明 27
2.2.4配置IPython Notebook远程调用 27
2.3快速掌握Python的基本语法 30
2.4用Python搭建数据分析体系 38
2.4.1构建的初衷 38
2.4.2构建思路 39
2.4.3开发流程 39
2.5 Python学习总结 44
2.5.1关于Python 45
2.5.2 Python其他知识 45
第3章 大数据工具篇 48
3.1 Hadoop伪分布式的安装配置 48
3.1.1部署CentOS环境 48
3.1.2部署Java环境 50
3.1.3部署Hadoop伪分布式环境 51
3.2数据挖掘中的MapReduce编程 54
3.2.1学习MapReduce编程的目的 54
3.2.2 MapReduce的代码规范 55
3.2.3简单的案例 58
3.3利用MapReduce中的矩阵相乘 60
3.3.1矩阵的概念 60
3.3.2不同场景下的矩阵相乘 61
3.4数据挖掘中的Hive技巧 67
3.4.1面试心得 67
3.4.2用Python执行HQL命令 67
3.4.3必知的HQL知识 69
3.5数据挖掘中的HBase技巧 75
3.5.1知晓相关依赖包 75
3.5.2从HBase中获取数据 76
3.5.3往HBase中存储数据 77
第4章 大数据挖掘基础篇 81
4.1 MapReduce和Spark做大数据挖掘的差异 81
4.1.1初识Hadoop生态系统 81
4.1.2知晓Spark的特点 83
4.1.3编程的差异性 85
4.1.4它们之间的灵活转换 88
4.1.5选择合适的工具 89
4.2搭建大数据挖掘开发环境 90
4.3动手实现算法工程 99
4.3.1知晓Spark On Yam的运作模式 101
4.3.2创作第一个数据挖掘算法 102
4.3.3如何理解“朴素”二字 103
4.3.4如何动手实现朴素贝叶斯算法 103
第5章 大数据挖掘认知篇 107
5.1理论与实践的差异 107
5.2数据挖掘中的数据清洗 110
5.2.1数据清洗的那些事 110
5.2.2大数据的必杀技 111
5.2.3实践中的数据清洗 112
5.3数据挖掘中的工具包 120
5.3.1业务模型是何物 120
5.3.2想做一个好的模型 121
第6章 大数据挖掘算法篇 123
6.1时间衰变算法 123
6.1.1何为时间衰变 123
6.1.2如何理解兴趣和偏好 124
6.1.3时间衰变算法的抽象 124
6.1.4采用Spark实现模型 126
6.2熵值法 130
6.2.1何为信息熵 130
6.2.2熵值法的实现过程 130
6.2.3业务场景的介绍 132
6.2.4算法逻辑的抽象 133
6.3预测响应算法 136
6.3.1业务场景的介绍 136
6.3.2构建模型的前期工作 137
6.3.3常用的预测模型 138
6.4层次分析算法 140
6.5工程能力的培养与实践 142
6.5.1工程能力的重要性 142
6.5.2利用Python实现层次分析法 144
第7章 用户画像实践 148
7.1用户画像的应用场景 148
7.1.1背景描述 148
7.1.2需求调研 149
7.2用户画像的标签体系 150
7.2.1需求分析 151
7.2.2标签的构建 151
7.3用户画像的模块化思维 152
7.3.1何为模块化思维 152
7.3.2用户画像与模块化思维 153
7.4用户画像的工程开发 154
7.4.1对于开发框架的选择 154
7.4.2模块化功能的设计 156
7.5用户画像的智能营销 158
7.5.1业务营销 158
7.5.2营销构思 159
7.5.3技术难点 160
第8章 反欺诈实践篇 162
8.1“羊毛党”监控的业务 162
8.1.1“羊毛党”的定义与特点 162
8.1.2“羊毛”存在的必然性 163
8.1.3“羊毛党”的进化 164
8.1.4“羊毛党”存在的利与弊 165
8.1.5“羊毛党”监控平台的意义 165
8.2“羊毛党”监控的设备指纹 166
8.2.1何为设备指纹 166
8.2.2底层参数 167
8.2.3应用场景 168
8.2.4移动端的数据持久化 169
8.2.5设备指纹生成算法 169
8.3“羊毛党”监控的数据驱动 170
8.3.1监控的目的 170
8.3.2数据如何“食用” 172
8.4“羊毛党”监控的实践分享 173
第9章 大数据挖掘践行篇 178
9.1如何从0到1转型到大数据圈子 178
9.2数据挖掘从业者综合能力评估 180
9.2.1度量的初衷 180
9.2.2综合能力评估 181
9.2.3个人指标体系(大数据挖掘) 182
9.3给想要进入数据挖掘圈子的新人一点建议 183
9.3.1诚信与包装 184
9.3.2筹备能力 185
9.3.3投好简历 186
9.3.4把握面试 186
9.3.5结尾 187
后记 数据价值探索与数据产品实践 188
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《信息系统安全技术管理策略 信息安全经济学视角》赵柳榕著 2020
- 《中国茶产业发展报告》杨江帆,李闽榕著 2019
- 《英语词汇学》汪榕培,王之江主编 2018
- 《21世纪大学新英语长篇阅读 4》汪榕培,邹申总主编 2014
- 《21世纪大学新英语长篇阅读 2》汪榕培,邹申总主编 2014
- 《21世纪大学英语应用型视听说教程 教学参考书 4》陶文好,汪榕培主编 2013
- 《21世纪大学英语应用型视听说教程教学参考书 3》汪榕培,石坚,邹申总主编;张德玉,李修江,郭剑晶,王建富本册主编;郭璐宁,王智红,刘肖丽,盖飞虹等副主编 2012
- 《21世纪大学英语应用型综合教程教学参考书 4 下》汪榕培,石坚,邹申总主编 2013
- 《21世纪大学英语应用型自主练习 4》陶文好,汪榕培主编 2013
- 《英语词汇学》汪榕培,王之江主编 2013
- 《电子测量与仪器》人力资源和社会保障部教材办公室组织编写 2009
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《通信电子电路原理及仿真设计》叶建芳 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《电子应用技术项目教程 第3版》王彰云 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017