大数据分析与算法PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:(挪)拉金德拉·阿卡拉卡(Rajendra Akerkar)
- 出 版 社:北京:机械工业出版社
- 出版年份:2018
- ISBN:9787111608769
- 页数:194 页
第1章 绪论 1
1.1 引言 1
1.2 数据科学的历史 2
1.3 现代商业中数据科学的重要性 3
1.4 数据科学家 5
1.5 三维数据科学活动 6
1.5.1 管理数据流 7
1.5.2 处理数据管理 8
1.5.3 数据分析 11
1.6 数据科学与其他领域交叉 11
1.7 数据分析思维 13
1.8 应用领域 13
1.8.1 资源的可持续发展 13
1.8.2 利用社交平台进行各种活动 14
1.8.3 智能Web应用 14
1.8.4 Google自动统计员项目 15
1.9 应用计算智能管理数据科学活动 15
1.10 商业中的数据科学场景 17
1.11 有助于数据科学的工具和技术 17
1.11.1 数据清洗工具 18
1.11.2 数据管理和建模工具 19
1.11.3 数据可视化工具 20
1.12 练习 21
参考文献 22
第2章 数据分析 23
2.1 引言 23
2.2 跨行业标准过程 24
2.3 数据分析生命周期 25
2.4 数据科学项目生命周期 27
2.5 数据分析的复杂性 28
2.6 从数据到洞察力 30
2.7 构建分析能力:银行案例 31
2.8 数据质量 32
2.9 数据准备过程 33
2.10 沟通分析结果 34
2.10.1 沟通分析结果的策略 34
2.10.2 数据可视化 35
2.10.3 可视化技术 36
2.11 练习 37
参考文献 37
第3章 基本学习算法 38
3.1 从数据中学习 38
3.2 监督学习 40
3.2.1 线性回归 40
3.2.2 决策树 41
3.2.3 随机森林 46
3.2.4 k-近邻算法 47
3.2.5 逻辑回归 49
3.2.6 模型组合器 50
3.2.7 朴素贝叶斯 53
3.2.8 贝叶斯信念网络 54
3.2.9 支持向量机 56
3.3 无监督学习 57
3.3.1 Apriori算法 58
3.3.2 k-means算法 60
3.3.3 用于数据压缩的降维 62
3.4 强化学习 62
3.5 案例研究:使用机器学习进行市场营销活动 65
3.6 练习 66
参考文献 67
第4章 模糊逻辑 68
4.1 引言 68
4.2 模糊隶属函数 70
4.2.1 三角形隶属函数 71
4.2.2 梯形隶属函数 71
4.2.3 高斯隶属函数 71
4.2.4 sigmoid隶属函数 72
4.3 隶属值分配方法 72
4.4 模糊化与解模糊化方法 73
4.5 模糊集合操作 73
4.5.1 模糊集合的并集 74
4.5.2 模糊集合的交集 74
4.5.3 模糊集合的补集 74
4.6 模糊集合性质 76
4.7 模糊关系 76
4.8 模糊命题 79
4.8.1 模糊连接词 79
4.8.2 析取 79
4.8.3 合取 80
4.8.4 否定 80
4.8.5 蕴含 80
4.9 模糊推理 80
4.10 基于模糊规则的系统 81
4.11 数据科学的模糊逻辑 82
4.11.1 应用1:Web内容挖掘 83
4.11.2 应用2:Web结构挖掘 84
4.11.3 应用3:Web使用挖掘 85
4.11.4 应用4:环境和社交数据处理 86
4.12 用模糊逻辑进行数据科学活动的工具和技术 87
4.13 练习 88
参考文献 88
第5章 人工神经网络 89
5.1 引言 89
5.2 符号学习方法 90
5.3 人工神经网络及其特点 91
5.4 ANN模型 93
5.4.1 Hopfield模型 93
5.4.2 感知器模型 94
5.4.3 多层感知器 96
5.4.4 多层感知器的深度学习 98
5.4.5 其他ANN模型 100
5.4.6 线性回归与神经网络 101
5.5 ANN工具和程序 102
5.6 社交网络平台上的情感挖掘 103
5.6.1 情感挖掘相关工作 103
5.6.2 广泛架构 104
5.6.3 神经网络设计 104
5.7 应用与挑战 106
5.8 关注点 107
5.9 练习 108
参考文献 109
第6章 遗传算法与进化计算 111
6.1 引言 111
6.2 遗传算法 112
6.3 遗传算法的基本原理 114
6.3.1 个体编码 114
6.3.2 变异 114
6.3.3 交叉 115
6.3.4 适应度函数 116
6.3.5 选择 116
6.3.6 其他编码策略 117
6.4 利用遗传算法进行函数优化的实例 118
6.5 模式与模式定理 120
6.5.1 实例、定义位和模式顺序 120
6.5.2 模式的重要性 121
6.6 基于特殊应用的遗传算子 121
6.7 进化编程 123
6.8 遗传算法在医疗保健中的应用 124
6.8.1 医疗保健案例 124
6.8.2 基于遗传算法的病人调度系统 125
6.8.3 编码候选者 127
6.8.4 种群上的操作 127
6.8.5 其他应用 128
6.9 练习 130
参考文献 131
第7章 其他元启发式和分类方法 132
7.1 引言 132
7.2 自适应记忆过程 132
7.2.1 禁忌搜索 133
7.2.2 分散搜索 134
7.2.3 路径重连 136
7.3 群体智能 136
7.3.1 蚁群优化 137
7.3.2 人工蜂群算法 138
7.3.3 河流形成动力学 139
7.3.4 粒子群优化 139
7.3.5 随机扩散搜索 141
7.3.6 群体智能与大数据 142
7.4 案例推理 142
7.4.1 案例推理中的学习 144
7.4.2 案例推理与数据科学 145
7.4.3 处理复杂的领域 146
7.5 粗糙集 146
7.6 练习 148
参考文献 148
第8章 分析和大数据 149
8.1 引言 149
8.2 传统分析与大数据分析 150
8.3 大规模并行处理 152
8.3.1 MapReduce 152
8.3.2 与RDBMS的比较 154
8.3.3 共享存储的并行编程 155
8.3.4 Apache Hadoop生态系统 155
8.3.5 Hadoop分布式文件系统 157
8.4 NoSQL 158
8.5 SPARK 160
8.6 运动的数据 161
8.6.1 数据流处理 162
8.6.2 实时数据流 162
8.6.3 数据流与DBMS 163
8.7 扩展机器学习算法 164
8.8 数据科学中的隐私、安全和伦理 166
8.9 练习 167
参考文献 167
第9章 R语言的数据科学活动 168
9.1 入门 168
9.2 运行代码 169
9.3 R基础知识 169
9.4 分析数据 172
9.5 示例 172
9.5.1 线性回归 173
9.5.2 逻辑回归 173
9.5.3 预测 173
9.5.4 k-最近邻分类 173
9.5.5 朴素贝叶斯 173
9.5.6 决策树 174
9.5.7 k-means聚类 175
9.5.8 随机森林 176
9.5.9 Apriori 176
9.5.10 AdaBoost 176
9.5.11 降维 177
9.5.12 支持向量机 177
9.5.13 人工神经网络 177
9.6 在R中可视化 178
9.7 编写自己的函数 181
9.8 Hadoop上的开源R 182
参考文献 182
附录A 数据科学工具 183
附录B 计算智能工具 188
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《分析化学》陈怀侠主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《剑桥国际英语写作教程 从句子到段落》(美)劳里·布拉斯(Laurie Blass),(美)德德拉·戈登(Deborah Gordon)编著 2019
- 《园丁集 2019》冰心译;(印)拉宾德拉纳特·泰戈尔 2019
- 《蟑螂》(挪)尤·奈斯博(Jo Nesbo)著 2019
- 《通往教育戏剧的7条路径》(挪)卡丽·米娅兰德·赫戈斯塔特(Kari Mjaaland Heggstad)著 2019
- 《我不喜欢人类,我想住进森林》(挪)阿澜·卢(ErlendLoe) 2019
- 《教育神经科学的是与非》塞尔吉奥·德拉·萨拉(SergioDellaSala) 2020
- 《心理学经典入门 第3版》(美)桑德拉·K.切卡莱丽,(美)J.诺兰 2020
- 《塑料海洋》(美)查尔斯·穆尔(CharlesMoore),(美)卡桑德拉·菲利普斯(CassandraPhillips)著 2019
- 《外出偷马》(挪)佩尔·帕特森著;余国芳译 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《高等教育双机械基础课程系列教材 高等学校教材 机械设计课程设计手册 第5版》吴宗泽,罗圣国,高志,李威 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017
- 《新工业时代 世界级工业家张毓强和他的“新石头记”》秦朔 2019
- 《智能制造高技能人才培养规划丛书 ABB工业机器人虚拟仿真教程》(中国)工控帮教研组 2019
- 《AutoCAD机械设计实例精解 2019中文版》北京兆迪科技有限公司编著 2019