大数据技术及其应用PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:陈燕,张金松著
- 出 版 社:大连:大连海事大学出版社
- 出版年份:2015
- ISBN:9787563232628
- 页数:221 页
第1篇 基础知识 3
1大数据相关概念 3
1.1 大数据的发展背景 3
1.1.1 大数据的产生 4
1.1.2 大数据的由来及发展历程 7
1.2 大数据的概念与特征 11
1.2.1 大数据的概念 11
1.2.2 大数据的特征 12
1.3 大数据的数据结构 15
1.3.1 一般意义上的数据结构 15
1.3.2 数据仓库的数据结构 15
1.3.3 大数据的数据结构 16
1.4 大数据与数据挖掘 16
1.4.1 大数据与数据挖掘的关系 16
1.4.2 大数据挖掘的一般模式 18
1.5 大数据的研究现状和展望 20
1.5.1 大数据的研究现状 20
1.5.2 大数据的研究展望 23
1.6 小结 26
2云计算与大数据 27
2.1 云计算相关理论及技术 27
2.1.1 云计算的定义与特点 27
2.1.2 云计算的基本架构 30
2.1.3 云计算架构的实施阶段 32
2.2 云计算与大数据的关系 35
2.2.1 云计算与大数据是相辅相成的 35
2.2.2 云计算与大数据是动与静的关系 36
2.2.3 云计算与大数据的未来发展 37
2.3 小结 38
3面向大数据的数据分析工具 39
3.1 WEKA简介 39
3.1.1 WEKA使用简介 39
3.1.2 WEKA数据格式 40
3.1.3 WEKA中的数据准备 42
3.1.4 WEKA常用算法应用举例 44
3.2 Hadoop简介 53
3.2.1 HDFS海量存储 55
3.2.2 MapReduce 59
3.2.3 基于Hadoop的交通运输大数据解决方案 64
3.3 小结 67
第2篇 大数据相关理论及实例 71
4数据库、数据仓库与数据挖掘 71
4.1 数据库理论 71
4.1.1 数据库系统的结构理论 71
4.1.2 数据库的数据模型 72
4.1.3 数据库的设计 79
4.2 数据仓库理论 85
4.2.1 数据仓库的定义与解释 85
4.2.2 数据仓库系统模式 85
4.2.3 实例:数据仓库系统中多维数据的形式化定义与描述 87
4.3 数据挖掘理论 94
4.3.1 数据挖掘的定义与解释 94
4.3.2 数据挖掘与数据仓库 95
4.3.3 数据挖掘与知识发现 96
4.3.4 数据挖掘与联机分析处理 98
4.3.5 数据挖掘相关方法 99
4.3.6 数据挖掘的发展 104
4.4 小结 105
5数据集成、中间件与数据压缩 107
5.1 数据集成理论及应用实例 107
5.1.1 数据集成的对象 107
5.1.2 数据集成技术与方法 108
5.1.3 3G与MIS的集成模式 109
5.1.4 实例:数据集成的设计与实现 111
5.2 中间件理论及应用实例 114
5.2.1 中间件的定义与特点 114
5.2.2 基于数据仓库系统的中间件技术 116
5.2.3 实例:中间件技术在数据仓库系统中数据采集的应用 118
5.3 数据压缩理论及应用实例 126
5.3.1 无损压缩主要技术 126
5.3.2 有损压缩主要技术 130
5.3.3 实例:文本挖掘中统计单词的新方法 131
5.4 小结 141
第3篇 大数据相关技术及应用 145
6非关系型数据库技术及应用 145
6.1 非关系型数据库系统发展的必然性 145
6.1.1 数据库技术发展历史 145
6.1.2 关系型数据库的挑战与不足 147
6.2 非关系型数据库理论 150
6.2.1 非关系型数据库的概念 150
6.2.2 非关系型数据库的产品 153
6.3 非关系型数据库的使用范例 156
6.3.1 MongoDB的使用范例 156
6.3.2 Neo4j的使用范例 161
6.4 MongoDB与JAVA开源架构的整合 164
6.4.1 JAVA开源架构的介绍 164
6.4.2 Morphia ORM框架 167
6.4.3 框架的整合应用 167
6.5 小结 175
7信息检索与主题模型相关技术及应用 177
7.1 信息检索相关理论 177
7.1.1 信息检索的文本表示 178
7.1.2 信息检索的匹配算法 181
7.1.3 信息检索结果的评价 187
7.2 主题模型相关理论 190
7.2.1 主题模型的概念 190
7.2.2 主题模型的算法 191
7.2.3 主题模型的运行实例 194
7.3 基于主题的文献检索应用 197
7.3.1 学术文献网络的构建 197
7.3.2 主题的确定与计算 198
7.3.3 基于主题的文献引用网络 201
7.3.4 基于Lemur的信息检索模型实现 203
7.4 小结 206
8可视化技术及应用 207
8.1 大数据与可视化 207
8.1.1 大数据与可视化的关系 207
8.1.2 可视化工具与产品 208
8.1.3 Gephi可视化软件的使用 208
8.2 知识域可视化问题的应用 212
8.2.1 知识域可视化问题描述 212
8.2.2 知识域可视化的应用 214
8.3 小结 218
参考文献 219
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《Prometheus技术秘笈》百里燊 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《中央财政支持提升专业服务产业发展能力项目水利工程专业课程建设成果 设施农业工程技术》赵英编 2018
- 《药剂学实验操作技术》刘芳,高森主编 2019
- 《林下养蜂技术》罗文华,黄勇,刘佳霖主编 2017
- 《脱硝运行技术1000问》朱国宇编 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《大学化学实验》李爱勤,侯学会主编 2016
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017