《数据挖掘与管理实践》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:宋宇辰,孟海东著
  • 出 版 社:北京:冶金工业出版社
  • 出版年份:2010
  • ISBN:9787502454579
  • 页数:181 页
图书介绍:本书对数据挖掘技术及其在管理决策中的应用进行了较深入的研究。书中重点介绍了聚类分析和关联分析的理论基础、算法设计、分析与对比。全书以图书馆现代化管理为主线,探索了如何对管理数据实施数据挖掘、实现管理决策的全过程,包括数据采集、数据预处理、数据挖掘与分析、挖掘结果的分析,并提出相应的决策建议;根据一系列应用实施过程,总结出图书馆现代化管理应用数据挖掘的三层决策构架,即数据层、技术层和决策层。本书对于从事信息分析、数据挖掘、企业和政府部门的管理人员、从事管理学和情报学的学者、研究生具有一定的参考价值。

1 概论 1

1.1 背景 1

1.1.1 国外研究与应用 1

1.1.2 国内研究与应用 3

1.2 意义 8

1.3 内容 10

1.3.1 聚类分析 10

1.3.2 关联分析 10

1.3.3 图书馆数据搜集与预处理 11

1.3.4 实现数据挖掘技术在图书馆中的应用 13

2 数据挖掘技术 14

2.1 数据挖掘系统的组成 14

2.2 数据挖掘的定义 15

2.3 数据挖掘的任务 17

2.4 数据挖掘的功能 19

2.4.1 自动预测趋势和行为 19

2.4.2 关联分析 20

2.4.3 聚类分析 20

2.4.4 概念描述 20

2.4.5 偏差检测 20

2.5 数据挖掘的实施 21

2.5.1 数据挖掘环境 21

2.5.2 数据挖掘的过程 21

2.6 数据挖掘的难点 22

2.6.1 动态变化的数据 22

2.6.2 噪声 23

2.6.3 数据不完整 23

2.6.4 冗余信息 23

2.6.5 数据稀疏 23

2.6.6 超大数据量 23

2.7 数据挖掘的主要应用领域 24

3 聚类分析及系统功能 25

3.1 聚类算法简介 25

3.1.1 聚类算法的一般分类 25

3.1.2 噪声与孤立点 27

3.1.3 聚类算法的典型要求 28

3.2 新聚类算法理论研究 29

3.2.1 新聚类算法的整体思路 29

3.2.2 新聚类算法的相关定义 31

3.2.3 新聚类算法的算法描述 32

3.3 新聚类算法实验分析 33

3.3.1 不同尺寸和密度的簇聚类效果实验 33

3.3.2 埋藏在“噪声”中的簇聚类效果实验 34

3.3.3 实验结果总结 36

3.4 新聚类算法系统功能 36

3.4.1 菜单栏介绍 36

3.4.2 属性相关性检验窗口 38

3.4.3 数据标准化窗口 38

3.4.4 聚类窗口 40

3.4.5 模式评估窗口 42

3.5 新聚类算法聚类过程解析 42

3.5.1 数据选择 44

3.5.2 数据预处理 44

3.5.3 数据变换 44

3.5.4 数据挖掘 44

3.5.5 结果解释 47

4 关联分析与系统功能 49

4.1 关联分析简介 49

4.2 Clementine关联简介 50

4.3 新关联规则算法研究 51

4.3.1 新关联规则算法的提出 51

4.3.2 新关联规则算法的相关定义 53

4.4 新关联规则算法设计 56

4.5 新关联规则系统功能 57

4.6 新关联规则挖掘过程解析 58

4.6.1 数据选择 58

4.6.2 数据预处理 58

4.6.3 数据变换 58

4.6.4 数据挖掘 58

4.6.5 数据解释 59

5 现代化管理中的聚类应用 60

5.1 纸质调查问卷数据聚类分析 60

5.1.1 纸质问卷的设计与数据整理 60

5.1.2 数据预处理 69

5.1.3 学科资料需求聚类分析 71

5.1.4 馆藏基本需求聚类分析 78

5.1.5 读者借阅行为聚类分析 87

5.1.6 图书馆服务满意度聚类分析 95

5.1.7 决策建议 97

5.2 网络调查数据聚类分析 99

5.2.1 网络数据收集与数据整理 100

5.2.2 数据预处理 101

5.2.3 高校图书馆人力资源聚类分析 104

5.2.4 高校图书馆资源聚类分析 111

5.2.5 决策建议 115

6 现代化管理中的关联应用 116

6.1 通用图书馆集成系统简介 116

6.2 借阅流通日志中读者属性与图书类别的关联分析 117

6.2.1 数据收集与数据整理 122

6.2.2 数据预处理 123

6.2.3 关联规则挖掘 127

6.2.4 挖掘结果分析 129

6.2.5 决策建议 130

6.3 借阅流通日志中图书与图书间的关联分析 131

6.3.1 数据收集与数据整理 131

6.3.2 数据预处理 135

6.3.3 关联规则挖掘 135

6.3.4 挖掘结果分析 136

6.3.5 决策建议 140

6.4 读者借阅记录中图书大类间的DAR关联分析 140

6.4.1 数据收集与数据整理 140

6.4.2 数据预处理 142

6.4.3 关联规则挖掘 142

6.4.4 挖掘结果分析 144

6.4.5 决策建议 150

6.5 纸质问卷学科间的DAR关联分析 151

6.5.1 数据收集与数据整理 151

6.5.2 数据预处理 151

6.5.3 关联规则挖掘 152

6.5.4 挖掘结果分析 154

6.5.5 决策建议 159

7 结论、建议、展望 160

7.1 图书馆数据挖掘的决策过程 160

7.2 新算法达到的功能 161

7.3 图书馆数据的搜集整理工作 161

7.4 挖掘结果的分析与建议 162

7.4.1 调查问卷数据的聚类分析与建议 162

7.4.2 网络数据的聚类分析与建议 163

7.4.3 图书馆集成系统数据的Clementine关联分析与建议 163

7.4.4 图书馆集成系统数据的DAR关联分析与建议 164

7.4.5 调查问卷馆藏资料数据的DAR关联分析与建议 164

7.5 展望 165

附录 167

附录A 图书馆资源建设、利用与服务情况问卷调查 167

附录B 高校图书馆信息调查表 174

附录C 图书借阅次数统计表 176

附录D 读者借阅次数统计表 177

参考文献 178