《数据仓库与数据挖掘工程实例》PDF下载

  • 购买积分:8 如何计算积分?
  • 作  者:张兴会等编著
  • 出 版 社:北京:清华大学出版社
  • 出版年份:2014
  • ISBN:9787302355410
  • 页数:128 页
图书介绍:本书采用提出问题、分析问题、解决问题的思路,通过工程实例介绍了SQL Server 2005和Weka软件的使用方法,以及联机分析处理技术、关联规则方法、决策树方法、贝叶斯方法、人工神经网络方法、聚类分析方法、线性回归方法等数据仓库与数据挖掘技术。

实例1 基于联机分析处理技术的税务审计分析 1

1.1 任务描述 1

1.2 技术原理 1

1.2.1 联机分析处理的定义 1

1.2.2 联机分析处理的一些具体操作 1

1.3 具体实现 4

1.3.1 建立数据库 4

1.3.2 新建数据源 10

1.3.3 新建数据源视图 15

1.3.4 浏览数据 17

1.3.5 数据分析 20

1.4 案例总结 23

实例2 基于关联规则方法的网上交易服务质量评价分析 24

2.1 任务描述 24

2.2 技术原理 25

2.2.1 关联规则的概念 25

2.2.2 Apriori算法 25

2.3 具体实现 26

2.4 案例小结 32

实例3 基于Weka KnowledgFlow模块的大学生专业方向预测分析 33

3.1 任务描述 33

3.2 技术原理 33

3.2.1 数据收集和准备 33

3.2.2 模型选择 33

3.3 具体实现 33

3.3.1 数据预处理 33

3.3.2 建立和使用知识流 35

3.4 案例小结 39

实例4 基于决策树方法的网球运动天气状况评价分析 41

4.1 任务描述 41

4.2 技术原理 41

4.2.1 决策树的概念 41

4.2.2 信息论的基本概念 42

4.2.3 ID3建树算法 42

4.3 具体实现 42

4.4 案例小结 48

实例5 基于Weka Experimenter模块的人力资源管理挖掘模型选择分析 49

5.1 任务描述 49

5.2 技术原理 49

5.2.1 挖掘类型确定 49

5.2.2 数据收集和准备 49

5.3 具体实现 50

5.3.1 数据预处理 50

5.3.2 模型比较和选择 51

5.4 案例小结 55

实例6 基于贝叶斯方法的证券客户流失预警分析 56

6.1 任务描述 56

6.2 技术原理 57

6.2.1 朴素贝叶斯分类算法 57

6.2.2 朴素贝叶斯分类举例 58

6.3 具体实现 59

6.4 案例小结 63

实例7 基于人工神经网络方法的信贷数据分析 64

7.1 任务描述 64

7.2 技术原理 64

7.2.1 BP神经网络结构 64

7.2.2 BP神经网络学习算法 65

7.3 具体实现 67

7.3.1 数据准备 67

7.3.2 挖掘流程 70

7.4 案例小结 78

实例8 基于K-means方法的栀子花聚类分析 79

8.1 任务描述 79

8.2 技术原理 79

8.3 具体实现 80

8.4 案例小结 87

实例9 基于线性回归方法的汽车油耗预测分析 88

9.1 任务描述 88

9.2 技术原理 88

9.3 具体实现 89

9.4 案例小结 95

实例10 基于决策树方法的中文文本自动分类分析 96

10.1 任务描述 96

10.2 技术原理 96

10.2.1 文本挖掘的概念 96

10.2.2 文本分词技术 96

10.2.3 文本特征表示 97

10.3 具体实现 97

10.4 案例小结 105

附录A SQL Server 2005的安装 106

A1 任务描述 106

A2 具体实现 106

附录B Weka软件的安装和数据转换 114

B1 任务描述 114

B2 具体实现 114

参考文献 128