《面向物流企业数据在线分析挖掘及应用》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:祖巧红编著
  • 出 版 社:北京:科学出版社
  • 出版年份:2009
  • ISBN:9787030250964
  • 页数:261 页
图书介绍:本书结合最新的面向SOA的框架,以物流企业为例,研究数据挖掘、在线分析及其多维可视化技术,针对数据挖掘过程的各个环节,如:数据预处理、数据仓库的构建、报表的制作分别进行了理论阐述,提供了详细的基于SQLServer2005软件环境的操作实例,通过案例论述和展示数据挖掘过程。本书最后的两章,以物流企业为例,研究基于WCF技术架构数据挖掘服务,包括数据挖掘服务中各子服务的设计、架构及实现等技术,分析数据挖掘技术在物流行业中的应用。物流行业中对数据挖掘技术日益增长的需求与应用数据挖掘技术的高成本之间的矛盾是本书研究的出发点。本书重在物流企业应用研究,案例全面,体现了新一代数据挖掘系统的特点,这在目前的学术研究中独具特色,尤其对于物流信息化发展具有较高的理论和实际意义。

第1章 数据挖掘原理 1

1.1 知识发现与数据挖掘 1

1.2 数据挖掘概论 1

1.2.1 数据挖掘的对象和任务 1

1.2.2 数据挖掘的应用 2

1.2.3 在线分析数据挖掘系统、软件工具 4

1.2.4 数据挖掘发展 8

第2章 数据仓库、数据挖掘与OLAM 10

2.1 数据仓库 10

2.1.1 从数据库到数据仓库 10

2.1.2 数据仓库常用模型 14

2.1.3 MDX查询及分析 22

2.1.4 数据仓库建模工具 28

2.1.5 数据清洗 30

2.2 数据挖掘 39

2.2.1 从报表到数据挖掘 39

2.2.2 数据挖掘过程 40

2.2.3 数据挖掘的可视化技术 46

2.2.4 数据挖掘工具 51

2.3 OLAM 56

2.3.1 从OLTP到OLAP 56

2.3.2 从OLAP到OLAM 60

2.3.3 OLAM发展 63

第3章 常用数据挖掘模型与算法 65

3.1 贝叶斯算法 65

3.1.1 贝叶斯算法原理 65

3.1.2 贝叶斯算法的应用 66

3.2 决策树 66

3.2.1 决策树算法 66

3.2.2 决策树方法的应用 67

3.3 神经网络 68

3.3.1 神经网络的原理 68

3.3.2 神经网络方法的应用 69

3.4 关联规则 70

3.4.1 关联规则的原理 70

3.4.2 关联规则方法的应用 71

3.5 聚类分析 71

3.5.1 聚类分析原理 71

3.5.2 聚类的应用 72

3.6 时间序列 73

3.6.1 时间序列与时间序列分析 73

3.6.2 时间序列方法的应用 74

3.7 统计和可视化 75

3.7.1 统计 75

3.7.2 可视化 75

第4章 实例一:物流信息系统源数据清洗实例 77

4.1 ETL在企业数据管理工作的重要性 77

4.1.1 ETL在企业数据平台中的作用 78

4.1.2 ETL工具需要解决的问题 78

4.2 SSIS功能 79

4.3 SSIS的体系结构 79

4.3.1 程序包 81

4.3.2 任务 81

4.3.3 数据源元素 82

4.3.4 数据源视图 83

4.4 SSIS程序包设计 84

4.4.1 控制流 84

4.4.2 Connection Manager 88

4.4.3 变量 88

4.4.4 数据流 89

4.4.5 Event Handler 90

4.4.6 Package Explorer 91

4.4.7 执行程序包 91

4.5 物流信息系统中数据清洗实例分析 91

4.5.1 确定来源维度 91

4.5.2 处理时间标识 92

4.5.3 邮件监控任务 93

第5章 实例二:多维数据仓库模型创建 95

5.1 数据仓库简介 95

5.2 数据仓库建模常用模式 96

5.3 多维数据模型 97

5.4 多维数据仓库的规范化处理(雪花处理) 99

5.5 多维模型设计流程 101

5.5.1 总体架构设计 102

5.5.2 Cube的设计 102

5.5.3 生成关系架构 103

5.5.4 利用测试数据进行模型测试 103

5.5.5 ETL数据加载 103

5.6 以人事为主题的多维数据仓库模型设计实例 104

5.6.1 政府机构人员管理中的数据仓库设计 104

5.6.2 与销售结合的人事主题分析 104

5.7 以客户分析为主题的多维数据仓库模型设计实例 107

5.7.1 数据仓库逻辑模型设计 108

5.7.2 SQL Server 2005中数据仓库的建设 113

第6章 实例三:物流企业复合报表设计与制作实例 116

6.1 报表服务的作用 116

6.1.1 解决方案类型 116

6.1.2 简单的应用程序集成 116

6.1.3 无缝的应用程序集成 117

6.2 SQL Server 2005中的报表服务 118

6.2.1 报表交付应用程序类型 118

6.2.2 设计报表 119

6.3 报表服务的体系结构 120

6.3.1 平台概览 120

6.3.2 SQL Server 2005报表服务支持的提供程序 120

6.3.3 显示扩展 121

6.4 复合报表的设计实例 122

6.4.1 复合报表的设计需求 122

6.4.2 复合报表的范围 122

6.4.3 复合报表设计实例 122

第7章 实例四:物流企业销售OLAM实例 132

7.1 基于时序的关联规则 133

7.1.1 序列模式关联规则挖掘 133

7.1.2 基于时间序列的关联规则 133

7.1.3 关联规则的相关参数 135

7.2 基于关联规则的购买模式发现实例 136

7.2.1 销售业务技术及源数据分析 136

7.2.2 购物序列模式发现挖掘及在线分析实例 138

7.3 多维数据分析及其OLAP可视化实例 143

7.3.1 客户总体概况分析 143

7.3.2 单维度下钻分析 144

7.3.3 某维度多属性的指标数据纵向切片分析可视化 149

7.3.4 多维度多层上卷、旋转及横(纵)向切片综合分析及可视化 151

7.3.5 某维度对分析指标沿时间预测分析的可视化 154

第8章 实例五:OLAM在客户分析中的综合应用 156

8.1 基于支出分配的客户终生价值计算研究 158

8.1.1 客户终生价值的组成 159

8.1.2 客户终生价值模型研究 159

8.1.3 基于马尔可夫链的客户购买转换研究 161

8.1.4 基于马尔可夫链计算客户支出分配变化的实例 163

8.1.5 定量计算客户支出分配对客户终生价值的影响 166

8.1.6 客户终生价值的软件实现 168

8.2 客户忠诚度预测及客户资信综合评价 169

8.2.1 客户忠诚度概述 169

8.2.2 基于模糊神经网络的客户忠诚度预测 170

8.2.3 基于属性重要性理论确定模糊神经网络初始权重 170

8.2.4 模糊信息处理与模糊神经网络评价步骤 171

8.2.5 基于模糊神经网络的客户忠诚度的计算实例 172

8.2.6 基于模糊评价法的客户资信计算研究 180

8.2.7 基于模糊综合评价的客户资信计算 183

8.3 基于数据挖掘的客户细分研究 191

8.3.1 常用的客户分类模型 191

8.3.2 客户终生价值/客户忠诚度/客户资信(CLV/CL/CC)的客户分类模型 191

8.3.3 数据挖掘中的客户聚类算法 192

8.3.4 聚类实现 194

8.3.5 加权的扩展贝叶斯模型分类 199

8.3.6 软件实现及分析 203

8.3.7 结果验证与分析 205

第9章 实例六:面向第三方物流企业的数据挖掘服务构建实例 207

9.1 设计思想 207

9.1.1 SOA理论 208

9.1.2 WCF概述 211

9.2 物流管理平台中数据挖掘服务的设计 215

9.2.1 物流管理平台的架构 215

9.2.2 物流管理中的数据挖掘应用需求分析 217

9.2.3 WCF框架下的数据挖掘服务设计 220

9.3 数据挖掘服务中的关键技术及实现 227

9.3.1 数据上传服务 227

9.3.2 数据清洗服务 229

9.3.3 数据挖掘算法服务 234

9.3.4 OLAP服务 238

9.3.5 跨平台调用WCF服务 244

9.4 基于数据挖掘服务在物流运输系统中的应用 249

9.4.1 使用开源WebGIS 249

9.4.2 物流运输系统中的智能分析 253

参考文献 259