《数据挖掘理论与实例》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:王晖,王琪,何琼著
  • 出 版 社:北京:经济科学出版社
  • 出版年份:2012
  • ISBN:9787514118148
  • 页数:231 页
图书介绍:《数据挖掘理论与实例》的主要目标是通过不同领域的应用案例,来说明数据挖掘在实际应用中的具体操作方法。将数据库管理系统MySQL和统计软件R结合,利用数据挖掘技术帮助陷入海量数据中的组织和个人提取有用的信息。

第一章 绪论 1

第一节 什么是数据挖掘 1

第二节 基本数据挖掘任务 2

第三节 数据挖掘的过程 6

第四节 数据仓库与OLAP技术概述 8

第五节 数据挖掘技术的发展 17

第二章 数据挖掘工具 19

第一节 数据挖掘的统计方法 21

第二节 聚类分析 30

第三节 决策树 44

第四节 相关软件 53

第三章 呼叫中心中数据仓库的构建 55

第一节 数据仓库构建的实施方法及步骤 55

第二节 呼叫中心数据仓库模型设计 56

第三节 数据仓库生成 66

第四章 呼叫中心中的数据挖掘模型与实现 71

第一节 问题鉴别 71

第二节 解决方案 73

第三节 基于决策树的分类算法模型 74

第四节 C4.5算法构造信息需求分类和客户细分决策树实例 81

第五节 功能模块的实现 89

第六节 系统应用示例 94

第五章 QFII投资理念与持股偏好研究中数据收集与整理 97

第一节 外国机构投资者投资理念及持股偏好概述 98

第二节QFII重仓股数据来源 103

第三节 因变量的选取 107

第四节 自变量的选取 107

第六章QFII投资理念与持股偏好研究中数据挖掘模型与实现 112

第一节 重仓股家数变化趋势和行业分布 112

第二节 重仓股持有时间特征 114

第三节 描述性统计分析 116

第四节 相关性分析 118

第五节 持股偏好多元线性逐步回归分析 118

参考文献 133

附表 137

附表1 12家QFII基本情况及最新额度 137

附表2瑞士银行的名称 138

附表3 12家QFII持有股票家数和行业情况汇总 139

附表4各季度因变量和自变量的均值及样本个数 140

附表5各季度因变量和自变量的方差及样本个数 141

附表6 2008年12月31日Y对上一个季度所有自变量线性相关系数 142

附表7 Y对上一个季度、本季度及未来一个季度的所有自变量X逐步回归模型系数情况 143

附表8 两种方式回归结果对比 145

附录 146

附录一 数据仓库中的数据表架构 146

附录二 数据仓库关系图 150

附录三 QFII重仓股数据的获取过程 151

附录四 自变量数据的获得及缺失值处理 170

附录五 模型建立—数据分析过程 209