第一章 绪论 1
第一节 什么是数据挖掘 1
第二节 基本数据挖掘任务 2
第三节 数据挖掘的过程 6
第四节 数据仓库与OLAP技术概述 8
第五节 数据挖掘技术的发展 17
第二章 数据挖掘工具 19
第一节 数据挖掘的统计方法 21
第二节 聚类分析 30
第三节 决策树 44
第四节 相关软件 53
第三章 呼叫中心中数据仓库的构建 55
第一节 数据仓库构建的实施方法及步骤 55
第二节 呼叫中心数据仓库模型设计 56
第三节 数据仓库生成 66
第四章 呼叫中心中的数据挖掘模型与实现 71
第一节 问题鉴别 71
第二节 解决方案 73
第三节 基于决策树的分类算法模型 74
第四节 C4.5算法构造信息需求分类和客户细分决策树实例 81
第五节 功能模块的实现 89
第六节 系统应用示例 94
第五章 QFII投资理念与持股偏好研究中数据收集与整理 97
第一节 外国机构投资者投资理念及持股偏好概述 98
第二节QFII重仓股数据来源 103
第三节 因变量的选取 107
第四节 自变量的选取 107
第六章QFII投资理念与持股偏好研究中数据挖掘模型与实现 112
第一节 重仓股家数变化趋势和行业分布 112
第二节 重仓股持有时间特征 114
第三节 描述性统计分析 116
第四节 相关性分析 118
第五节 持股偏好多元线性逐步回归分析 118
参考文献 133
附表 137
附表1 12家QFII基本情况及最新额度 137
附表2瑞士银行的名称 138
附表3 12家QFII持有股票家数和行业情况汇总 139
附表4各季度因变量和自变量的均值及样本个数 140
附表5各季度因变量和自变量的方差及样本个数 141
附表6 2008年12月31日Y对上一个季度所有自变量线性相关系数 142
附表7 Y对上一个季度、本季度及未来一个季度的所有自变量X逐步回归模型系数情况 143
附表8 两种方式回归结果对比 145
附录 146
附录一 数据仓库中的数据表架构 146
附录二 数据仓库关系图 150
附录三 QFII重仓股数据的获取过程 151
附录四 自变量数据的获得及缺失值处理 170
附录五 模型建立—数据分析过程 209