第一章 绪论 1
第一节 研究背景 1
第二节 研究现状与分析 2
第三节 研究内容 8
第四节 主要创新 11
第五节 本书结构 13
第二章 大数据基础 15
第一节 大数据概述 15
第二节 大数据处理基本流程 16
第三节 大数据处理关键技术 17
第四节 大数据的主要分析平台 19
第五节 大数据在教育中的应用 21
第六节 本章小结 23
第三章 教育大数据集成 24
第一节 教育大数据的含义及特点 24
第二节 教育大数据平台的构建 25
第三节 基于Web服务、移动代理和本体的教育大数据集成方法 30
第四节 分布式动态教育大数据增量关联规则挖掘的研究 35
第五节 本章小结 40
第四章 学生特征提取 41
第一节 常用特征提取方法 41
第二节 基于时间轴的高校学生基本特征提取及分析 42
第三节 基于校园一卡通的学生特征提取及作息规律判断 46
第四节 基于网络日志的学生特征提取及其偏好判断 51
第五节 应用分析 62
第六节 本章小结 78
第五章 学生特征选择 79
第一节 特征选择的相关概念 79
第二节 特征选择过程 80
第三节 特征选择算法的分类 81
第四节 特征选择算法 82
第五节 非均衡样本问题 84
第六节 基于指数分布的非均衡学生数据特征选择 89
第七节 基于PKDE和Relief的非均衡学生数据特征选择 98
第八节 应用分析 106
第九节 本章小结 110
第六章 风险预测模型中分类方法的探讨 112
第一节 分类的定义 112
第二节 分类的流程 113
第三节 分类性能的评价 113
第四节 常用的分类方法 114
第五节 集成学习算法 124
第六节 本章小结 126
第七章 高风险学生预测模型选择 127
第一节 模型评估与选择方法 127
第二节 单一预测模型 132
第三节 组合预测模型 133
第四节 投票式组合预测模型 138
第五节 本章小结 141
第八章 基于Hadoop的高风险学生加权投票式组合预测模型 142
第一节 设计思想 142
第二节 组合预测模型 143
第三节 预测模型训练与评估 146
第四节 本章小结 159
第九章 高风险学生预测原型系统 160
第一节 简介 160
第二节 系统设计 160
第三节 系统实现 167
第四节 本章小结 174
第十章 结束语 175
第一节 总结 175
第二节 展望 176
参考文献 178
后记 191