第一章 引言 1
第一节 研究背景 1
第二节 研究目的和意义 2
一、研究目的 2
二、研究意义 3
第三节 研究方法 3
第二章 离群数据挖掘研究现状与进展 5
第一节 相关概念界定 5
一、离群数据 5
二、离群文献与离群主题 5
三、突变点 6
第二节 离群数据检测方法研究现状 7
一、基于统计的方法 8
二、基于偏离的方法 9
三、基于距离的方法 12
四、基于密度的方法 12
五、基于聚类的方法 13
六、多种方法融合 15
第三节 离群数据分析方法 16
一、基于分类的分析方法 16
二、基于聚类的分析方法 16
第三章 主题演化研究理论基础 21
第一节 科学演化理论 21
一、科学发展模式研究 21
二、主题演化的概念及其特点 22
第二节 生命周期理论 24
一、主题演化生命周期的概念 24
二、主题演化生命周期的判定 24
三、主题演化生命周期理论的发展与应用 25
第三节 文献计量学理论 25
一、文献计量学概述 25
二、主题演化研究的文献计量指标和方法 25
第四节 小结 26
第四章 主题演化研究现状与进展 28
第一节 主题演化研究的基本框架 28
第二节 信息熵法及其应用 30
一、熵与信息熵原理 30
二、信息熵在文献计量领域中的应用 31
第三节 词频分析法及其应用 32
第四节 共词分析法及其应用 33
一、基于高频词的共词分析 33
二、基于突发词的共词分析 33
第五节 引文分析法及其应用 35
第六节 文本聚类分析法及其应用 35
第七节 主题模型法及其应用 36
第八节 小结 37
第五章 突变点挖掘在主题演化研究中的应用 43
第一节 时间序列中突变点识别 43
一、基本原理 43
二、基于信息熵变化的突变点识别方法 44
三、试验与评价 45
第二节 主题演化阶段划分基本思想 49
第三节 实证分析 50
一、“流域水资源管理”主题实证分析 50
二、“信息整合”主题实证分析 61
第四节 小结 63
第六章 基于信息熵的离群数据检测方法及其实证研究 65
第一节 基于信息熵的离群数据对象检测 65
一、基本原理 65
二、检测步骤 66
三、试验与评价 67
第二节 聚类簇类型划分 69
一、基本思想 69
二、划分步骤 69
第三节 离群文献检测 70
一、数据源及数据预处理 70
二、关键词权重计算 70
三、文献离群程度计算 74
第四节 主题簇类型划分 78
一、文献的相似离群性计算和相似矩阵构建 78
二、聚类数目确定 78
三、主题聚类簇划分 78
第五节 小结 83
第七章 基于离群数据的主题演化规律研究 84
第一节 基于离群文献的主题演化动力机制分析 84
一、动力机制分析 84
二、主题演化状态分析 86
第二节 基于信息熵的主题演化过程分析 87
一、主题演化信息熵变化过程分析 87
二、主题演化信息熵变化计量分析 88
第三节 实证分析 89
一、主题演化强度分析 90
二、主题演化内容分析 94
第四节 小结 100
第八章 总结与展望 102
第一节 本书的主要工作 102
第二节 研究的不足之处 103
第三节 进一步的研究内容 103
附录 104