基于半监督与集成学习的文本分类方法PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:唐焕玲著
- 出 版 社:北京:电子工业出版社
- 出版年份:2013
- ISBN:9787121212567
- 页数:179 页
第1章 绪论 1
1.1 研究背景及意义 1
1.1.1 数据挖掘和文本挖掘 1
1.1.2 文本分类及其面临的问题 3
1.2 国内外相关研究 7
1.2.1 半监督学习 7
1.2.2 集成学习 10
1.3 本书内容组织 14
第2章 文本分类技术概述 17
2.1 文本分类预处理 17
2.2 文本的表示 19
2.3 特征选择 21
2.3.1 初始特征选择 22
2.3.2 特征选择算法 22
2.4 文本分类算法 24
2.4.1 质心向量分类算法 24
2.4.2 K近邻分类算法 26
2.4.3 贝叶斯分类算法 27
2.4.4 关联规则分类算法 33
2.4.5 支持向量机 33
2.4.6 其他分类算法 37
2.5 实验数据集 38
2.6 分类模型的评估方法 39
2.7 本章小结 41
第3章 TEF-WA权值调整技术 42
3.1 特征选择存在的问题 42
3.2 TEF-WA权值调整技术 43
3.2.1 TEF-WA权值调整的基本思想 43
3.2.2 各种评估函数的TEF-WA权值调整 45
3.3 实验结果与分析 48
3.3.1 TEF-WA权值调整的有效性 48
3.3.2 不同评估函数的权值调整 52
3.3.3 评估比较 62
3.4 本章小结 68
第4章 结合TEF-WA技术的Co-training改进算法 69
4.1 Co-training算法及其存在的问题 69
4.2 基于TEF-WA的特征多视图 70
4.2.1 TEF-WA技术 70
4.2.2 基于TEF-WA的特征多视图 71
4.3 基分类器间的差异性评估 72
4.4 TV-SC算法与TV-DC算法 74
4.5 实验结果及其分析 76
4.6 本章小结 80
第5章 基于特征独立模型的Co-training改进算法 81
5.1 特征独立模型 82
5.1.1 基于条件互信息的相互独立性 82
5.1.2 基于条件χ2统计量的相互独立性 83
5.1.3 特征独立模型 84
5.2 特征子集划分算法PMID 85
5.3 基于MID-Model的改进算法SC-PMID 88
5.4 实验结果及其分析 89
5.4.1 PMID-MI与PART-Rnd的实验比较 90
5.4.2 PMID-CHI与PART-Rnd的实验比较 93
5.4.3 PMID-MI、PMID-CHI和PART-Rnd的实验比较 95
5.4.4 SC-PMID-MI、SC-PMID-CHI和SC-PART-Rnd的实验比较 96
5.5 本章小结 98
第6章 基于投票信息熵和多视图的AdaBoost改进算法 99
6.1 AdaBoost算法 100
6.1.1 AdaBoost算法描述 100
6.1.2 AdaBoost提升NB文本分类器的问题 101
6.2 利用特征评估函数构造多视图 102
6.3 基于投票信息熵的样本权重维护新策略 103
6.3.1 投票信息熵 104
6.3.2 基于投票信息熵的样本权重维护新策略 105
6.3.3 样本权重对NB文本分类器的扰动 106
6.4 BoostVE算法 108
6.4.1 BoostVE算法描述 108
6.4.2 BoostVE算法的最小训练错误上界 109
6.5 实验结果及其分析 113
6.5.1 参数η对BoostVE算法性能的影响 115
6.5.2 Boost VE算法与AdaBoost-MV算法、AdaBoost算法的实验比较 118
6.5.3 BoostVE算法提升NB文本分类器的有效性 124
6.6 本章小结 126
第7章 结合半监督学习的SemiBoost-CR分类模型 128
7.1 SemiBoost-CR模型的目标函数 129
7.2 未标注样本的置信度 131
7.2.1 基于K近邻的置信度 131
7.2.2 基于最大差距的置信度 132
7.3 基于置信度的重取样策略 133
7.4 样本权重维护策略 135
7.5 SemiBoost-CR分类算法 136
7.6 实验结果及其分析 137
7.6.1 未标注近邻样本对置信度conf1的影响 139
7.6.2 两种置信度方法conf1和 conf2的实验比较 140
7.6.3 topN和bottomN对SemiBoost-CR模型的影响 144
7.7 本章小结 154
第8章 文本自动分类系统SECTCS 155
8.1 系统简介 155
8.2 系统总体结构 156
8.3 系统的用户界面 157
8.4 实验数据集 163
8.5 本章小结 165
结束语 166
参考文献 169
- 《女丹仙道:道教女子内丹养生修炼秘籍 下》董沛文著 2012
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《党员干部理论学习培训教材 理论热点问题党员干部学习辅导》(中国)胡磊 2018
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《数学物理方法与仿真 第3版》杨华军 2020
- 《Helmholtz方程的步进计算方法研究》李鹏著 2019
- 《民国时期医药卫生文献集成 37》路丽明编 2019
- 《深度学习与飞桨PaddlePaddle Fluid实战》于祥 2019
- 《土壤环境监测前沿分析测试方法研究》中国环境监测总站编著 2018
- 《彼得·布鲁克导演实践研究》邓小玲著 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《文学翻译与大学英语教学》余玲著 2019
- 《看不见的精彩》郭小玲著 2018
- 《海南野生鹧鸪茶》李娟玲著 2019
- 《特殊教育学校教师工作 生活冲突研究》张俊玲著 2019
- 《中国学术思想研究辑刊 十八编 第12册 宋儒论韩愈排佛与师道》刘素玲著 2014
- 《Excel数据处理与可视化》韩春玲著 2020
- 《王夫之《楚辞通释》研究》丁海玲著 2018
- 《民办普通高校教师身份研究》王玲著 2019
- 《电子测量与仪器》人力资源和社会保障部教材办公室组织编写 2009
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《通信电子电路原理及仿真设计》叶建芳 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《电子应用技术项目教程 第3版》王彰云 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017