基于群体智能优化算法的文本过滤关键技术研究PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:朱振方,刘培玉,尉永清著
- 出 版 社:北京:中国水利水电出版社
- 出版年份:2019
- ISBN:9787517082286
- 页数:189 页
第一章 绪论 1
第一节 研究背景及意义 1
一、中国互联网迅速发展 1
二、互联网迅速发展带来的负面影响 1
三、信息过滤研究的意义 3
第二节 文本信息过滤面临的问题 5
一、国外相关研究 5
二、国内研究进展 6
三、相关研究存在的问题 7
第三节 本书主要研究内容及贡献 9
一、研究环境 9
二、研究内容 9
三、本书贡献 11
四、本书组织结构 11
第二章 文本信息过滤关键技术概述 14
第一节 文本信息过滤的基本模型 14
第二节 网络数据的获取 15
一、数据包捕获技术 15
二、协议解析技术 16
第三节 文本切词技术 16
一、基于字符串匹配的切词方法 17
二、基于理解的切词方法 17
三、基于统计的切词方法 17
第四节 特征选择算法 18
一、文档频率 18
二、信息增益 19
三、互信息 19
四、x2统计量 20
第五节 权值计算方法 21
第六节 文本表示模型 21
第七节 文本分类算法 22
一、朴素贝叶斯算法 22
二、KNN算法 23
三、Rocchio分类算法 23
四、支持向量机算法 24
第八节 小结 24
第三章 基于统计与规则的特征项联合权重文本权重计算方法 25
第一节 已有权重评估函数总结 25
一、反比文档频数权重 25
二、信噪比 25
三、TF-IDF 26
四、权重计算与特征选择的对比 26
第二节 改进信息增益算法 27
一、信息增益算法分析 27
二、导致信息增益算法精确度下降的原因 28
三、特征项的类间离散度 29
四、特征项的类内离散度 30
五、应用特征项分布信息的信息增益计算方法 30
六、改进的信息增益算法(IG-GDI) 31
七、实验结果分析 31
第三节 VSM中特征项粒度选取存在的不足 34
第四节 VSM固有缺陷分析 36
第五节 当前权重计算方法的缺陷 38
第六节 基于规则的文本表示 39
一、中文组块分析 39
二、短语的选取粒度 40
三、基本短语的识别 41
四、最大信息熵模型 43
五、短语特征的权重计算 44
六、VSM中特征项关系组织方式 44
七、实验结果分析 45
第七节 基于统计的特征权重计算方法 48
一、联合权重计算方法 48
二、实验及分析 51
第八节 基于统计与规则的特征项联合权重实验 55
一、实验步骤 55
二、实验结果分析 56
第九节 小结 58
第四章 融合段落特性的文档权重计算方法 59
第一节 引言 59
第二节 预备知识 60
一、常用特征权重计算方法 60
二、基本算法比较 61
第三节 融合段落特征的文本权重计算方法 62
一、文档的形式化表示 62
二、文档权重的计算及其体现 63
三、对文档中部分重要句子的权重计算 63
四、特征项的位置权重 64
五、文档中特征项的权重确定 64
第四节 实验分析 65
一、实验语料 65
二、实验环境 66
三、评价指标 66
四、评价方案 67
五、评价与结果分析 68
第五节 小结 71
第五章 基于自适应惯性权重混沌粒子群的特征子集优化方法 72
第一节 粒子群算法概述 72
一、粒子群算法基本原理 72
二、粒子群算法的研究进展 73
三、目前研究中存在的问题 74
第二节 基于自适应惯性权重的混沌粒子群算法 75
一、混沌序列初始化粒子位置 75
二、惯性权重的自适应变化 76
三、早熟判断机制及混沌扰动策略 77
四、算法流程 78
五、实验与分析 79
六、对本节三种改进策略的测试 79
七、与其他算法的比较 80
第三节 应用混沌粒子群算法的特征子集优化模型 83
一、粒子编码及初始种群的生成 84
二、粒子速度及位置的更新 85
三、适应度的评价 86
四、并行计算加速机制 87
五、混沌粒子群算法获得最优特征子集的流程 88
六、实验与分析 89
第四节 小结 91
第六章 基于模糊遗传算法的文本信息过滤模板生成方法 92
第一节 引言 92
第二节 遗传算法的起源与历程 93
第三节 遗传算法的特点 94
第四节 遗传算法的基本要素与原理 95
一、遗传算法的基本要素 95
二、基本原理 97
第五节 基本遗传算法 97
一、基本遗传算法的结构与数学模型 97
二、基本遗传算法的实现 99
第六节 基于遗传算法的过滤模板优化方法理论可行性分析 102
一、问题描述 102
二、文本预处理 102
三、问题编码及初始种群生成 103
四、个体适应度衡量 103
五、收敛性分析 104
第七节 基于遗传算法的文本过滤方法实现 106
一、编码 106
二、初始种群 106
三、适应度函数的选取 107
四、遗传操作 109
五、相关参数的设定 109
六、训练集 110
七、测试集 110
八、开发和运行环境 111
九、考查参数 111
十、文本分类实验 111
第八节 模糊遗传算法 114
一、种群规模动态调整 114
二、变异率模糊动态调整 116
三、遗传参数的自适应调整 117
四、实验结果比较分析 117
第九节 小结 118
第七章 基于概念的逻辑段落匹配方法 119
第一节 引言 119
第二节 预备知识 119
一、概念 119
二、概念词典 120
三、概念密度 120
四、概念映射 120
第三节 基于概念的逻辑段落划分方法 121
一、文档预处理 121
二、概念变换 122
三、词义消歧 122
四、应用特征词聚类的文本段落划分方法 123
五、文本分类的段落化匹配实现 123
六、逻辑段落概念词语的单一性 124
七、基于概念的概念扩充和关联词语扩充 124
第四节 段落化文本分类实现 126
第五节 实验与分析 127
一、文本分类实验 127
二、信息过滤效果测试实验 129
第六节 小结 130
第八章 基于微粒群的协作过滤模板动态调整 131
第一节 引言 131
第二节 基于种群动态迁移的改进微粒群算法 131
一、传统微粒群算法 132
二、基于线性递减惯性权重调整方法(linearly) 133
三、变加速度微粒群算法 133
四、引入迁移思想的微粒群算法 134
五、实验分析 136
六、结论 137
第三节 基于微粒群的模板动态更新 139
一、协作过滤技术 139
二、混合过滤可行性分析 141
三、基本框架 141
四、基于微粒群的动态模板更新信息获取 142
五、基于改进微粒群算法的协作过滤实现 143
第四节 实验与分析 144
一、评价指标 144
二、实验分析 145
第五节 小结 147
第九章 基于反馈增量学习的过滤模板更新机制 148
第一节 反馈增量学习 148
第二节 过滤模板更新机制 149
一、本书反馈信息获取方法 149
二、基于示例文档的过滤模板增量学习 149
三、基于文本分类的过滤模板增量学习 150
第三节 基于反馈增量学习的过滤模板更新机制 151
一、GA在过滤模板更新中的应用 151
二、反馈信息中基于种群平均适应度的改进特征选择方法 154
三、基于朴素贝叶斯分类的过滤模板反馈增量学习 156
四、基于示例文档的过滤模板反馈增量学习算法 157
第四节 小结 158
第十章 文本信息过滤原型系统 159
第一节 系统设计方案 159
一、设计目标 159
二、系统逻辑结构 160
三、系统设计思路 160
四、系统基本框架 161
第二节 系统模块设计 164
一、文本摘要模块 164
二、分词模块 164
三、特征选择模块 165
四、权值计算 165
五、生成用户模板 165
六、比较过滤模块 165
第三节 系统实现 166
一、系统界面设计 166
二、过滤效果展示 168
第四节 小结 171
第十一章 结论与展望 172
第一节 总结 172
第二节 进一步的工作 174
参考文献 175
- 《关键教育事件20例》张肇丰,徐士强主编 2019
- 《潜文本的阐释与翻译》刘早著 2019
- 《教自闭症孩子主动发起和自我管理 应用关键反应训练提高社交技能》(美)Lynn Kern Koegel,(美)Robert L. Koegel著 2019
- 《中国关键词 19大篇 汉英对照 2 权威解读当代中国》中国外文出版发行事业局,当代中国与世界研究院,中国翻译研究院著 2018
- 《计算机视觉系统设计及显著性算法研究》徐海波著 2019
- 《全局光照算法技术》(美)菲利普·特瑞(Philip Dutre)等著 2019
- 《RNA折叠结构预测算法与计算复杂性》刘振栋著 2019
- 《ROS机器人编程与SLAM算法解析指南》陶满礼 2020
- 《贵州省煤层气地面抽采关键技术与工程应用》易同生,桑树勋,金军主编;周效志,汪凌霞,陈捷等副主编 2019
- 《明清知识群体的专业化与社会变迁》吴琦著 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中央财政支持提升专业服务产业发展能力项目水利工程专业课程建设成果 设施农业工程技术》赵英编 2018
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《清至民国中国西北戏剧经典唱段汇辑 第8卷》孔令纪 2018