第1章 Web数据挖掘概述 1
学习目标 1
1.1 Web数据挖掘基础 2
1.2 Web数据挖掘应用 10
1.3 Web数据挖掘面临的挑战 18
1.4 Web数据挖掘的研究热点及发展趋势 20
本章小结 22
复习思考题 22
第2章 Web挖掘的内容及使用技术 23
学习目标 23
2.1 Web内容挖掘 24
2.2 Web结构挖掘 34
2.3 Web使用挖掘 40
2.4 Web挖掘的实现技术 47
本章小结 55
复习思考题 56
第3章 Web抓取 57
学习目标 57
3.1 Web抓取概述 58
3.2 网络爬虫的抓取过程 63
3.3 Web抓取中的主要知识 66
3.4 几种不同类型的爬虫 69
3.5 举例分析网络蜘蛛抓取网页的实现方法 78
3.6 爬虫的软件实现 85
本章小结 90
复习思考题 90
第4章 信息检索与Web搜索 91
学习目标 91
4.1 信息检索概述 92
4.2 信息检索模型与算法 94
4.3 关联性反馈 105
4.4 网页的预处理 106
4.5 倒排索引及其压缩 108
4.6 Web搜索 114
本章小结 116
复习思考题 116
第5章 Web网页信息预处理 117
学习目标 117
5.1 Web网页信息预处理概述 118
5.2 Web网页信息抽取的主要技术 119
5.3 网页预处理中的一些关键技术 150
本章小结 155
复习思考题 155
第6章 词法分析 156
学习目标 156
6.1 中文分词概述 157
6.2 典型的中文分词算法及工具 167
6.3 典型分词方法示例 178
6.4 词性自动标注技术 186
本章小结 191
复习思考题 192
第7章 句法分析 193
学习目标 193
7.1 句法分析的理论基础 194
7.2 句法分析的基本方法 202
7.3 句法分析的语法体系 212
本章小结 219
复习思考题 220
第8章 文本情感倾向分析 221
学习目标 221
8.1 文本情感倾向分析概述 222
8.2 情感词语级倾向性分析 226
8.3 修饰极性判断 238
8.4 句子情感倾向分析 245
8.5 文本情感倾向分析 248
本章小结 264
复习思考题 265
第9章 观点挖掘 266
学习目标 266
9.1 观点型主观性文本 267
9.2 主题抽取 273
9.3 观点表达者识别 274
9.4 基于情感的观点分类 275
9.5 基于特征的观点挖掘 277
9.6 比较性句子的观点挖掘 283
9.7 观点欺诈 285
本章小结 288
复习思考题 289
第10章 Web数据挖掘应用案例 290
10.1 基于观点挖掘的股价走势预测 291
10.2 网络舆情分析的应用案例 294
10.3 基于文本挖掘的伊利企业预警分析 300
10.4 精准营销案例 305
第11章 语义网 317
学习目标 317
11.1 语义网的概述 318
11.2 语义网的规范 324
11.3 本体和本体语言 342
11.4 语义网的应用现状及发展趋势 358
本章小结 363
复习思考题 364
第12章 Web数据挖掘与语义网 365
学习目标 365
12.1 基于语义的Web挖掘 366
12.2 利用语义帮助Web挖掘 368
12.3 创建语义网 384
本章小结 400
复习思考题 401
主要参考文献 402