数据挖掘 第2版PDF电子书下载
- 电子书积分:15 积分如何计算积分?
- 作 者:朱明编著
- 出 版 社:合肥:中国科学技术大学出版社
- 出版年份:2008
- ISBN:9787312022449
- 页数:491 页
第1章 数据挖掘导论 1
1.1数据挖掘的发展背景 1
1.2数据挖掘定义 4
1.3数据挖掘过程 7
1.4数据挖掘功能 12
1.5数据挖掘应用 18
1.6数据挖掘发展 24
1.7本章小结 28
第2章 数据预处理 29
2.1数据描述 30
2.1.1数据集类型 33
2.1.2数据质量 39
2.2数据清理 44
2.2.1缺失值处理 45
2.2.2噪声数据处理 46
2.2.3数据清理过程 47
2.3数据集成和变换 49
2.3.1数据集成 49
2.3.2数据变换 52
2.3.3维度归约 54
2.4数据归约 58
2.4.1数据立方体聚集 58
2.4.2属性子集选择 60
2.5本章小结 61
第3章 分类挖掘:决策树 63
3.1决策树方法 63
3.2决策树深入 67
3.2.1信息熵基础 67
3.2.2C4.5方法 71
3.2.3CART方法 75
3.2.4SLIQ方法 76
3.2.5SPRINT方法 78
3.2.6其他决策树方法 79
3.3决策树的简化 82
3.4决策树的改进 93
3.4.1属性选择 93
3.4.2连续属性离散化 95
3.5决策树的讨论 96
3.5.1决策树优化问题 97
3.5.2决策树优化方法 98
3.6分类模型的评估 100
3.7本章小结 102
第4章 分类挖掘 104
4.1贝叶斯方法 104
4.1.1贝叶斯方法概述 105
4.1.2朴素贝叶斯分类 107
4.2k-近邻方法 111
4.3人工神经网络方法 116
4.4遗传进化方法 124
4.5支持向量机方法 135
4.5.1SVM分类方法 136
4.6粗糙集方法 142
4.7集成学习方法 150
4.7.1基本概念 150
4.7.2Bagging 151
4.7.3Boosting 152
4.8本章小结 154
第5章 关联挖掘 156
5.1关联挖掘简述 157
5.1.1关联挖掘应用 158
5.2关联挖掘基本方法 160
5.2.1关联挖掘基本概念 160
5.2.2关联挖掘问题 162
5.2.3关联挖掘类型 163
5.2.4关联挖掘基本方法 169
5.3关联挖掘方法改进 173
5.3.1Apriori算法改进 173
5.3.2频繁模式增长(FP-tree)算法 174
5.3.3其他改进算法 180
5.4关联挖掘并行方法 193
5.4.1基于候选集复制的算法 194
5.4.2划分候选集的算法 196
5.4.3混合策略:候选集部分复制 200
5.5基于粒计算的关联挖掘 202
5.5.1基本思想 202
5.6本章小结 206
第6章 聚类挖掘 208
6.1聚类挖掘简述 209
6.2基于划分的聚类挖掘 217
6.2.1k-means方法 218
6.3基于层次的聚类挖掘 222
6.4基于密度的聚类挖掘 225
6.5基于网格的聚类挖掘 227
6.6基于模型的聚类挖掘 229
6.7高维海量数据的聚类挖掘 229
6.7.1高维海量数据特点 230
6.7.2高维海量数据聚类算法 232
6.8基于蚁群算法的聚类挖掘 242
6.8.1蚁群算法概述 242
6.8.2蚁群算法特征 243
6.8.3蚁群算法的研究热点 245
6.8.4基于蚁穴清理行为的聚类算法 247
6.8.5基于蚁群觅食行为的聚类算法 249
6.8.6蚂蚁聚类算法分析 251
6.9本章小结 252
第7章 异类挖掘 255
7.1异类挖掘简述 255
7.1.1基于统计的异常点检测 257
7.1.2基于距离的异常点检测 258
7.1.3基于偏差的异常点检测 259
7.1.4基于密度的异常点检测 260
7.1.5高维数据的异常点检测 260
7.2基于属性的异常点检测 261
7.2.1基于属性的异常点检测 262
7.3时序异常点检测 268
7.3.1时序异常点检测概述 268
7.3.2时序异常模式挖掘 270
7.4空间异常点挖掘 276
7.5时空异常点挖掘 282
7.6数据流异常挖掘 288
7.6.1基于单调搜索空间的突变检测 289
7.6.2基于分段分形模型的无参数异常检测 297
7.7本章小结 313
第8章 文本挖掘 314
8.1文本挖掘 314
8.1.1文本挖掘简述 314
8.1.2文本分类 319
8.1.3文本预处理 322
8.1.4中文分词 330
8.2文本挖掘方法 333
8.3中文摘要方法 338
8.3.1中文摘要概述 338
8.3.2基于聚类的摘要方法 341
8.3.3自适应确定摘要长度 344
8.4文本内容监管 348
8.4.1高效多关键字匹配算法 349
8.5文本信息检索 363
8.6本章小结 371
第9章 视频挖掘 373
9.1视频内容检索简述 374
9.2镜头检测 377
9.2.1基于直方图的镜头检测方法 379
9.2.2基于运动分析的镜头检测方法 381
9.2.3基于图像特征的镜头检测方法 382
9.2.4基于多分类器组合的镜头检测方法 386
9.2.5关键帧提取方法 386
9.2.6镜头快速切变检测方法 387
9.2.7基于SVM的镜头渐变检测方法 391
9.3新闻视频挖掘 394
9.3.1自适应的镜头探测 394
9.3.2播音员镜头检测 399
9.3.3新闻故事单元检测 404
9.4广告检测 411
9.4.1基于双重窗口的镜头切变检测方法 412
9.4.2阈值的自适应选择 415
9.4.3基于音频融合的广告检测 417
9.5视频文本检测 418
9.5.1基于边缘信息和LH的视频文本检测 419
9.5.2基于小波分析和LH的视频文本检测 423
9.5.3基于形态学的视频文本检测 424
9.5.4基于小波-神经网络的视频文本检测 430
9.6本章小结 433
第10章 视频分析 434
10.1视频分析简述 434
10.2慢镜头检测 439
10.2.1基于帧间差模式识别的慢镜头检测方法 440
10.2.2基于差分图像分析的慢镜头检测方法 442
10.2.3基于零点穿越的慢镜头检测算法 443
10.2.4基于帧差模式和镜头主色的慢镜头检测方法 445
10.3视频摘要 449
10.3.1视频摘要概述 450
10.3.2视频摘要实现方法 452
10.4视频检索 455
10.4.1视频检索简介 455
10.4.2视频特征的提取 458
10.4.3视频数据的建模 467
10.4.4视频检索方法 471
10.5视频快速检索 474
10.5.1子片断分割 474
10.5.2视频特征数据的组织 478
10.5.3相似度定义 479
10.5.4查询算法 483
10.6本章小结 485
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《穿越数据的迷宫 数据管理执行指南》Laura Sebastian-Coleman 2020
- 《大数据环境下的信息管理方法技术与服务创新丛书 俄罗斯档案事业改革与发展研究》徐胡乡责编;肖秋会 2019
- 《Access数据库系统设计与应用教程》李勇帆,廖瑞华主编 2019
- 《并行数据挖掘及性能优化》荀亚玲著 2020
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《Prometheus技术秘笈》百里燊 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019