数据挖掘与机器学习 WEKA应用技术与实践PDF电子书下载
- 电子书积分:15 积分如何计算积分?
- 作 者:袁梅宇编著
- 出 版 社:北京:清华大学出版社
- 出版年份:2014
- ISBN:9787302371748
- 页数:457 页
第1章 Weka介绍 1
1.1 Weka简介 2
1.1.1 Weka历史 2
1.1.2 Weka功能简介 3
1.2 基本概念 4
1.2.1 数据挖掘和机器学习 4
1.2.2 数据和数据集 5
1.2.3 ARFF格式 6
1.2.4 预处理 7
1.2.5 分类与回归 10
1.2.6 聚类分析 11
1.2.7 关联分析 12
1.3 Weka系统安装 12
1.3.1 系统要求 13
1.3.2 安装过程 13
1.3.3 Weka使用初步 15
1.3.4 系统运行注意事项 17
1.4 访问数据库 22
1.4.1 配置文件 22
1.4.2 访问数据库 23
1.4.3 常见问题及解决办法 25
1.5 示例数据集 26
1.5.1 天气问题 26
1.5.2 鸢尾花 28
1.5.3 CPU 29
1.5.4 玻璃数据集 29
1.5.5 美国国会投票记录 30
1.5.6 乳腺癌数据集 31
课后强化训练 31
第2章 Explorer界面 33
2.1 图形用户界面 34
2.1.1 标签页简介 34
2.1.2 状态栏 35
2.1.3 图像输出 35
2.1.4 手把手教你用 35
2.2 预处理 38
2.2.1 加载数据 38
2.2.2 属性处理 40
2.2.3 过滤器 42
2.2.4 过滤器算法介绍 44
2.2.5 手把手教你用 49
2.3 分类 55
2.3.1 分类器选择 56
2.3.2 分类器训练 57
2.3.3 分类器输出 58
2.3.4 分类算法介绍 61
2.3.5 分类模型评估 74
2.3.6 手把手教你用 77
2.4 聚类 94
2.4.1 聚类面板操作 94
2.4.2 聚类算法介绍 95
2.4.3 手把手教你用 97
2.5 关联 102
2.5.1 关联面板操作 103
2.5.2 关联算法介绍 103
2.5.3 手把手教你用 106
2.6 选择属性 113
2.6.1 选择属性面板操作 114
2.6.2 选择属性算法介绍 114
2.6.3 手把手教你用 116
2.7 可视化 123
2.7.1 选择单独的2D散点图 124
2.7.2 选择实例 125
2.7.3 手把手教你用 125
课后强化训练 127
第3章 Knowledge Flow界面 129
3.1 知识流介绍 130
3.1.1 知识流特性 130
3.1.2 知识流界面布局 131
3.2 知识流组件 133
3.2.1 数据源 133
3.2.2 数据接收器 136
3.2.3 评估器 138
3.2.4 可视化器 140
3.2.5 其他工具 141
3.3 使用知识流组件 143
3.4 手把手教你用 145
课后强化训练 162
第4章 Experimenter界面 163
4.1 简介 164
4.2 标准实验 165
4.2.1 简单实验 165
4.2.2 高级实验 170
42.3 手把手教你用 177
4.3 远程实验 189
4.3.1 远程实验设置 189
4.3.2 手把手教你用 192
4.4 分析结果 199
4.4.1 获取实验结果 200
4.4.2 配置测试 200
4.4.3 保存结果 204
4.4.4 手把手教你用 204
课后强化训练 208
第5章 命令行界面 209
5.1 命令行界面介绍 210
5.1.1 命令调用 211
5.1.2 命令自动完成 212
5.2 Weka结构 213
5.2.1 类实例和包 213
5.2.2 weka.core包 214
5.2.3 weka.classifiers包 215
5.2.4 其他包 216
5.3 命令行选项 216
5.3.1 常规选项 217
5.3.2 特定选项 219
5.4 过滤器和分类器选项 220
5.4.1 过滤器选项 220
5.4.2 分类器选项 223
5.4.3 手把手教你用 224
5.5 包管理器 229
5.5.1 命令行包管理器 230
5.5.2 运行安装的算法 231
课后强化训练 232
第6章 Weka高级应用 233
6.1 贝叶斯网络 234
6.1.1 简介 234
6.1.2 贝叶斯网络编辑器 237
6.1.3 在探索者中使用贝叶斯网络 245
6.1.4 学习算法 246
6.1.5 查看贝叶斯网络 248
6.1.6 手把手教你用 251
6.2 神经网络 261
6.2.1 GUI使用 261
6.2.2 手把手教你用 263
6.3 文本分类 268
6.3.1 文本分类示例 268
6.3.2 分类真实文本 273
6.3.3 手把手教你用 274
6.4 时间序列分析及预测 280
6.4.1 使用时间序列环境 280
6.4.2 手把手教你用 291
课后强化训练 299
第7章 Weka API 301
7.1 加载数据 302
7.1.1 从文件加载数据 302
7.1.2 从数据库加载数据 303
7.1.3 手把手教你用 304
7.2 保存数据 309
7.2.1 保存数据至文件 309
7.2.2 保存数据至数据库 309
7.2.3 手把手教你用 310
7.3 处理选项 313
7.3.1 处理选项方法 313
7.3.2 手把手教你用 314
7.4 内存数据集处理 315
7.4.1 在内存中创建数据集 315
7.4.2 打乱数据顺序 319
7.4.3 手把手教你用 319
7.5 过滤 323
7.5.1 批量过滤 324
7.5.2 即时过滤 325
7.5.3 手把手教你用 326
7.6 分类 329
7.6.1 分类器构建 329
7.6.2 分类器评估 330
7.6.3 实例分类 332
7.6.4 手把手教你用 333
7.7 聚类 344
7.7.1 聚类器构建 345
7.7.2 聚类器评估 345
7.7.3 实例聚类 347
7.7.4 手把手教你用 347
78属性选择 353
7.8.1 使用元分类器 354
7.8.2 使用过滤器 354
7.8.3 使用底层API 355
7.8.4 手把手教你用 356
7.9 可视化 359
7.9.1 ROC曲线 359
7.9.2 图 360
7.9.3 手把手教你用 361
7.1 0序列化 366
7.1 0.1 序列化基本方法 366
7.1 0.2 手把手教你用 367
7.1 1 文本分类综合示例 369
7.1 1.1 程序运行准备 369
7.1 1.2 源程序分析 370
7.1 1.3 运行说明 377
课后强化训练 379
第8章 学习方案源代码分析 381
8.1 NaiveBayes源代码分析 382
8.2 实现分类器的约定 401
课后强化训练 403
附录A 中英文术语对照 405
附录B Weka算法介绍 409
参考文献 457
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《Prometheus技术秘笈》百里燊 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《中央财政支持提升专业服务产业发展能力项目水利工程专业课程建设成果 设施农业工程技术》赵英编 2018
- 《药剂学实验操作技术》刘芳,高森主编 2019
- 《林下养蜂技术》罗文华,黄勇,刘佳霖主编 2017
- 《脱硝运行技术1000问》朱国宇编 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019