大数据分析统计应用丛书 非结构化大数据分析PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:李翠平主编
- 出 版 社:北京:中国人民大学出版社
- 出版年份:2018
- ISBN:9787300262970
- 页数:225 页
第1章 文本挖掘概述 1
1.1时代背景 1
1.2文本挖掘与数据挖掘 1
第2章 文本预处理 7
2.1自然语言处理 7
2.2分词技术 8
2.3文本表示 12
第3章 文本分类 18
3.1预测建模 18
3.2决策树分类 19
3.3贝叶斯分类 27
3.4支持向量机分类 31
3.5实践案例——垃圾短信识别 36
第4章 文本聚类和话题检测 47
4.1概述 47
4.2基于相似度的文本聚类 48
4.3基于模型的文本聚类 51
4.4实践案例——用LDA实现话题检测 61
第5章 情感分析和观点挖掘 69
5.1概述 69
5.2问题定义 70
5.3文档级情感分析 73
5.4句子级情感分析 76
5.5方面级情感分析 79
5.6存在的问题和挑战 80
5.7实践案例——发债企业负面新闻识别系统 81
第6章 社交网络及其统计特性 90
6.1社交网络简介 90
6.2相关基本概念 92
6.3常见统计特性 95
6.4实践案例——微博用户关系分析 97
第7章 社区发现 113
7.1概述 113
7.2社区发现方法 115
7.3社区发现相关的研究领域 123
7.4实践案例——用边聚类探测算法发现社区 124
第8章 个体社会影响力分析 136
8.1概述 136
8.2个体社会影响力及影响强度度量 137
8.3实践案例——用PageRank算法计算个体社会影响力 144
第9章 链路预测 149
9.1简介 149
9.2基于相似度的链路预测算法 151
9.3基于等级结构模型的链路预测算法 155
9.4实践案例——链路预测 157
第10章 网络信息扩散 166
10.1热点主题的发现方法 166
10.2信息扩散过程的建模与分析 175
10.3实践案例——信息扩散计算过程 181
第11章 数据流中的数据挖掘 189
11.1简介 189
11.2数据流中的变化探测 195
11.3实时更新数据流中的直方图 196
11.4数据流中的聚类 199
11.5数据流的分类 200
11.6数据流方法的评估 201
第12章 多媒体数据分析 204
12.1概述 204
12.2基础知识 206
12.3特征提取 210
12.4多媒体内容检索 214
12.5多媒体内容识别 218
12.6国际评测 223
12.7问题与挑战 225
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《联吡啶基钌光敏染料的结构与性能的理论研究》李明霞 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《分析化学》陈怀侠主编 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《影响葡萄和葡萄酒中酚类特征的因素分析》朱磊 2019
- 《仪器分析技术 第2版》曹国庆 2018
- 《全国普通高等中医药院校药学类专业十三五规划教材 第二轮规划教材 分析化学实验 第2版》池玉梅 2018
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《中国当代乡土小说文库 本乡本土》(中国)刘玉堂 2019
- 《异质性条件下技术创新最优市场结构研究 以中国高技术产业为例》千慧雄 2019
- 《中国铁路人 第三届现实主义网络文学征文大赛一等奖》恒传录著 2019
- 《莼江曲谱 2 中国昆曲博物馆藏稀见昆剧手抄曲谱汇编之一》郭腊梅主编;孙伊婷副主编;孙文明,孙伊婷编委;中国昆曲博物馆编 2018
- 《中国制造业绿色供应链发展研究报告》中国电子信息产业发展研究院 2019
- 《中国陈设艺术史》赵囡囡著 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019