大数据应用分析技术与方法PDF电子书下载
- 电子书积分:9 积分如何计算积分?
- 作 者:刘汝焯,戴佳筑,何玉洁编著
- 出 版 社:北京:清华大学出版社
- 出版年份:2018
- ISBN:9787302487074
- 页数:197 页
第1章 大数据是信息社会的宝贵资源 1
1.1大数据产生的背景和概念 1
1.2大数据的特征 3
1.3大数据与传统数据的区别 4
1.4大数据的价值和开发应用 5
1.5大数据时代的新机遇和新挑战 8
1.5.1依据大数据进行决策成为一种新的决策方式 8
1.5.2大数据与各行业深度融合带来层出不穷的新应用 8
1.5.3大数据推动新技术的不断涌现 9
1.6本书的特定视野 10
参考文献 11
第2章 大数据应用分析 12
2.1大数据的处理流程 12
2.2大数据分析的概念 14
2.3大数据分析的关键技术 15
2.3.1云计算 15
2.3.2数据分析方法 16
2.3.3数据可视化 17
2.4大数据分析工具介绍 17
2.4.1 Hadoop 18
2.4.2 R 19
2.4.3 Python 19
2.4.4 RapidMiner 20
2.4.5 Tableau 20
2.5大数据分析示例——查处虚假出口贸易 22
2.5.1案例概述 22
2.5.2查询分析 23
2.5.3可视化分析 25
2.5.4分析小结 27
参考文献 30
第3章 常用数据分析与预测方法 31
3.1方差分析 31
3.1.1分析方法 31
3.1.2示例介绍 31
3.1.3示例分析 33
3.1.4结果分析与总结 35
3.2相关分析 35
3.2.1分析方法 35
3.2.2示例介绍 36
3.2.3示例分析 37
3.2.4结果分析与总结 40
3.3回归分析 40
3.3.1分析方法 40
3.3.2示例介绍 41
3.3.3示例分析 41
3.3.4结果分析与总结 42
3.4时间序列分析 44
3.4.1平稳性检验 44
3.4.2纯随机性检验 44
3.4.3适用性检测 44
3.5聚类分析 45
3.6可视化数据分析 46
3.6.1常用的可视化数据展示方法 47
3.6.2可视化分析示例 51
3.7环境准备 61
参考文献 62
第4章 大数据分析的思维特征 63
4.1大数据应用分析的实务框架 63
4.1.1大数据应用分析的四个层面 63
4.1.2四个层面的关系 65
4.2大数据分析的特征发现 65
4.2.1特征发现的案例 66
4.2.2特征发现的概念 73
4.3对数据的分类 73
4.4特征发现的一般过程 79
参考文献 81
第5章 大数据的可视化分析 82
5.1不良贷款分析 82
5.1.1数据准备 82
5.1.2各银行的不良贷款情况分析 86
5.1.3各经济类型的企业的不良贷款情况分析 95
5.1.4各类贷款的不良贷款情况分析 99
5.2保险公司客户索赔分析 103
5.2.1数据准备 103
5.2.2数据分析 104
参考文献 119
第6章 可视化挖掘分析 120
6.1挖掘分析在审计线索特征发现中的应用 120
6.1.1案例背景 120
6.1.2数据准备 120
6.1.3聚类分析 122
6.2挖掘分析在推荐系统中的应用 131
6.2.1案例背景 131
6.2.2数据准备 131
6.2.3构建推荐系统 132
第7章 大数据资源的元数据管理 140
7.1元数据简介 140
7.1.1元数据和对象数据 140
7.1.2应用元数据管理技术的意义 140
7.2著录对象分析 142
7.2.1审计中间表 142
7.2.2审计分析模型 142
7.2.3审计专家经验 143
7.2.4审计情景案例 144
7.2.5被审计单位资料 144
7.3元数据结构设计 145
7.3.1审计中间表的元数据结构 145
7.3.2审计分析模型的元数据结构 146
7.3.3审计专家经验的元数据结构 147
7.3.4审计情景案例的元数据结构 149
7.3.5被审计单位资料的元数据结构 150
7.4应用大数据审计分析数字信息元数据规范的扩展规则 151
参考文献 152
第8章 大数据分析的数据清洗 153
8.1大数据清洗的基本概念 153
8.1.1大数据清洗的基本架构 153
8.1.2数据清洗的基本步骤 154
8.2数据清洗 157
8.2.1数据清洗的一些注意事项 157
8.2.2常见的数据清洗 158
参考文献 163
第9章 大数据分析的风险与对策 164
9.1大数据分析的风险及产生原因 164
9.2大数据采集的风险 165
9.3大数据处理与集成的风险 167
9.4大数据分析的风险 168
9.5大数据解释的风险 168
9.6大数据的隐私和安全风险及其对策 169
9.6.1大数据处理流程的隐私风险 170
9.6.2大数据处理平台带来的安全和隐私风险 172
9.6.3保护大数据隐私和安全的对策 173
参考文献 175
第10章 大数据治理简介 177
10.1大数据治理的必要性 177
10.2大数据治理的概念 178
10.3大数据治理的核心内容 180
10.4案例 181
10.4.1工作思路 182
10.4.2数据真实性的验证方法 182
10.4.3数据完整性的验证 186
参考文献 187
附录A Tableau 10.0简介 188
A.1 Tableau工作区 188
A.1.1工作表工作区 189
A.1.2仪表板工作区 190
A.1.3故事工作区 191
A.2 Tableau的文件管理 192
附录B RapidMiner使用方法简介 194
B.1 RapidMiner的主界面 194
B.2使用RapidMiner分析数据的方法 195
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《钒产业技术及应用》高峰,彭清静,华骏主编 2019
- 《现代水泥技术发展与应用论文集》天津水泥工业设计研究院有限公司编 2019
- 《分析化学》陈怀侠主编 2019
- 《英汉翻译理论的多维阐释及应用剖析》常瑞娟著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《区块链DAPP开发入门、代码实现、场景应用》李万胜著 2019
- 《虚拟流域环境理论技术研究与应用》冶运涛蒋云钟梁犁丽曹引等编著 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《大学计算机实验指导及习题解答》曹成志,宋长龙 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《大学生心理健康与人生发展》王琳责任编辑;(中国)肖宇 2019
- 《大学英语四级考试全真试题 标准模拟 四级》汪开虎主编 2012
- 《大学英语教学的跨文化交际视角研究与创新发展》许丽云,刘枫,尚利明著 2020
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《复旦大学新闻学院教授学术丛书 新闻实务随想录》刘海贵 2019
- 《大学英语综合教程 1》王佃春,骆敏主编 2015
- 《大学物理简明教程 下 第2版》施卫主编 2020
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019