Python数据挖掘方法及应用PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:王斌会,王术编著
- 出 版 社:北京:电子工业出版社
- 出版年份:2019
- ISBN:9787121344954
- 页数:206 页
第一部分 数据分析基础知识 2
第1章 数据收集与分析软件 2
1.1 数据收集过程 2
1.1.1 数据的类型 2
1.1.2 数据的收集 3
1.1.3 数据的管理 8
1.2 数据分析软件 9
1.2.1 数据分析软件简介 9
1.2.2 Python语言介绍 10
1.2.3 Python在线平台 13
1.3 Python编程基础 18
1.3.1 Python编程入门 18
1.3.2 Python数据类型 20
1.3.3 数值分析包numpy 24
1.3.4 数据分析包pandas 25
1.3.5 Python编程运算 34
数据及练习1 38
第2章 数据挖掘的分析基础 41
2.1 数据的描述分析 41
2.1.1 基本统计量 41
2.1.2 基本绘图函数 46
2.2 数据的透视分析 55
2.2.1 一维频数分析 56
2.2.2 二维集聚分析 57
2.2.3 多维透视分析 60
数据及练习2 62
第3章 简单数据的统计分析 64
3.1 随机变量及其分布 64
3.1.1 均匀分布 64
3.1.2 正态分布 65
3.2 随机模拟及其应用 67
3.2.1 随机模拟方法 67
3.2.2 模拟大数定律 68
3.2.3 模拟方法求积分 69
3.3 单变量统计分析模型 70
3.3.1 单变量线性相关模型 71
3.3.2 单变量线性回归模型 73
数据及练习3 75
第二部分 数据分析高级方法 78
第4章 多元数据的综合分析 78
4.1 多元线性相关与回归 79
4.1.1 多元线性相关 79
4.1.2 多元线性回归模型 81
4.2 综合评价方法 91
4.2.1 综合评价指标体系 91
4.2.2 综合评价分析方法 93
4.3 数据压缩方法 99
4.3.1 主成分分析的基本思想 99
4.3.2 主成分的基本分析 101
4.4 聚类分析方法 105
4.4.1 聚类分析的概念 105
4.4.2 系统聚类方法 108
数据与练习4 113
第5章 时序数据的模型分析 116
5.1 时间序列简介 116
5.1.1 时间序列的概念 116
5.1.2 时间序列的模拟 116
5.1.3 时间序列的读取 118
5.2 时间序列分析模型 119
5.2.1 AR模型 120
5.2.2 MR模型 120
5.2.3 ARMA模型 121
5.2.4 ARIMA模型 122
5.3 ARMA模型的构建 124
5.3.1 序列的相关性检验 124
5.3.2 ARMA模型的建立与检验 127
5.3.3 序列的平稳性检验 131
5.4 股票指数预测模型的构建 133
5.4.1 模型的预处理 134
5.4.2 参数的估计与检验 135
5.4.3 模型的预测 136
数据与练习5 137
第三部分 大数据基本处理方法 140
第6章 大数据分析基础应用 140
6.1 大数据的概念 140
6.1.1 大数据的含义 140
6.1.2 大数据应用举例 141
6.1.3 大数据分析方法 142
6.2 Python文本预处理 144
6.2.1 字符串的基本操作 144
6.2.2 字符串查询与替换 146
6.3 网络爬虫及应用 146
6.3.1 网页的基础知识 147
6.3.2 Python爬虫步骤 148
6.3.3 爬虫方法的应用 149
6.4 数据库技术及应用 154
6.4.1 Python中数据库的使用 154
6.4.2 数据库的建立与使用 155
数据及练习6 156
第7章 文献计量与科研评价 159
7.1 文献计量研究的框架 159
7.2 文献数据的获取与分析 161
7.2.1 文献数据的获取 161
7.2.2 文献数据的分析 163
7.3 科研数据的管理与评价 166
7.3.1 科研单位与项目分析 167
7.3.2 科研期刊与作者分析 169
数据及练习7 171
第8章 社会网络分析方法 172
8.1 社会网络的初步印象 172
8.1.1 社会网络分析概念 172
8.1.2 社会网络分析包 174
8.2 社会网络图的构建 174
8.2.1 社会网络数据形式 174
8.2.2 社会网络统计量 177
8.2.3 网络图之知识图谱 180
数据及练习8 183
第9章 数据分析编程平台 185
9.1 Anaconda科学计算发行包 185
9.1.1 Anaconda下载与安装 185
9.1.2 Anaconda启动与运行 186
9.2 Jupyter编辑平台 188
9.2.1 Jupyter Notebook 188
9.2.2 Jupyter Lab 193
9.2.3 在Jupyter中使用R语言 196
9.3 Spyder分析平台 197
9.3.1 Spyder平台简介 197
9.3.2 Spyder平台使用 198
附录A 本书的学习网站 200
附录B 书中的例子数据 201
附录C 书中自定义函数 202
参考文献 205
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《基于地质雷达信号波的土壤重金属污染探测方法研究》赵贵章 2019
- 《第一性原理方法及应用》李青坤著 2019
- 《数学物理方法与仿真 第3版》杨华军 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《Helmholtz方程的步进计算方法研究》李鹏著 2019
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《市政工程基础》杨岚编著 2009
- 《家畜百宝 猪、牛、羊、鸡的综合利用》山西省商业厅组织技术处编著 1959
- 《《道德经》200句》崇贤书院编著 2018
- 《高级英语阅读与听说教程》刘秀梅编著 2019
- 《计算机网络与通信基础》谢雨飞,田启川编著 2019
- 《看图自学吉他弹唱教程》陈飞编著 2019
- 《法语词汇认知联想记忆法》刘莲编著 2020
- 《培智学校义务教育实验教科书教师教学用书 生活适应 二年级 上》人民教育出版社,课程教材研究所,特殊教育课程教材研究中心编著 2019
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《流体力学》张扬军,彭杰,诸葛伟林编著 2019
- 《电子测量与仪器》人力资源和社会保障部教材办公室组织编写 2009
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《通信电子电路原理及仿真设计》叶建芳 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《电子应用技术项目教程 第3版》王彰云 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017