Python 3爬虫、数据清洗与可视化实战PDF电子书下载
- 电子书积分:10 积分如何计算积分?
- 作 者:零一,韩要宾,黄园园著
- 出 版 社:北京:电子工业出版社
- 出版年份:2018
- ISBN:9787121333590
- 页数:204 页
第1章Python基础 1
1.1安装Python环境 1
1.1.1 Python 3.6.2安装与配置 1
1.1.2使用IDE工具——PyCharm 4
1.1.3使用IDE工具——Anaconda 4
1.2 Python操作入门 6
1.2.1编写第一个Python代码 6
1.2.2 Python基本操作 9
1.2.3变量 10
1.3 Python数据类型 10
1.3.1数字 10
1.3.2字符串 11
1.3.3列表 13
1.3.4元组 14
1.3.5集合 15
1.3.6字典 15
1.4 Python语句与函数 16
1.4.1条件语句 16
1.4.2循环语句 16
1.4.3函数 17
第2章 写一个简单的爬虫 18
2.1关于爬虫的合法性 18
2.2了解网页 20
2.2.1认识网页结构 21
2.2.2写一个简单的HTML 21
2.3使用requests库请求网站 23
2.3.1安装requests库 23
2.3.2爬虫的基本原理 25
2.3.3使用GET方式抓取数据 26
2.3.4使用POST方式抓取数据 27
2.4使用Beautiful Soup解析网页 30
2.5清洗和组织数据 34
2.6爬虫攻防战 35
第3章用API爬取天气预报数据 38
3.1注册免费API和阅读技术文档 38
3.2获取API数据 40
3.3存储数据到MongoDB 45
3.3.1下载并安装MongoDB 45
3.3.2在PyCharm中安装Mongo Plugin 46
3.3.3将数据存入MongoDB 49
3.4 MongoDB数据库查询 52
第4章 大型爬虫案例:抓取某电商网站的商品数据 55
4.1观察页面特征和解析数据 55
4.2工作流程分析 64
4.3构建类目树 65
4.4获取产品列表 68
4.5代码优化 70
4.6爬虫效率优化 74
4.7容错处理 77
第5章Scrapy爬虫 78
5.1 Scrapy简介 78
5.2 Scrapy安装 79
5.3案例:用Scrapy抓取股票行情 80
第6章Selenium爬虫 88
6.1 Selenium简介 88
6.2案例:用Selenium抓取电商网站数据 90
第7章 数据库连接和查询 100
7.1使用PyMySQL 100
7.1.1连接数据库 100
7.1.2案例:某电商网站女装行业TOP 100销量数据 102
7.2使用SQLAlchemy 104
7.2.1 SQLAlchemy基本介绍 104
7.2.2 SQLAlchemy基本语法 105
7.3 MongoDB 107
7.3.1 MongoDB基本语法 107
7.3.2案例:在某电商网站搜索“连衣裙”的商品数据 107
第8章NumPy 109
8.1 NumPy简介 109
8.2一维数组 110
8.2.1数组与列表的异同 110
8.2.2数组的创建 111
8.3多维数组 111
8.3.1多维数组的高效性能 112
8.3.2多维数组的索引与切片 113
8.3.3多维数组的属性 113
8.4数组的运算 115
第9章pandas数据清洗 117
9.1数据读写、选择、整理和描述 117
9.1.1从CSV中读取数据 119
9.1.2向CSV写入数据 120
9.1.3数据选择 120
9.1.4数据整理 122
9.1.5数据描述 123
9.2数据分组、分割、合并和变形 124
9.2.1数据分组 124
9.2.2数据分割 127
9.2.3数据合并 128
9.2.4数据变形 134
9.2.5案例:旅游数据的分析与变形 136
9.3缺失值、异常值和重复值处理 140
9.3.1缺失值处理 140
9.3.2检测和过滤异常值 144
9.3.3移除重复数据 147
9.3.4案例:旅游数据的值检查与处理 149
9.4时序数据处理 152
9.4.1日期/时间数据转换 152
9.4.2时序数据基础操作 153
9.4.3案例:天气数据分析与处理 155
9.5数据类型转换 158
9.6正则表达式 160
9.6.1元字符与限定符 161
9.6.2案例:用正则表达式提取网页文本信息 162
第10章 综合应用实例 164
10.1按性价比给用户推荐旅游产品 164
10.1.1数据采集 165
10.1.2数据清洗、建模 169
10.2通过热力图分析为用户提供出行建议 172
10.2.1某旅游网站热门景点爬虫代码(qunaer_sights.py) 175
10.2.2提取CSV文件中经纬度和销量信息 178
10.2.3创建景点门票销量热力地图HTML文件 179
第11章 数据可视化 182
11.1 matplotlib 183
11.1.1画出各省份平均价格、各省份平均成交量柱状图 183
11.1.2画出各省份平均成交量折线图、柱状图、箱形图和饼图 184
11.1.3画出价格与成交量的散点图 185
11.2 pyecharts 186
11.2.1 Echarts简介 186
11.2.2 pyecharts简介 187
11.2.3初识pyecharts,玫瑰相送 187
11.2.4 pyecharts基本语法 188
11.2.5基于商业分析的pyecharts图表绘制 190
11.2.6使用pyecharts绘制其他图表 199
11.2.7 pyecharts和Jupyter 203
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《Python3从入门到实战》董洪伟 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《星空摄影后期实战》阿五在路上著 2020
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《中国生态系统定位观测与研究数据集 森林生态系统卷 云南西双版纳》邓晓保·唐建维 2010
- 《半小时漫画股票实战法》财经杂质著 2019
- 《中风偏瘫 脑萎缩 痴呆 最新治疗原则与方法》孙作东著 2004
- 《水面舰艇编队作战运筹分析》谭安胜著 2009
- 《王蒙文集 新版 35 评点《红楼梦》 上》王蒙著 2020
- 《TED说话的力量 世界优秀演讲者的口才秘诀》(坦桑)阿卡什·P.卡里亚著 2019
- 《燕堂夜话》蒋忠和著 2019
- 《经久》静水边著 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《微表情密码》(波)卡西亚·韦佐夫斯基,(波)帕特里克·韦佐夫斯基著 2019
- 《看书琐记与作文秘诀》鲁迅著 2019
- 《酒国》莫言著 2019
- 《电子测量与仪器》人力资源和社会保障部教材办公室组织编写 2009
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《通信电子电路原理及仿真设计》叶建芳 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《电子应用技术项目教程 第3版》王彰云 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017