绪论 大数据时代之“皇帝的新装” 1
第一章 朴素的数据价值观 9
什么是数据? 9
数据的商业价值 11
数据到价值的转化:回归分析的“道”与“术” 20
搞清客户需求 26
中国数据科学的风口 29
第二章 数据可视化 36
实力派:准确+有效 36
偶像派:简洁+美观 38
柱状图 41
堆积柱状图 46
柱状图之妙用 50
饼图 53
直方图 58
折线图 62
散点图 67
箱线图 70
茎叶图 75
第三章 回归分析 79
什么是回归分析? 79
线性回归——北京市二手房房价 82
线性回归——中国电影票房 88
线性回归——线上女装销量预测 94
线性回归——股票投资中的均线策略 99
0-1回归——某移动通信公司客户流失预警分析 108
0-1回归——车险数据分析与商业价值 112
0-1回归——点击率预测在RTB广告投放中的应用 118
定序回归——信用卡逾期数据分析 124
计数回归——英超进球谁最强 129
生存回归——新产品在架时长研究 135
第四章 机器学习 140
朴素贝叶斯——12345,有事找政府 141
决策树——非诚勿扰 147
决策树——二手车保值比率那些事儿 155
回归树与提升算法——世界这么大,想去哪儿看看? 162
深度学习——图像自动识别 171
深度学习——打麻将 185
K均值聚类——狗熊皮鞋的百度广告投放 196
第五章 非结构化数据 205
中文文本——小说的三要素:以《琅琊榜》为例 205
中文文本——从用户评论看产品改善 215
中文文本——空气净化器的好评率影响因素分析 221
中文文本——数据分析岗位招聘情况的影响因素分析 229
中文文本——张无忌最爱谁 235
网络结构数据——《甄嬛传》中的爱恨情仇 244
图像数据——通过图片识别PM2.5 252
刷卡数据——互联网征信 260