第1章大数据在各行各业 1
1.1什么是大数据? 2
1.1.1非常流行的大数据概念 2
1.1.2不那么流行的大数据概念 6
1.1.3也许会带给你灵感的大数据概念 7
1.2大数据在银行业 29
1.2.1业界展望:大数据,银行业未来的核心动力 29
1.2.2创新方向:大数据助力银行网点实现转型 36
1.3大数据在征信业 41
1.3.1业界展望:FICO评分与芝麻信用,传统征信向大数据征信的转变 42
1.3.2创新方向一:从拒绝推断看个人征信业的大有可为 46
1.3.3创新方向二:论大中型客户数字化授信的可行性 54
1.4大数据在审计业 57
1.4.1业界展望:大数据分析如何支撑审计工作 57
1.4.2创新方向:大数据能否代替传统审计? 61
1.5大数据在传统制造业 65
业界展望:数字化企业进阶指南 66
1.6大数据在互联网行业 69
创新方向:从滴滴收购优步看垄断企业的马太效应 69
1.7大数据在舆情行业 76
创新方向:数据分析帮你掌握话语权 77
1.8大数据在汽车行业 86
业界展望:征服汽车后市场,大数据与你同行 86
1.9大数据在影视业 89
创新方向:星期几上映的电影最具有票房号召力? 90
1.10大数据在环保产业 98
创新方向:北京治霾,能为你做点什么? 98
1.11大数据在体育产业 104
创新方向:欧洲杯,跟着西班牙队学数据挖掘! 105
第2章大数据在商业领域的应用 111
2.1推荐算法在传统销售渠道中的应用模式 112
2.2巧用运筹优化,提升整合营销管理水平 116
2.3关联规则的应用 121
2.3.1小谈关联规则 121
2.3.2购物篮分析:绝不只是“啤酒与尿布” 124
2.3.3创新方向:靠关联规则重获新生的东北小馆 128
2.4智能荐食模型:大数据告诉你今天吃什么 133
智能荐食模型 134
2.5顾客时空模型:其实天下没有免费的WiFi 138
2.5.1无处不在的免费WiFi 138
2.5.2顾客时空模型 139
2.5.3进一步挖掘 141
2.6社会网络分析法,助力信贷反欺诈 142
2.7数据可视化利器:SAS Visual Analytics 145
2.7.1为什么需要数据可视化? 145
2.7.2数据可视化的几个常见例子 146
2.8文本挖掘,帮你识别网购评论是真是假 151
2.9路径优化:如何改良快递送货路线? 156
第3章数据前期准备 171
3.1从抗日武装的发展谈到数据治理 172
3.1.1数据质量问题 173
3.1.2数据应用问题 174
3.1.3实施策略和路径问题 176
3.2如何生成你需要的基础数据? 182
3.3如何利用数据仓库优化数据分析? 189
3.4二分类变量的数据缺失插补 193
3.5数据离散化,如何避免丢失信息? 201
3.6如何避免数据离散化影响自变量的重要性? 204
3.7二分类模型中如何应对分类自变量取值过多? 206
第4章技术案例 211
4.1建模变量太多怎么办? 212
4.2信用评级模型怎么评估? 215
4.3观察窗口怎么选? 219
4.4 K折交叉验证怎么做? 223
4.5如何衡量变量之间的相关性? 230
4.6决策树算法真的越复杂越好吗? 235
4.7如何精选分类模型指标? 245
4.8当数据分析遇上超级奶爸 250
4.9深度挖掘,你的工资拖后腿了吗? 253
4.10用分位数回归看你的工资水平 258
附录A一位数据工作者的成长之路 265
A.1数据分析师入门攻略 266
A.2如何做一名“称职”的数据专家? 269
A.3一个数据仓库转型者眼中的数据挖掘 271
A.4预测科学:三点经验谈实际应用 276
A.5数据模型多了,应该怎么管? 277
A.6手握数据挖掘模型,你一定要知道怎么用 281
A.7浅谈以史为鉴与数据分析 286
后记 297