《R语言商务数据分析实战》PDF下载

  • 购买积分:10 如何计算积分?
  • 作  者:韩宝国,张良均著
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2018
  • ISBN:9787115474483
  • 页数:228 页
图书介绍:本书以任务为导向,较为全面地介绍了商务领域中R语言数据分析的应用。全书共9章,介绍商务领域不同方向项目的数据分析方法,具体内容包括R语言数据分析概述、商品零售购物篮分析、航空公司客户价值分析、财政收入预测分析、金融服务机构资金流量预测、P2P信用贷款风险控制、电子商务网站智能推荐服务、电商产品评论数据情感分析、餐饮企业综合分析。

第1章 R语言数据分析概述 1

任务1.1 认识数据分析 1

1.1.1 掌握数据分析的概念 1

1.1.2 熟悉数据分析的流程 2

1.1.3 了解数据分析应用场景 4

任务1.2 熟悉R语言数据分析工具 5

1.2.1 了解数据分析常用工具 6

1.2.2 了解R语言数据分析的优势 6

1.2.3 了解R语言数据分析常用的Packages 7

小结 10

课后习题 10

第2章 商品零售购物篮分析 12

任务2.1 了解购物篮分析 12

2.1.1 分析商品零售企业现状 12

2.1.2 了解某商品零售企业基本数据情况 13

2.1.3 熟悉购物篮分析的步骤与流程 13

任务2.2 分析商品销售状况 14

2.2.1 分析热销商品 14

2.2.2 分析商品结构 15

2.2.3 任务实现 17

任务2.3 使用Apriori关联规则构建购物篮分析模型 18

2.3.1 了解Apriori算法的基本原理与使用方法 18

2.3.2 分析结果 23

2.3.3 任务实现 24

小结 24

实训 使用Apriori算法对西饼屋订单进行关联分析 25

课后习题 25

第3章 航空公司客户价值分析 28

任务3.1 了解航空公司现状与客户价值分析 28

3.1.1 了解航空公司现状 28

3.1.2 了解客户价值分析 30

3.1.3 熟悉航空客户价值分析的步骤与流程 30

任务3.2 预处理航空客户数据 31

3.2.1 处理数据缺失值与异常值 31

3.2.2 构建航空客户价值分析的关键特征 31

3.2.3 标准化LRFMC的5个特征 35

3.2.4 任务实现 36

任务3.3 使用K-Means算法进行客户分群 37

3.3.1 了解K-Means聚类算法 37

3.3.2 分析聚类结果 38

3.3.3 模型应用 41

3.3.4 任务实现 42

小结 43

实训 43

实训1 处理信用卡数据异常值 43

实训2 构造信用卡客户风险评价关键特征 45

实训3 构建K-Means聚类模型 45

课后习题 46

第4章 财政收入预测分析 48

任务4.1 了解财政收入预测的背景与方法 48

4.1.1 分析财政收入预测背景 48

4.1.2 了解财政收入预测的方法 50

4.1.3 熟悉财政收入预测的步骤与流程 51

任务4.2 分析财政收入数据特征的相关性 51

4.2.1 了解相关性分析 51

4.2.2 分析计算结果 52

4.2.3 任务实现 53

任务4.3 使用Lasso回归方法选取财政收入预测的关键特征 53

4.3.1 了解Lasso回归方法 53

4.3.2 分析Lasso回归结果 54

4.3.3 任务实现 54

任务4.4 使用灰色预测和SVR构建财政收入预测模型 55

4.4.1 了解灰色预测算法 55

4.4.2 了解SVR算法 56

4.4.3 分析预测结果 58

4.4.4 任务实现 60

小结 61

实训 61

实训1 求取企业所得税各特征间的相关系数 61

实训2 选取企业所得税预测关键特征 62

实训3 构建企业所得税预测模型 62

课后习题 62

第5章 金融服务机构资金流量预测 64

任务5.1 了解金融服务机构现状与资金流量预测 64

5.1.1 分析金融服务机构现状 64

5.1.2 认识资金流量预测 65

5.1.3 熟悉金融服务机构资金流量预测的步骤与流程 66

任务5.2 检验数据的平稳性 67

5.2.1 检验平稳性 67

5.2.2 处理非平稳序列 69

5.2.3 任务实现 71

任务5.3 检验数据的纯随机性 72

5.3.1 了解纯随机性检验 73

5.3.2 检验纯随机性 73

5.3.3 任务实现 74

任务5.4 建立ARIMA模型 74

5.4.1 了解ARIMA模型 74

5.4.2 识别模型阶数 75

5.4.3 建立ARIMA模型 76

5.4.4 任务实现 81

小结 83

实训 83

实训1 检验资金赎回数据的平稳性与纯随机性 83

实训2 识别资金赎回数据集的阶数 83

实训3 构建ARIMA模型 83

课后习题 84

第6章 P2P信用贷款风险控制 85

任务6.1 认识P2P信贷行业的风险控制 85

6.1.1 分析P2P信贷行业的现状 86

6.1.2 了解某P2P平台数据情况 86

6.1.3 熟悉用户逾期预测的步骤与流程 87

任务6.2 探索P2P信贷用户逾期的相关因素 88

6.2.1 分析用户信息完善程度与逾期率的关系 88

6.2.2 分析用户信息修改情况与逾期率的关系 89

6.2.3 分析用户所在区域经济发展情况与逾期率的关系 90

6.2.4 分析借款月份与逾期率的关系 91

6.2.5 任务实现 92

任务6.3 预处理P2P信贷用户数据 95

6.3.1 使用第三方平台信息构建新特征 95

6.3.2 对登录信息表与更新信息表进行长宽表转换 95

6.3.3 清洗P2P信贷数据 97

6.3.4 任务实现 98

任务6.4 构建用户逾期还款概率预测模型 107

6.4.1 了解GBM算法 107

6.4.2 评价GBM模型 108

6.4.3 分析结果 109

6.4.4 任务实现 109

小结 111

实训 111

实训1 探索某银行贷款数据规律 111

实训2 预处理某银行贷款数据 111

实训3 使用GBM算法构建信贷审批模型 111

课后习题 112

第7章 电子商务网站智能推荐服务 113

任务7.1 了解某网站现状与智能推荐系统 113

7.1.1 分析某网站现状 113

7.1.2 了解智能推荐服务 115

7.1.3 熟悉网站智能推荐的步骤与流程 116

任务7.2 使用R连接数据库并提取数据 117

7.2.1 访问数据库 117

7.2.2 任务实现 118

任务7.3 统计网页整体流量状况 118

7.3.1 分析网页类型 119

7.3.2 分析网页点击次数 122

7.3.3 分析网页排名 123

7.3.4 任务实现 124

任务7.4 预处理网页浏览数据 130

7.4.1 删除不符合规则的网页 130

7.4.2 还原翻页网址 131

7.4.3 划分正确的网页类别 131

7.4.4 选择用户和用户访问网页记录 132

7.4.5 任务实现 133

任务7.5 构建智能推荐模型 136

7.5.1 了解协同过滤算法 136

7.5.2 评价智能推荐模型 139

7.5.3 分析模型结果 142

7.5.4 任务实现 142

小结 144

实训 实现MovieLense电影数据的智能推荐 144

实训1 清洗MovieLense原始数据 144

实训2 构建MovieLense智能推荐模型 144

实训3 评估推荐系统模型 145

课后习题 145

第8章 电商产品评论数据情感分析 147

任务8.1 了解电商企业现状与文本情感分析流程 147

8.1.1 分析电商企业现状 147

8.1.2 了解电商产品评论数据 148

8.1.3 实现电商评论数据情感分析的步骤与流程 149

任务8.2 获取电商产品评论数据 149

8.2.1 了解R语言获取网络数据的方法 149

8.2.2 了解数据获取的方法 151

8.2.3 任务实现 153

任务8.3 对电商产品评论数据进行预处理 156

8.3.1 去除评论数据中的重复数据 156

8.3.2 清洗评论数据 156

8.3.3 对评论数据进行分词 157

8.3.4 去除停用词 158

8.3.5 提取有意义的评论 159

8.3.6 绘制词云查看分词效果 160

8.3.7 任务实现 162

任务8.4 评论数据情感倾向分析 163

8.4.1 匹配情感词 164

8.4.2 修正情感倾向 164

8.4.3 检验情感分析效果 164

8.4.4 任务实现 165

任务8.5 使用LDA模型进行主题分析 169

8.5.1 了解LDA主题模型 169

8.5.2 寻找最优主题数 171

8.5.3 进行LDA主题分析 171

8.5.4 评价主题分析结果 172

8.5.5 任务实现 173

小结 176

实训 176

实训1 清洗酒店评论原始数据 176

实训2 对酒店评论数据进行预处理 176

实训3 使用LDA模型建模并分析酒店评论 177

课后习题 177

第9章 餐饮企业综合分析 179

任务9.1 了解餐饮企业分析需求 179

9.1.1 分析餐饮企业现状与需求 180

9.1.2 了解餐饮企业数据基本状况 181

9.1.3 熟悉餐饮企业数据分析的步骤与流程 183

任务9.2 统计餐饮菜品数据 184

9.2.1 统计每日用餐人数与销售额 184

9.2.2 统计菜品热销度 190

9.2.3 统计菜品的毛利率 191

9.2.4 任务实现 192

任务9.3 使用ARIMA算法预测销售额 194

9.3.1 检验平稳性和纯随机性 194

9.3.2 构建ARIMA模型 196

9.3.3 任务实现 198

任务9.4 使用协同过滤算法实现菜品的智能推荐 201

9.4.1 选取特征 202

9.4.2 使用基于物品的智能推荐算法进行推荐 202

9.4.3 了解基于用户的智能推荐算法 203

9.4.4 分析协同过滤结果 203

9.4.5 任务实现 204

任务9.5 使用Apriori算法实现菜品的关联分析 207

9.5.1 构建Apriori模型 207

9.5.2 分析关联规则结果 209

9.5.3 任务实现 210

任务9.6 使用K-Means算法进行客户价值分析 214

9.6.1 构建关键特征 214

9.6.2 构建K-Means模型 214

9.6.3 分析K-Means模型结果 215

9.6.4 任务实现 217

任务9.7 用决策树算法实现餐饮客户流失预测 219

9.7.1 了解客户流失 219

9.7.2 了解决策树算法 220

9.7.3 构建客户流失特征 221

9.7.4 分析决策树模型结果 223

9.7.5 任务实现 223

小结 226

实训 226

实训1 使用ARIMA模型预测网站访问量 226

实训2 使用决策树算法实现运营商客户流失预测 227

实训3 使用协同过滤算法实现网站的智能推荐 227

实训4 使用Apriori算法实现网站的关联分析 227

实训5 使用K-Means算法实现运营商客户价值分析 228

课后习题 228