第1章 集装箱危险品瞒报预测 1
1.1 业务背景分析 1
1.2 数据提取 2
1.3 数据预处理 3
1.3.1 数据集成 3
1.3.2 数据清洗 3
1.3.3 数据变换 6
1.3.4 数据离散化 6
1.3.5 特征重要性筛选 7
1.3.6 数据平衡 8
1.4 危险品瞒报预测建模 9
1.5 模型评估 15
第2章 保险产品推荐 19
2.1 业务背景分析 19
2.2 数据探索 20
2.3 数据预处理 28
2.4 分类模型构建 29
2.5 平衡数据集 30
2.6 算法调参 31
2.7 模型比较 33
第3章 图书类目自动标引系统 36
3.1 业务背景分析 36
3.2 数据提取 37
3.3 数据预处理 38
3.4 基于贝叶斯分类的文献标引 41
3.4.1 增量训练 43
3.4.2 特征降维与消歧 44
3.4.3 权重调节 47
3.5 性能评估与结论 49
3.6 基于BERT算法的文献标引 49
3.6.1 数据预处理 50
3.6.2 构建训练集 52
3.6.3 模型实现 54
第4章 基于分类算法的学习失败预警 58
4.1 业务背景分析 58
4.2 学习失败风险预测流程 58
4.3 数据收集 59
4.4 数据预处理 60
4.4.1 数据探查及特征选择 60
4.4.2 数据集划分及不平衡样本处理 64
4.4.3 样本生成及标准化处理 65
4.5 随机森林算法 66
4.5.1 网格搜索及模型训练 66
4.5.2 结果分析与可视化 68
4.5.3 特征重要性分析 72
4.5.4 与其他算法比较 76
第5章 自然语言处理技术实例 79
5.1 业务背景分析 79
5.2 分析框架 80
5.3 数据收集 83
5.4 建立模型 83
5.4.1 文本分词 83
5.4.2 主题词提取 86
5.4.3 情感分析 89
5.4.4 语义角色标记 90
5.4.5 语言模型 91
5.4.6 词向量模型Word2vec 92
第6章 基于标签的信息推荐系统 96
6.1 业务背景分析 96
6.2 数据预处理 97
6.2.1 现有系统现状 97
6.2.2 数据预处理 98
6.3 内容分析 99
6.4 基于协同过滤推荐 103
6.4.1 用户偏好矩阵构建 103
6.4.2 用户相似度度量 104
6.5 基于用户兴趣推荐 107
6.6 “冷启动”问题与混合策略 110
6.6.1 冷启动问题分析 110
6.6.2 混合策略 110
第7章 快销行业客户行为分析与流失预警 112
7.1 业务背景分析 112
7.2 数据预处理 112
7.2.1 数据整理 113
7.2.2 数据统计与探查 116
7.3 用户行为分析 120
7.3.1 用户流失风险评估 120
7.3.2 流失风险预警模型集成 126
第8章 基于深度学习的图片识别系统 129
8.1 业务背景分析 129
8.2 图片识别技术方案 130
8.3 图片预处理——表格旋转 131
8.4 图片预处理——表格提取 135
8.5 基于PaddlePaddle框架的文本识别 141
8.5.1 环境安装 141
8.5.2 模型设计 142
8.5.3 模型训练 143
8.5.4 模型使用 146
8.6 基于密集卷积网络的文本识别模型 146
8.6.1 训练数据生成 149
8.6.2 DenseNet模型训练 152
8.6.3 文本识别模型调用 154
第9章 超分辨率图像重建 158
9.1 数据探索 159
9.2 数据预处理 159
9.2.1 图像尺寸调整 160
9.2.2 载入数据 160
9.2.3 图像预处理 161
9.2.4 持久化测试数据 162
9.3 模型设计 162
9.3.1 残差块 162
9.3.2 上采样PixelShuffler 163
9.3.3 生成器 164
9.3.4 判别器 165
9.3.5 损失函数与优化器定义 167
9.3.6 训练过程 168
9.4 实验评估 170
第10章 人类活动识别 173
10.1 业务背景分析 173
10.2 数据探索 174
10.3 数据预处理 175
10.4 模型构建 176
10.5 模型评估 180
附录 机器学习复习题 184
参考文献 195
- 《国家社科基金项目申报规范 技巧与案例 第3版 2020》文传浩,夏宇编著 2019
- 《党员干部理论学习培训教材 理论热点问题党员干部学习辅导》(中国)胡磊 2018
- 《Maya 2018完全实战技术手册》来阳编著 2019
- 《Python3从入门到实战》董洪伟 2019
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《星空摄影后期实战》阿五在路上著 2020
- 《中学语文教学案例研究》贺卫东主编 2019
- 《深度学习与飞桨PaddlePaddle Fluid实战》于祥 2019
- 《半小时漫画股票实战法》财经杂质著 2019
- 《数字插画实战 人像创作30例》王鲁光著 2019
- 《中学语文教学案例研究》贺卫东主编 2019
- 《新型摆线针轮传动系统动力学特性的研究》单丽君,何卫东著 2019
- 《中国近海重金属环境质量现状与污染风险评价》暨卫东,陈泓哲 2019
- 《生命终极之门》李卫东 2018
- 《Python机器学习实战案例》赵卫东 2019
- 《中亚汉语国际教育研究丛书 国际理解视域下的中亚孔子学院文化传播理论与实践》李建军,郭卫东,邓新 2019
- 《权力扩展视角下的中越南海争端研究》赵卫华著;石源华,祁怀高丛书主编 2019
- 《走出去企业税务指南 政策解读、税务筹划、风险管理》赵卫刚,王坤编著 2017
- 《现代教育在中学数学教学中的探索》程卫东,王永辉主编 2019
- 《互联网时代下高校英语教学研究》徐道平,王凤娇,赵卫红著 2019