当前位置:首页 > 工业技术
机器学习在线  解析阿里云机器学习平台
机器学习在线  解析阿里云机器学习平台

机器学习在线 解析阿里云机器学习平台PDF电子书下载

工业技术

  • 电子书积分:11 积分如何计算积分?
  • 作 者:杨旭著
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2017
  • ISBN:9787121318696
  • 页数:255 页
图书介绍:以机器学习中的典型案例为主线,条分缕析梳理阿里云的平台功能,讲解如何用阿里云的机器学习平台来实现各类应用,包括商家作弊检测、生存预测、信用风险预测、用户购买行为预测等,并完整地介绍了机器学习的基本原理与实践技巧。
《机器学习在线 解析阿里云机器学习平台》目录

第1章 阿里云机器学习 1

1.1 产品特点 1

1.2 名词解释 2

1.3 构建机器学习实验 3

1.3.1 新建实验 3

1.3.2 使用组件搭建工作流 4

1.3.3 运行实验、查看结果 5

1.3.4 模型部署、在线预测 6

第2章 商家作弊行为检测 7

2.1 数据探索 8

2.2 建模、预测和评估 15

2.3 尝试其他分类模型 19

2.4 判断商家作弊 24

第3章 生存预测 27

3.1 数据集一 27

3.1.1 特征分析 28

3.1.2 生存预测 33

3.2 数据集二 36

3.2.1 随机森林模型 39

3.2.2 朴素贝叶斯模型 47

第4章 信用风险预测 50

4.1 整体流程 53

4.1.1 特征哑元化 54

4.1.2 特征重要性 57

4.2 模型效果评估 61

4.3 减少模型特征的个数 62

第5章 用户购买行为预测 65

5.1 数据探索 66

5.2 思路 68

5.2.1 用户和品牌的各种特征 69

5.2.2 二分类模型训练 71

5.3 计算训练数据集 71

5.3.1 原始数据划分 72

5.3.2 计算特征 74

5.3.3 计算标签 89

5.4 二分类模型训练 90

5.4.1 正负样本配比 90

5.4.2 逻辑回归算法 92

5.4.3 随机森林算法 94

第6章 聚类与分类 96

6.1 数据可视化 97

6.2 K-Means聚类 98

6.2.1 聚类、评估流程 100

6.2.2 聚成两类 101

6.2.3 聚成三类 103

6.3 K最近邻算法 104

6.3.1 使用KNN算法进行分类 105

6.3.2 算法比较 108

6.4 多分类模型 109

6.4.1 使用朴素贝叶斯算法 109

6.4.2 使用逻辑回归多分类算法 112

6.4.3 使用随机森林算法 115

6.4.4 各多分类模型效果对比 118

第7章 葡萄酒品质预测 119

7.1 数据探索 120

7.2 线性回归 123

7.3 GBDT回归 125

第8章 文本分析 127

8.1 分词 128

8.2 词频统计 130

8.3 单词的区分度 131

8.4 字符串比较 133

8.5 抽取关键词、关键句 139

8.5.1 原理简介 139

8.5.2 完整流程 141

8.6 主题模型 146

8.6.1 LDA模型 147

8.6.2 新闻的主题模型 149

8.6.3 数据预处理 150

8.6.4 主题与原始分类的关系 153

8.7 单词映射为向量 160

8.7.1 相近单词 162

8.7.2 单词聚类 165

8.8 组件使用小结 168

第9章 基于用户退货描述的赔付预测 170

9.1 思路 171

9.2 训练集的特征生成 173

9.3 测试集的特征生成 180

9.4 模型训练、预测、评估 181

9.5 提高召回率 185

第10章 情感分析 189

10.1 词袋模型 190

10.1.1 训练集的特征生成 192

10.1.2 测试集的特征生成 196

10.1.3 模型训练、预测、评估 197

10.2 词向量模型 200

10.2.1 特征生成 201

10.2.2 模型训练 206

第11章 影片推荐 211

11.1 协同过滤 212

11.2 整体流程 213

11.3 预处理,过滤出好评信息 215

11.4 计算影片间的相似度 215

11.5 计算用户可能喜欢的影片 221

11.6 查看推荐效果 224

第12章 支持深度学习框架 227

12.1 TensorFlow组件简介 227

12.2 Softmax模型 231

12.3 深度神经网络 234

附录A 237

相关图书
作者其它书籍
返回顶部