第1章 打造深度学习工具箱 1
1.1 TensorFlow 1
1.1.1安装 1
1.1.2使用举例 3
1.2 TFLearn 3
1.3 PaddlePaddle 4
1.3.1安装 5
1.3.2使用举例 6
1.4 Karas 7
1.5本章小结 9
第2章 卷积神经网络 10
2.1传统的图像分类算法 10
2.2基于CNN的图像分类算法 11
2.2.1局部连接 11
2.2.2参数共享 13
2.2.3池化 15
2.2.4典型的CNN结构及实现 16
2.2.5 AlexNet的结构及实现 19
2.2.6 VGG的结构及实现 24
2.3基于CNN的文本处理 29
2.3.1典型的CNN结构 30
2.3.2典型的CNN代码实现 30
2.4本章小结 32
第3章 循环神经网络 33
3.1循环神经算法概述 34
3.2单向循环神经网络结构与实现 36
3.3双向循环神经网络结构与实现 38
3.4循环神经网络在序列分类的应用 41
3.5循环神经网络在序列生成的应用 42
3.6循环神经网络在序列标记的应用 43
3.7循环神经网络在序列翻译的应用 44
3.8本章小结 46
第4章 基于OpenSOC的机器学习框架 47
4.1 OpenSOC框架 47
4.2数据源系统 48
4.3数据收集层 53
4.4消息系统层 57
4.5实时处理层 60
4.6存储层 62
4.6.1 HDFS 62
4.6.2 HBase 64
4.6.3 Elasticsearch 65
4.7分析处理层 66
4.8计算系统 67
4.9实战演练 72
4.10本章小结 77
第5章 验证码识别 78
5.1数据集 79
5.2特征提取 80
5.3模型训练与验证 81
5.3.1 K近邻算法 81
5.3.2支持向量机算法 81
5.3.3深度学习算法之MLP 82
5.3.4深度学习算法之CNN 83
5.4本章小结 87
第6章 垃圾邮件识别 88
6.1数据集 89
6.2特征提取 90
6.2.1词袋模型 90
6.2.2 TF-IDF模型 93
6.2.3词汇表模型 95
6.3模型训练与验证 97
6.3.1朴素贝叶斯算法 97
6.3.2支持向量机算法 100
6.3.3深度学习算法之MLP 101
6.3.4深度学习算法之CNN 102
6.3.5深度学习算法之RNN 106
6.4本章小结 108
第7章 负面评论识别 109
7.1数据集 110
7.2特征提取 112
7.2.1词袋和TF-IDF模型 112
7.2.2词汇表模型 114
7.2.3 Word2Vec模型和Doc2Vec模型 115
7.3模型训练与验证 119
7.3.1朴素贝叶斯算法 119
7.3.2支持向量机算法 122
7.3.3深度学习算法之MLP 123
7.3.4深度学习算法之CNN 124
7.4本章小结 127
第8章 骚扰短信识别 128
8.1数据集 129
8.2特征提取 130
8.2.1词袋和TF-IDF模型 130
8.2.2词汇表模型 131
8.2.3 Word2Vec模型和Doc2Vec模型 132
8.3模型训练与验证 134
8.3.1朴素贝叶斯算法 134
8.3.2支持向量机算法 136
8.3.3 XGBoost算法 137
8.3.4深度学习算法之MLP 140
8.4本章小结 141
第9章Linux后门检测 142
9.1数据集 142
9.2特征提取 144
9.3模型训练与验证 145
9.3.1朴素贝叶斯算法 145
9.3.2 XGBoost算法 146
9.3.3深度学习算法之多层感知机 148
9.4本章小结 149
第10章 用户行为分析与恶意行为检测 150
10.1数据集 151
10.2特征提取 152
10.2.1词袋和TF-IDF模型 152
10.2.2词袋和N-Gram模型 154
10.2.3词汇表模型 155
10.3模型训练与验证 156
10.3.1朴素贝叶斯算法 156
10.3.2 XGBoost算法 157
10.3.3隐式马尔可夫算法 159
10.3.4深度学习算法之MLP 164
10.4本章小结 166
第11章WebShell检测 167
11.1数据集 168
11.1.1 WordPress 168
11.1.2 PHPCMS 170
11.1.3 phpMyAdmin 170
11.1.4 Smarty 171
11.1.5 Yii 171
11.2特征提取 172
11.2.1词袋和TF-IDF模型 172
11.2.2 opcode和N-Gram模型 174
11.2.3 opcode调用序列模型 180
11.3模型训练与验证 181
11.3.1朴素贝叶斯算法 181
11.3.2深度学习算法之MLP 182
11.3.3深度学习算法之CNN 184
11.4本章小结 188
第12章 智能扫描器 189
12.1自动生成XSS攻击载荷 190
12.1.1数据集 190
12.1.2特征提取 194
12.1.3模型训练与验证 195
12.2自动识别登录界面 198
12.2.1数据集 198
12.2.2特征提取 199
12.2.3模型训练与验证 201
12.3本章小结 203
第13章DGA域名识别 204
13.1数据集 206
13.2特征提取 207
13.2.1 N-Gram模型 207
13.2.2统计特征模型 208
13.2.3字符序列模型 210
13.3模型训练与验证 210
13.3.1朴素贝叶斯算法 210
13.3.2 XGBoost算法 212
13.3.3深度学习算法之多层感知机 215
13.3.4深度学习算法之RNN 218
13.4本章小结 221
第14章 恶意程序分类识别 222
14.1数据集 223
14.2特征提取 226
14.3模型训练与验证 228
14.3.1支持向量机算法 228
14.3.2 XGBoost算法 229
14.3.3深度学习算法之多层感知机 230
14.4本章小结 231
第15章 反信用卡欺诈 232
15.1数据集 232
15.2特征提取 234
15.2.1标准化 234
15.2.2标准化和降采样 234
15.2.3标准化和过采样 236
15.3模型训练与验证 239
15.3.1朴素贝叶斯算法 239
15.3.2 XGBoost算法 243
15.3.3深度学习算法之多层感知机 247
15.4本章小结 251