第1章 Python与机器学习 1
1.1 scikit-learn模块库 2
1.1.1 scikit-learn的缺点 3
1.1.2 scikit-learn算法模块 4
1.1.3 scikit-learn六大功能 5
1.2 开发环境搭建 8
1.2.1 AI领域的标准编程语言:Python 8
1.2.2 zwPython:难度降低90%,性能提高10倍 9
1.2.3 “零对象”编程模式 11
1.2.4 开发平台搭建 12
1.2.5 程序目录结构 12
案例1-1:重点模块版本测试 13
1.3 机器学习:从忘却开始 17
1.4 学习路线图 20
第2章 机器学习编程入门 21
2.1 经典机器学习算法 21
2.2 经典爱丽丝 22
案例2-1:经典爱丽丝 24
案例2-2:爱丽丝进化与文本矢量化 26
2.3 机器学习算法流程 28
2.4 机器学习数据集 28
案例2-3:爱丽丝分解 29
2.5 数据切割函数 33
2.6 线性回归算法 34
案例2-4:爱丽丝回归 35
第3章 金融数据的预处理 40
3.1 至简归一法 40
案例3-1:麻烦的外汇数据 41
案例3-2:尴尬的日元 45
案例3-3:凶残的比特币 49
3.2 股票池与Rebase 51
3.2.1 股票池 51
3.2.2 Rebase与归一化 52
案例3-4:股票池Rebase归一化 53
3.3 金融数据切割 57
案例3-5:当上证遇到机器学习 58
3.4 preprocessing模块 63
案例3-6:比特币与标准化 65
案例3-7:比特币与归一化 69
第4章 机器学习快速入门 72
4.1 回归算法 72
4.2 LR线性回归模型 73
案例4-1:上证指数之LR回归事件 76
4.3 常用评测指标 81
4.4 多项式回归 83
案例4-2:上证指数的多项式故事 83
案例4-3:预测比特币价格 86
4.5 逻辑回归算法模型 87
案例4-4:上证指数预测逻辑回归版 88
第5章 模型验证优化 96
5.1 交叉验证评估器 96
案例5-1:交叉验证 98
5.2 交叉验证评分 101
案例5-2:交叉验证评分 101
第6章 决策树 103
6.1 决策树算法 103
6.1.1 ID3算法与C4.5算法 105
6.1.2 常用决策树算法 106
6.1.3 sklearn内置决策树算法 107
6.2 决策树回归函数 109
案例6-1:决策树回归算法 110
6.3 决策树分类函数 115
案例6-2:决策树分类算法 116
6.4 GBDT算法 121
6.5 迭代决策树函数 122
案例6-3:GBDT回归算法 123
案例6-4:GBDT分类算法 128
第7章 随机森林算法和极端随机树算法 133
7.1 随机森林函数 135
7.2 决策树测试框架 137
案例7-1:RF回归算法大测试 138
7.3 决策树测试函数 140
案例7-2:上证的RF回归频道 142
案例7-3:当比特币碰到RF回归算法 146
案例7-4:上证和RF分类算法 147
7.4 极端随机树算法 150
7.5 极端随机树函数 151
案例7-5:极端随机树回归算法 152
案例7-6:上证指数案例应用 154
案例7-7:ET、比特币,谁更极端 155
第8章 机器学习算法模式 159
8.1 学习模式 161
8.2 机器学习五大流派 164
8.3 经典机器学习算法 165
8.4 小结 166
第9章 概率编程 167
9.1 朴素贝叶斯的上证之旅 168
案例9-1:上证朴素贝叶斯算法 170
9.2 隐马尔可夫模型 175
案例9-2:HMM模型与模型保存 176
案例9-3:HMM算法与模型读取 180
第10章 实例算法 185
K最近邻算法 186
案例10-1:第一次惊喜——KNN算法 187
案例10-2:KNN分类 190
第11章 正则化算法 192
11.1 岭回归算法 193
案例11-1:新高度——岭回归算法 195
11.2 套索回归算法 197
案例11-2:套索回归算法应用 199
11.3 弹性网络算法 201
案例11-3:弹性网络算法应用 202
11.4 最小角回归算法 204
案例11-4:LARS算法应用 204
第12章 聚类分析 206
12.1 K均值算法 207
案例12-1:K均值算法应用 208
12.2 BIRCH算法 210
案例12-2:BIRCH算法应用 211
12.3 小结 213
第13章 降维算法 215
13.1 主成分分析 216
案例13-1:主成分分析的应用 218
案例13-2:PCA算法的上证戏法 223
13.2 奇异值分解算法 227
案例13-3:奇异果传说:SVD 228
第14章 集成算法 229
14.1 sklearn内置集成算法 231
14.2 装袋算法 232
案例14-1:装袋回归算法 232
案例14-2:装袋分类算法 234
14.3 AdaBoost迭代算法 236
案例14-3:AdaBoost迭代回归算法 237
案例14-4:AdaBoost迭代分类算法 239
第15章 支持向量机 242
15.1 支持向量机算法 242
15.2 SVM函数接口 244
案例15-1:SVM回归算法 245
案例15-2:SVM分类算法 247
第16章 人工神经网络算法 250
多层感知器 252
案例16-1:多层感知器回归算法 253
案例16-2:多层感知器分类算法 256
附录A sklearn常用模块和函数 259
附录B 量化分析常用指标 284