因果推断的可分解性和可传递性问题&耿直 1
1引言 1
2图模型结构学习的可分解条件 2
3直接作用和间接作用 3
3.1基于关联模型的直接作用与间接作用 4
3.2基于因果模型的主分层直接作用 4
3.3控制的和自然的直接作用 6
4因果作用的可传递性问题 7
5讨论 11
参考文献 11
机器学习的几何观点&何晓飞 14
1引言 14
2监督学习、半监督学习与无监督学习 15
3基于几何拓扑的降维算法 17
3.1流形降维 17
3.2几何和拓扑 18
3.3保局投影 20
4主动学习和半监督学习:基于几何的观点 23
5结束语和展望 29
参考文献 30
协同过滤与链接预测的迁移学习问题&李 斌 朱兴全 杨强 33
1引言 33
1.1问题背景 33
1.2相关研究工作综述 35
2基于矩阵分解的潜在特征空间共享 36
2.1组级评分矩阵共享 37
2.2项目潜在特征共享 40
3协同过滤的迁移学习 41
3.1评分矩阵生成模型 41
3.2实验结果 43
4链接预测的迁移学习 45
4.1集体链接预测模型 45
4.2实验结果 47
5结语 49
参考文献 49
LDA的并行化运算及其应用&李友林 51
1引言 51
2 LDA算法介绍 52
3 LDA算法的并行化——PLDA 54
4 LDA算法的进一步并行化——PLDA+ 57
5 AdHeat算法——PLDA在社区推荐中的应用 61
6结束语 65
参考文献 66
关于二类模式分类问题的分解&吕宝粮 赵海 67
1引言 67
2最小最大模块化网络 68
2.1问题分解 69
2.2模块集成 70
3高斯零交叉函数最小最大模块化网络 71
3.1高斯零交叉函数 71
3.2高斯零交叉函数最小最大模块化网络的特点 73
3.3与其他分类器的关系 75
4大规模二类问题的分解策略 76
4.1随机分解 76
4.2超平面分解 77
4.3聚类分解 78
4.4基于先验知识的分解 79
5大规模不平衡专利数据分类 80
5.1实验数据 80
5.2最小最大模块化Liblinear 82
5.3性能评价指标 82
5.4 Section层上A类为正类的二类问题实验 83
5.5 Section层上的全部二类问题实验 84
6结论 85
参考文献 86
面向降维的图构建技术&乔立山 张丽梅 陈松灿 89
1引言 89
2降维与图构建 90
2.1降维技术 90
2.2图及其构建技术 92
3稀疏表示建图与稀疏保持投影 93
3.1稀疏表示建图 94
3.2稀疏保持投影 97
4面向降维的图优化 98
4.1图优化的局部保持投影 99
4.2降维与建图的联合学习框架 101
5结论 103
参考文献 104
统计词对齐&王海峰 刘占一 吴华 108
1引言 108
2机器翻译简介 109
2.1基于规则的机器翻译 109
2.2基于实例的机器翻译 109
2.3统计机器翻译 110
3双语词对齐 110
3.1 IBM模型 111
3.2 EM算法在词对齐中的应用 114
3.3解码算法 115
3.4基于HMM的统计词对齐模型 116
3.5其他机器学习方法 118
3.6双语词对齐评价方法 119
4单语词对齐与搭配抽取 119
4.1搭配简介 119
4.2单语词对齐与双语词对齐的类比 120
4.3基于单语词对齐的搭配抽取 120
4.4实验 123
5利用搭配提高双语词对齐质量 126
5.1搭配概率 127
5.2提高IBM模型 127
5.3提高双向词对齐 128
5.4实验 129
6讨论与总结 133
参考文献 133
概念、相似性与聚类分析&于剑 136
1引言 136
2相似性与概念 137
3相似性计算模型 139
3.1样例相似性计算模型 139
3.2原型理论下的相似性计算公式 142
3.3相似性的融合 143
4结束语 143
参考文献 144
互联网行业对机器学习和其他计算技术的需求&岳亚丁 147
1引言 147
2互联网行业现状 147
2.1互联网企业收入模型 147
2.2数据计算任务 149
2.3典型做法 151
3对计算技术的需求 156
3.1解决方案框架 156
3.2并行化算法 157
3.3其他难题 157
4小结 161
参考文献 161
基于指数族混合模型的在线式演化聚类算法&张见闻 张长水 162
1引言 162
1.1问题背景 162
1.2相关研究工作综述 165
2指数族混合模型 167
3从密度估计的观点看聚类问题 168
4基于指数族混合模型的演化聚类算法 169
4.1历史数据相关的途径 170
4.2历史模型相关的途径 171
5实验 174
6结语 176
参考文献 177
多标记学习&张敏灵 周志华 179
1引言 179
2学习框架 181
2.1问题定义 181
2.2评价指标 182
3学习算法 185
3.1算法分类 185
3.2“问题转换”算法 185
3.3“算法适应”算法 189
4结束语 193
参考文献 195
Ranking on Large-scale Graphs with Rich Metadata&Bin Gao Tie-Yan Liu 200
1 Introduction 200
2 Unsupervised Ranking on Large-scale Graphs with Metadata 201
2.1 General Framework for Unsupervised Graph Ranking 203
2.2 Unsupervised Graph Ranking Algorithms 207
2.3 Further Discussions on the Unsupervised General Framework 211
3 Supervised Ranking on Large-scale Graphs with Metadata 213
3.1 General Framework for Supervised Graph Ranking 214
3.2 Supervised Graph Ranking Algorithms 216
4 Summary 219
References 220
Semi-supervised Learning with Mixed Unlabeled Data&Haiqin Yang Kaizhu Huang Zenglin Xu Irwin King Michael R.Lyu 222
1 Introduction 222
2 Literature Review 224
3 Model 228
3.1 Notation and Problem Definition 228
3.2 Framework 229
3.3 Properties 230
4 Solution and Algorithms 231
4.1 Semi-definite Programming Transformation 232
4.2 Concave Convex Procedure (CCCP) 232
5 Experiment 235
5.1 Setup 235
5.2 Results on Real World Datasets 235
5.3 Efficiency 236
6 Conclusion 237
References 238
Learning with Local Consistency&Chiyuan Zhang Deng Cai 243
1 Motivation 243
2 Problem Formulation 244
2.1 Local Consistency Assumption 244
2.2 Regularization Framework 246
2.3 Graph Representation and Construction 247
3 Algorithms 248
3.1 LapRLS and LapSVM 248
3.2 Graph Regularized Non-negative Matrix Factorization 249
3.3 Locally-consistent Topic Modeling 251
3.4 Gaussian Mixture Model with Local Consistency 253
4 Conclusion 255
References 256