当前位置:首页 > 工业技术
计算机科学丛书  计算机视觉  模型、学习和推理
计算机科学丛书  计算机视觉  模型、学习和推理

计算机科学丛书 计算机视觉 模型、学习和推理PDF电子书下载

工业技术

  • 电子书积分:14 积分如何计算积分?
  • 作 者:(英)西蒙J.D.普林斯著;苗启广,刘凯,孔韦韦等译
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2017
  • ISBN:9787111516828
  • 页数:444 页
图书介绍:本书是一本从机器学习视角讲解计算机视觉的优秀教材。本书图文并茂,算法描述由浅入深,主要讲述计算机视觉中三个方面的内容:模型、学习和推理,揭示计算机视觉研究中 “模型”和“算法”之间的区别,并且对每一种新的视觉算法提出新的见解。本书主要包括概率、机器视觉的机器学习、局部模型的连接、图像预处理、几何模型、视觉模型等方面的内容。本书适合作为计算机视觉和机器学习的高年级本科生或研究生的教材,也适合计算机视觉方面的专业人士作为参考书籍。
《计算机科学丛书 计算机视觉 模型、学习和推理》目录

第1章 绪论 1

1.1本书结构 2

1.2其他书籍 4

第一部分 概率 6

第2章 概率概述 6

2.1随机变量 6

2.2联合概率 7

2.3边缘化 7

2.4条件概率 8

2.5贝叶斯公式 9

2.6独立性 9

2.7期望 10

讨论 10

备注 11

习题 11

第3章 常用概率分布 12

3.1伯努利分布 13

3.2贝塔分布 13

3.3分类分布 14

3.4狄利克雷分布 14

3.5一元正态分布 15

3.6正态逆伽马分布 15

3.7多元正态分布 16

3.8正态逆维希特分布 16

3.9共轭性 17

总结 18

备注 18

习题 18

第4章 拟合概率模型 21

4.1最大似然法 21

4.2最大后验法 21

4.3贝叶斯方法 22

4.4算例1:一元正态分布 22

4.4.1最大似然估计 22

4.4.2最大后验估计 24

4.4.3贝叶斯方法 26

4.5算例2:分类分布 28

4.5.1最大似然法 28

4.5.2最大后验法 29

4.5.3贝叶斯方法 30

总结 31

备注 31

习题 32

第5章 正态分布 34

5.1协方差矩阵的形式 34

5.2协方差分解 35

5.3变量的线性变换 36

5.4边缘分布 36

5.5条件分布 37

5.6正态分布的乘积 38

5.7变量改变 38

总结 38

备注 39

习题 39

第二部分 机器视觉的机器学习 42

第6章 视觉学习和推理 42

6.1计算机视觉问题 42

6.2模型的种类 42

6.2.1判别模型 43

6.2.2生成模型 43

6.3示例1:回归 43

6.3.1判别模型 44

6.3.2生成模型 44

6.4示例2:二值分类 46

6.4.1判别模型 46

6.4.2生成模型 46

6.5应该用哪种模型 48

6.6应用 49

6.6.1皮肤检测 49

6.6.2背景差分 50

总结 51

备注 51

习题 52

第7章 复杂数据密度建模 54

7.1正态分类模型 54

7.2隐变量 56

7.3期望最大化 57

7.4混合高斯模型 58

7.4.1混合高斯边缘化 59

7.4.2基于期望最大化的混合模型拟合 59

7.5 t分布 63

7.5.1学生t分布边缘化 64

7.5.2拟合t分布的期望最大化 65

7.6因子分析 67

7.6.1因子分析的边缘分布 68

7.6.2因子分析学习的期望最大化 68

7.7组合模型 71

7.8期望最大化算法的细节 71

7.8.1期望最大化算法的下界 73

7.8.2 E步 74

7.8.3 M步 74

7.9应用 75

7.9.1人脸检测 75

7.9.2目标识别 76

7.9.3分割 77

7.9.4正脸识别 78

7.9.5改变人脸姿态(回归) 78

7.9.6作为隐变量的变换 79

总结 80

备注 80

习题 81

第8章 回归模型 82

8.1线性回归 82

8.1.1学习 83

8.1.2线性回归模型的问题 83

8.2贝叶斯线性回归 84

8.2.1实际考虑 85

8.2.2拟合方差 86

8.3非线性回归 87

8.3.1最大似然法 87

8.3.2贝叶斯非线性回归 89

8.4核与核技巧 89

8.5高斯过程回归 90

8.6稀疏线性回归 91

8.7二元线性回归 93

8.8相关向量回归 95

8.9多变量数据回归 96

8.10应用 96

8.10.1人体姿势估计 96

8.10.2位移专家 97

讨论 98

备注 98

习题 98

第9章 分类模型 100

9.1逻辑回归 100

9.1.1学习:最大似然估计 102

9.1.2逻辑回归模型的问题 103

9.2贝叶斯逻辑回归 104

9.2.1学习 104

9.2.2推理 106

9.3非线性逻辑回归 107

9.4对偶逻辑回归模型 108

9.5核逻辑回归 110

9.6相关向量分类 111

9.7增量拟合和boosting 113

9.8分类树 116

9.9多分类逻辑回归 117

9.10随机树、随机森林和随机蕨分类器 118

9.11与非概率模型的联系 119

9.12应用 120

9.12.1性别分类 120

9.12.2脸部和行人检测 121

9.12.3语义分割 122

9.12.4恢复表面布局 123

9.12.5人体部位识别 124

讨论 125

备注 125

习题 127

第三部分 连接局部模型 130

第10章 图模型 130

10.1条件独立性 130

10.2有向图模型 131

10.2.1示例1 132

10.2.2示例2 132

10.2.3示例3 133

10.2.4总结 134

10.3无向图模型 134

10.3.1示例1 135

10.3.2示例2 136

10.4有向图模型与无向图模型的对比 136

10.5计算机视觉中的图模型 137

10.6含有多个未知量的模型推理 139

10.6.1求最大后验概率的解 139

10.6.2求后验概率分布的边缘分布 139

10.6.3最大化边缘 140

10.6.4后验分布的采样 140

10.7样本采样 140

10.7.1有向图模型的采样 141

10.7.2无向图模型的采样 141

10.8学习 142

10.8.1有向图模型的学习 142

10.8.2无向图模型的学习 143

讨论 145

备注 145

习题 145

第11章 链式模型和树模型 147

11.1链式模型 148

11.1.1有向链式模型 148

11.1.2无向链式模型 148

11.1.3模型的等价性 148

11.1.4隐马尔可夫模型在手语中的应用 149

11.2链式MAP推理 149

11.3树的MAP推理 152

11.4链式边缘后验推理 155

11.4.1求解边缘分布 155

11.4.2前向后向算法 156

11.4.3置信传播 157

11.4.4链式模型的和积算法 158

11.5树的边缘后验推理 160

11.6链式模型和树模型的学习 161

11.7链式模型和树模型之外的东西 161

11.8应用 163

11.8.1手势跟踪 163

11.8.2立体视觉 164

11.8.3形象化结构 166

11.8.4分割 167

讨论 167

备注 168

习题 169

第12章 网格模型 172

12.1马尔可夫随机场 172

12.1.1网格示例 173

12.1.2离散成对MRF图像去噪 174

12.2二值成对马尔可夫随机场的MAP推理 175

12.2.1最大流/最小割 176

12.2.2 MAP推理:二值变量 177

12.3多标签成对MRF的MAP推理 182

12.4非凸势的多标签MRF 186

12.5条件随机场 189

12.6高阶模型 190

12.7网格有向模型 190

12.8应用 191

12.8.1背景差分 191

12.8.2交互式分割 192

12.8.3立体视觉 193

12.8.4图像重排 193

12.8.5超分辨率 195

12.8.6纹理合成 196

12.8.7合成新面孔 197

讨论 198

备注 198

习题 200

第四部分 预处理 204

第13章 图像预处理与特征提取 204

13.1逐像素变换 204

13.1.1白化 204

13.1.2直方图均衡化 205

13.1.3线性滤波 206

13.1.4局部二值模式 210

13.1.5纹理基元映射 211

13.2边缘、角点和兴趣点 212

13.2.1 Canny边缘检测器 212

13.2.2 Harris角点检测器 214

13.2.3 SIFT检测器 215

13.3描述子 216

13.3.1直方图 216

13.3.2 SIFT描述子 216

13.3.3方向梯度直方图 217

13.3.4词袋描述子 218

13.3.5形状内容描述子 218

13.4降维 219

13.4.1单数值近似 220

13.4.2主成分分析 221

13.4.3二元主成分分析 221

13.4.4 K均值算法 222

结论 223

备注 223

习题 224

第五部分 几何模型 228

第14章 针孔摄像机 228

14.1针孔摄像机简介 228

14.1.1归一化摄像机 229

14.1.2焦距参数 230

14.1.3偏移量和偏移参数 230

14.1.4摄像机的位置与方向 231

14.1.5全针孔摄像机模型 232

14.1.6径向畸变 232

14.2三个几何问题 233

14.2.1问题1:学习外在参数 233

14.2.2问题2:学习内在参数 234

14.2.3问题3:推理3D世界点 235

14.2.4解决问题 235

14.3齐次坐标 236

14.4学习外在参数 237

14.5学习内在参数 239

14.6推理3D世界点 240

14.7应用 241

14.7.1结构光的深度 241

14.7.2剪影重构 243

讨论 245

备注 245

习题 246

第15章 变换模型 249

15.1二维变换模型 249

15.1.1欧氏变换模型 249

15.1.2相似变换模型 251

15.1.3仿射变换模型 252

15.1.4投影变换模型 252

15.1.5增加不确定性 254

15.2变换模型中的学习 255

15.2.1学习欧氏参数 255

15.2.2学习相似参数 256

15.2.3学习仿射参数 256

15.2.4学习投影参数 257

15.3变换模型中的推理 258

15.4平面的三个几何问题 258

15.4.1问题1:学习外在参数 258

15.4.2问题2:学习内在参数 260

15.4.3问题3:与摄像机相关的3D位置推理 261

15.5图像间的变换 261

15.5.1单应性的几何特征 262

15.5.2计算图像间的变换 263

15.6变换的鲁棒学习 264

15.6.1 RANSAC 264

15.6.2连续RANSAC 265

15.6.3 PEaRL 266

15.7应用 268

15.7.1增强现实追踪 268

15.7.2视觉全景 269

讨论 270

备注 270

习题 271

第16章 多摄像机系统 273

16.1双视图几何学理论 273

16.1.1极线约束 274

16.1.2极点 274

16.2实矩阵 275

16.2.1实矩阵的属性 276

16.2.2实矩阵的分解 277

16.3基础矩阵 279

16.3.1基础矩阵的估计 279

16.3.2 8点算法 280

16.4双视图重构的流程 281

16.5校正 284

16.5.1平面校正 284

16.5.2极面校正 286

16.5.3校正后处理 287

16.6多视图重构 287

16.7应用 290

16.7.1三维重构 290

16.7.2图片浏览 291

16.7.3立体图割 292

讨论 293

备注 293

习题 294

第六部分 视觉模型 298

第17章 形状模型 298

17.1形状及其表示 298

17.2 snake模型 299

17.2.1推理 301

17.2.2 snake模型中存在的问题 301

17.3形状模板 302

17.3.1推理 303

17.3.2用迭代最近点算法进行推理 304

17.4统计形状模型 304

17.4.1学习 305

17.4.2推理 306

17.5子空间形状模型 306

17.5.1概率主成分分析 307

17.5.2学习 308

17.5.3推理 309

17.6三维形状模型 311

17.7形状和外观的统计模型 311

17.7.1学习 313

17.7.2推理 314

17.8非高斯统计形状模型 315

17.8.1回归PPCA 315

17.8.2高斯过程隐变量模型 316

17.9铰接式模型 317

17.10应用 319

17.10.1三维形变模型 319

17.10.2三维人体模型 321

讨论 322

备注 322

习题 324

第18章 身份与方式模型 326

18.1子空间身份模型 328

18.1.1学习 329

18.1.2推理 331

18.1.3在其他识别任务中的推理 332

18.1.4身份子空间模型的局限性 333

18.2概率线性判别分析 334

18.2.1学习 335

18.2.2推理 335

18.3非线性身份模型 336

18.4非对称双线性模型 337

18.4.1学习 339

18.4.2推理 339

18.5对称双线性和多线性模型 341

18.5.1学习 342

18.5.2推理 343

18.5.3多线性模型 344

18.6应用 344

18.6.1人脸识别 344

18.6.2纹理建模 345

18.6.3动画合成 346

讨论 346

备注 346

习题 348

第19章 时序模型 349

19.1时序估计框架 349

19.1.1推理 350

19.1.2学习 350

19.2卡尔曼滤波器 351

19.2.1推理 351

19.2.2改写测量合并阶段 352

19.2.3推理总结 353

19.2.4示例1 353

19.2.5示例2 354

19.2.6滤波 355

19.2.7时序和测量模型 356

19.2.8卡尔曼滤波器的问题 358

19.3扩展卡尔曼滤波器 358

19.4无损卡尔曼滤波器 360

19.4.1状态演化 361

19.4.2测量合并过程 362

19.5粒子滤波 363

19.5.1时间演化 364

19.5.2测量合并 364

19.5.3扩展 366

19.6应用 366

19.6.1行人跟踪 366

19.6.2单目的即时定位与地图构建 366

19.6.3在复杂背景中跟踪轮廓线 367

讨论 369

备注 369

习题 370

第20章 视觉词模型 372

20.1视觉词集合的图像 372

20.2词袋 373

20.2.1学习 374

20.2.2推理 374

20.2.3词袋模型的相关问题 375

20.3隐狄利克雷分布 376

20.3.1学习 377

20.3.2非监督物体检测 379

20.4单一创作-主题模型 380

20.4.1学习 381

20.4.2推理 382

20.5星座模型 382

20.5.1学习 383

20.5.2推理 385

20.6场景模型 385

20.7应用 386

20.7.1视频搜索 386

20.7.2行为识别 387

讨论 388

备注 389

习题 389

第七部分 附录 392

附录A符号说明 392

附录B 最优化 394

附录C线性代数 402

参考文献 413

返回顶部