《视听媒体感知与识别》PDF下载

  • 购买积分:9 如何计算积分?
  • 作  者:明悦著
  • 出 版 社:北京:北京邮电大学出版社
  • 出版年份:2015
  • ISBN:9787563544158
  • 页数:153 页
图书介绍:本书主要介绍视听媒体感知技术的相关理论和应用。从智能信息感知技术角度向学生介绍感知机理和智能计算的基本理论,通过典型的案例分析从应用的角度介绍对图像、视频、音频等媒体数据的处理方法和实现技术,使学生能在宏观上把握数字媒体研究的技术构成,及其在视觉计算和可视化研究中的应用策略。通过本书的介绍使学生了解视听媒体感知技术的基本概念、基本理论和基本分析方法,理解视听媒体感知系统的构成原理,了解视听媒体感知系统的硬件设备、相关技术、应用状况等,重点突出理论研究与实际应用的结合。计算能力和初步的理论联系实际的能力。

第1章 绪论 1

1.1 概述 1

1.2 人类视觉感知系统 2

1.2.1 人类视觉感知系统的生理结构 2

1.2.2 视觉感知 4

1.3 人类听觉感知系统 5

1.3.1 语音听觉器官的生理结构 6

1.3.2 听觉感知 7

1.4 视听感知系统框架和基本组成 8

1.5 本章小结 9

参考文献 9

第2章 视觉感知与识别——人脸识别 11

2.1 三维人脸识别问题 11

2.2 三维人脸图像预处理 12

2.2.1 三维人脸区域提取 12

2.2.2 三维人脸模型姿态匹配对齐 15

2.2.3 三维人脸主要器官区域分割 17

2.2.4 实验及结果分析 19

2.3 三维人脸表面特征描述子 23

2.3.1 基于弯曲不变量的三维人脸表面描述子 24

2.3.2 基于边界球描述子的三维人脸表征方法 24

2.3.3 基于三维尺度不变特征变换的表征方法 26

2.3.4 实验及结果分析 27

2.4 基于区域稀疏回归模型的三维人脸特征提取算法 33

2.4.1 问题的提出 33

2.4.2 基于区域稀疏回归模型的特征提取 36

2.4.3 实验及结果分析 37

2.5 本章小结 41

参考文献 41

第3章 视觉感知与识别——运动目标分析 51

3.1 运动目标分析问题 51

3.2 融合深度信息的运动目标检测 52

3.2.1 行为视频预处理 52

3.2.2 背景差分和帧间差分相结合的人体检测方法 53

3.2.3 基于边缘变化率的手部检测 56

3.3 基于跟踪学习检测的运动人体跟踪 60

3.3.1 跟踪学习检测算法原理 61

3.3.2 改进的融合深度信息的跟踪学习检测算法 65

3.3.3 实验及结果分析 67

3.4 融合深度信息的运动目标特征描述 68

3.4.1 三维移动尺度不变特征描述 69

3.4.2 快速移动尺度不变性特征 72

3.4.3 融合时空纹理特征的特征描述方法 78

3.5 本章小结 84

参考文献 84

第4章 听觉感知与识别——语音识别及评测 98

4.1 听觉感知数据预处理 98

4.2 听觉感知的特征表示 100

4.2.1 线性预测倒谱参数 101

4.2.2 美尔频率倒谱系数 102

4.2.3 基频提取 103

4.3 听觉感知的模型学习 104

4.3.1 隐马尔可夫模型 104

4.3.2 基于改进的BP人工神经网络的声调感知识别模型 106

4.4 实时语音识别和发音评测 109

4.4.1 基于韵律建模的汉语语音识别 109

4.4.2 汉语发音检测 110

4.4.3 基于声学和韵律参数的汉语发音评测 111

4.5 本章小结 113

参考文献 114

第5章 视听感知识别技术的应用实例 123

5.1 基于语音识别与评测的远程交互学习系统 123

5.1.1 系统概述 123

5.1.2 虚拟三维游戏设计 126

5.2 人体行为分析系统平台的设计与实现 130

5.2.1 人体行为分析系统平台的实现 130

5.2.2 人体行为识别系统的个性化控制应用场景 133

5.2.3 行为分析系统GPU处理的实现 136

5.3 基于视觉感知的盲区路况提示系统 137

5.3.1 系统总体架构 138

5.3.2 系统各模块功能设计 139

5.3.3 系统设计规划 140

5.3.4 功能实现成果展示 143

5.4 基于听觉感知的哼唱音乐检索系统 149

5.5 本章小结 152

参考文献 153