当前位置:首页 > 经济
应急管理在银行业数据中心的策略与实践
应急管理在银行业数据中心的策略与实践

应急管理在银行业数据中心的策略与实践PDF电子书下载

经济

  • 电子书积分:13 积分如何计算积分?
  • 作 者:杨志国主编;张剑,徐雷鸣,胡序忠副主编
  • 出 版 社:北京:人民邮电出版社
  • 出版年份:2018
  • ISBN:9787115483720
  • 页数:379 页
图书介绍:全书共11章,包括银行业数据中心业务连续性及应急管理机制解读、银行业数据中心应急管理概述、银行业数据中心应急管理组织架构、银行业数据中心应急管理策略、范围、银行业数据中心应急管理场所、银行业数据中心应急管理制度、银行业数据中心主动性维护、银行业数据中心应急场景及预案、银行业数据中心应急处置及启动、银行业数据中心应急管理工具建设、应急案例等。
《应急管理在银行业数据中心的策略与实践》目录

第1章 应急管理基础 1

1.1 基础知识 2

1.1.1 工作原则 2

1.1.2 灾难 3

1.1.3 灾难恢复 4

1.1.4 灾难备份 4

1.1.5 灾难备份中心 4

1.1.6 关键业务功能 5

1.1.7 业务影响分析 5

1.1.8 恢复时间目标 5

1.1.9 恢复点目标 6

1.1.10 风险评估 6

1.1.11 应急预案 7

1.1.12 演练 7

1.1.13 桌面演练 7

1.1.14 模拟切换演练 8

1.1.15 真实切换演练 8

1.1.16 其他术语 9

1.2 应急管理与业务连续性管理 9

1.2.1 业务连续性管理的定义 9

1.2.2 应急管理与业务连续性管理的关系 10

1.3 应急管理与风险管理 11

1.3.1 风险的定义 11

1.3.2 信息安全风险的定义 13

1.3.3 风险管理的定义 15

1.3.4 应急管理与风险管理的关系 16

1.4 应急管理和灾难备份与恢复管理 16

1.4.1 灾难恢复的定义 16

1.4.2 灾难恢复7要素 17

1.4.3 应急管理和灾难备份与恢复管理的关系 17

1.5 银行业数据中心应急管理要求 18

1.5.1 国家相关法律法规要求 18

1.5.2 相关政府机构的要求 25

第2章 银行业数据中心应急管理概述 29

2.1 数据中心的定义及分级 30

2.1.1 数据中心的定义 30

2.1.2 数据中心的分级 31

2.2 云计算数据中心功能的演进 32

2.3 银行业数据中心典型组织架构 34

2.3.1 如何建立数据中心的组织架构 34

2.3.2 典型的银行业数据中心组织架构 36

2.4 银行业数据中心的应急管理 38

第3章 银行业数据中心应急管理组织架构 41

3.1 银行业数据中心应急管理组织成立目的 42

3.2 银行业数据中心应急管理组织架构 42

3.2.1 应急领导小组 43

3.2.2 应急执行小组 44

3.2.3 应急保障小组 45

3.2.4 外部支持小组 45

第4章 银行业数据中心应急管理策略、范围、对象及目标 47

4.1 应急管理策略 48

4.1.1 事前预防策略 48

4.1.2 事中响应与处置策略 48

4.1.3 事后改进策略 49

4.1.4 资源与文化保障策略 50

4.2 应急管理范围 50

4.3 应急管理对象 50

4.3.1 软件 51

4.3.2 硬件 51

4.3.3 服务 51

4.3.4 数据 52

4.3.5 人员 52

4.4 应急管理目标 52

第5章 银行业数据中心应急管理场所 55

5.1 应急管理场所 56

5.1.1 生产监控场所 56

5.1.2 应急指挥场所 57

5.1.3 应急处置场所 58

5.1.4 服务受理场所 59

5.1.5 技术分析场所 59

5.1.6 测试演练场所 60

5.2 应急场所的建设方法 61

5.2.1 大屏幕显示系统 61

5.2.2 全球IP电话系统 66

5.2.3 虚拟终端及云桌面 69

第6章 银行业数据中心应急管理制度 71

6.1 应急管理的规范与流程 72

6.1.1 基本原则 72

6.1.2 角色与职责分工 72

6.1.3 7×24小时应急运维机制 72

6.1.4 应急场景(包括但不限于) 74

6.1.5 应急预案 75

6.2 事件管理的规范与流程 77

6.2.1 基本原则 77

6.2.2 角色与职责分工 77

6.2.3 事件分类 78

6.2.4 事件分级 79

6.2.5 事件业务影响的认定 81

6.2.6 事件活动的要求 82

6.2.7 质量控制 83

第7章 银行业数据中心主动性维护 85

7.1 主动性维护基本原则 86

7.1.1 RCM理论 86

7.1.2 预防性维护和预测性维护 89

7.1.3 主动性维护 90

7.1.4 主动性维护与传统维护观念的差异 91

7.1.5 主动性维护在银行业数据中心运营中的价值 92

7.1.6 主动性维护是降低数据中心TCO的新途径 92

7.2 硬件设备及机房环境设施技术实施方案 93

7.2.1 运维内容 93

7.2.2 硬件设备及机房环境设施的主动性维护理念 93

7.2.3 案例 94

7.3 网络系统技术实施方案 99

7.3.1 运维内容 99

7.3.2 网络系统的主动性维护理念 99

7.3.3 案例 100

7.4 主机、开放、windows、X86技术平台实施方案 105

7.4.1 运维内容 105

7.4.2 主动性维护理念 105

7.4.3 案例 106

7.5 应用系统技术实施方案 120

7.5.1 运维内容 120

7.5.2 应用系统的主动性维护理念 120

7.5.3 案例 121

7.6 漏洞扫描与渗透测试 127

7.6.1 运维内容 127

7.6.2 主动性维护理念 128

7.6.3 案例 128

第8章 银行业数据中心应急场景及预案 131

8.1 硬件与环境应急场景和预案 133

8.1.1 应急场景清单 133

8.1.2 场景一:ORACLE VSM虚拟带库应急 135

8.1.3 场景二:SL8500物理带库应急方案 138

8.1.4 场景三:Z13主机硬件故障 140

8.1.5 场景四:IBM P系列小型机异常宕机 144

8.1.6 场景五:HDS存储设备应急方案 149

8.1.7 场景六:NetApp存储设备应急方案 151

8.1.8 场景七:EMC存储设备应急方案 154

8.1.9 场景八:UPS系统应急方案 158

8.1.10 场景九:PDU设备应急方案 160

8.2 网络应急场景和预案 162

8.2.1 应急场景清单 162

8.2.2 场景一:网络设备某一板卡发生故障,该板卡所连接具有冗余链路 166

8.2.3 场景二:网络交换机双引擎中主引擎发生故障,备引擎正常,主备引擎切换失败 168

8.2.4 场景三:外部因素导致生产中心互联网应用系统不可用,需要将流量切换到异地灾备中心 169

8.2.5 场景四:骨干线路丢包 171

8.2.6 场景五:异常流量导致主备防火墙的通信异常 174

8.2.7 场景六:VPN设备通道连接异常 176

8.2.8 场景七:DNS设备的解析服务异常导致DNS服务异常 178

8.3 数据恢复应急场景及预案 180

8.3.1 应急场景清单 181

8.3.2 场景一:数据库热备份恢复切换 184

8.3.3 场景二:数据库冷备份恢复切换 184

8.3.4 场景三:物理磁盘数据应急恢复 187

8.3.5 场景四:物理磁盘外部专业数据恢复应急处理 191

8.4 主机应急场景和预案 192

8.4.1 应急场景清单 192

8.4.2 场景一:主机CICS联机系统交易处理缓慢 194

8.4.3 场景二:主机CICS联机与外围系统通信异常 200

8.4.4 场景三:DB2没有可以使用的ACTIVE LOG,DB2 LOG不能工作 204

8.4.5 场景四:一个BSDS文件无法访问,无法对其进行读/写操作 206

8.4.6 场景五:DB2数据空间将耗尽 208

8.4.7 场景六:磁盘故障触发非计划性Hyperswap 210

8.4.8 场景七:系统DATASET的利用率超过阈值 215

8.5 小型机应急场景和预案 216

8.5.1 应急场景清单 216

8.5.2 场景一:系统重要资源不足 219

8.5.3 场景二:CICS交易繁忙以致出现交易排队现象 226

8.5.4 场景三:MQ通道状态异常 229

8.5.5 场景四:数据库出现大量行锁 231

8.5.6 场景五:SQL(联机或批量)执行时间变长 236

8.5.7 场景六:单台应用服务器出现故障 239

8.5.8 场景七:加速器逻辑通道夯 244

8.5.9 场景八:签名验签业务持续性缓慢 248

8.5.10 场景九:ORACLE ASM磁盘被赋 PVID导致磁盘组损坏 253

8.5.11 场景十:ORACLE数据库SQL语句执行计划突变 259

8.6 X86平台应急场景和预案 263

8.6.1 应急场景清单 263

8.6.2 场景一:云平台计算节点资源不足 265

8.6.3 场景二:ORACLE数据库数据损坏 269

8.6.4 场景三:MySQL Cluster数据库SQL节点hang死 271

8.6.5 场景四:存储故障 272

8.6.6 场景五:单台负载均衡器故障 275

8.6.7 场景六:WAS组件异常 276

8.7 应用与运行应急场景和预案 278

8.7.1 应急场景清单 278

8.7.2 场景一:应用系统按需执行重启 280

8.7.3 场景二:某应用系统的对端系统未正常收到返回报文 282

8.7.4 场景三:因业务量高峰、系统处理能力不足引起的联机交易缓慢 284

8.7.5 场景四:批量执行中断 286

8.7.6 场景五:数据修改异常引发交易异常 288

8.7.7 场景六:应用产品主备机切换应急预案 290

8.7.8 场景七:应用系统MQ队列堆积 292

8.7.9 场景八:应用系统间密钥恢复应急场景 294

8.7.10 场景九:应用产品版本回退应急预案 296

8.8 互联网信息安全事件应急场景及预案 297

8.8.1 应急场景清单 297

8.8.2 场景一:互联网应用系统网络入侵 299

8.8.3 场景二:互联网出口拒绝服务攻击 300

第9章 银行业数据中心应急处置及启动 303

9.1 应急处置策略与原则 304

9.1.1 首查监控 305

9.1.2 关联变更 305

9.1.3 回顾历史 306

9.1.4 以我为因 306

9.1.5 联动后线 307

9.1.6 并行排查 307

9.1.7 信息共享 308

9.1.8 恢复优先 308

9.2 应急处置实施方法论 309

9.2.1 应急发现阶段 311

9.2.2 应急响应阶段 312

9.2.3 应急恢复阶段 312

9.2.4 应急验证阶段 314

9.3 应急管理后评价 314

第10章 银行业数据中心应急管理工具建设 319

10.1 应急预案管理平台 320

10.1.1 主要用途 320

10.1.2 实现功能 320

10.1.3 建设方法 323

10.2 应急协作管理平台 324

10.2.1 主要用途 324

10.2.2 实现功能 325

10.2.3 建设方法 328

10.3 运维流程管理平台 331

10.3.1 主要用途 332

10.3.2 实现功能 333

10.3.3 建设方法 342

10.4 集中监控管理平台 346

10.4.1 主要用途 346

10.4.2 实现功能 347

10.4.3 建设方法 349

第11章 应急案例介绍 353

11.1 在线客服人工服务异常案例 354

11.1.1 系统简介 354

11.1.2 案例简述 354

11.1.3 处置详情 355

11.1.4 处置要素 355

11.1.5 后续改进 356

11.2 信用卡快捷支付退货交易缓慢案例 356

11.2.1 系统简介 356

11.2.2 案例简述 357

11.2.3 处置详情 357

11.2.4 处置要素 357

11.2.5 后续改进 358

11.3 个人理财产品销售异常案例 358

11.3.1 系统简介 358

11.3.2 案例简述 359

11.3.3 处置详情 359

11.3.4 处置要素 359

11.3.5 后续改进 360

11.4 部分借记卡行内转账失败案例 360

11.4.1 系统简介 360

11.4.2 案例简述 361

11.4.3 处置详情 361

11.4.4 处置要素 361

11.4.5 后续改进 362

11.5 小型机内存故障案例 362

11.5.1 系统简介 362

11.5.2 案例简述 363

11.5.3 处置详情 363

11.5.4 处置要素 363

11.5.5 后续改进 364

11.6 存储链路抖动案例 364

11.6.1 系统简介 364

11.6.2 案例简述 365

11.6.3 处置详情 365

11.6.4 处置要素 365

11.6.5 后续改进 366

11.7 某互联网应用系统漏洞被利用进行网络入侵攻击 366

11.7.1 系统简介 366

11.7.2 案例简述 367

11.7.3 处置详情 367

11.7.4 处置要素 367

11.7.5 后续改进 368

11.8 某地互联网出口Web服务器遭受DDoS攻击案例 368

11.8.1 系统简介 368

11.8.2 案例简述 369

11.8.3 处置详情 369

11.8.4 处置要素 370

11.8.5 后续改进 370

11.9 某系统交易缓慢案例 370

11.9.1 系统简介 370

11.9.2 案例简述 371

11.9.3 分析过程详述 371

11.9.4 处置详情 373

11.9.5 处置要素 374

11.9.6 后续改进 374

11.10 某系统投产新版本后批量执行缓慢案例 375

11.10.1 系统简介 375

11.10.2 案例简述 375

11.10.3 分析过程详述 376

11.10.4 处置详情 377

11.10.5 处置要素 377

11.10.6 后续改进 378

参考资料 379

返回顶部