当前位置:首页 > 工业技术
点击流数据仓库
点击流数据仓库

点击流数据仓库PDF电子书下载

工业技术

  • 电子书积分:13 积分如何计算积分?
  • 作 者:(美)Mark Sweiger等著;陆昌辉等译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2004
  • ISBN:7505393200
  • 页数:395 页
图书介绍:本书主要面向学习或在工作中运用点击流数据仓库技术的教师、学生或工程技术人员,特别适合对数据仓库技术有所了解,但希望进一步提高构建点击流数据仓库能力的应用开发人员。
《点击流数据仓库》目录

第一篇 点击流数据仓库的构建基础 3

第1章 典型电子商务体系结构 3

1.1 电子商务体系结构简述 3

目录 3

1.2 Internet服务提供商——ISP 5

1.3 多种Internet连接服务 6

1.4 多种物理Web服务器 7

1.5 不同类型的备份Web服务器 7

1.7 点击流数据仓库 9

1.6 集群商业交易系统 9

1.8 规范的电子商务体系结构 12

1.9 小结 12

第2章 Web应用环境 14

2.1 状态无关的HTTP事务模型 14

2.2 HTTP事务间的信息交互 16

2.3 查询字符串 18

2.4 Cookies,用户标识以及Web服务器日志记录 18

2.5 站点点击、页面访问和用户会话 19

2.6 使用CGI调用其他可执行程序 20

2.7 使用脚本语言记录用户行为 22

2.8 网页服务器、应用服务器及动态生成Web页 24

2.9 动态生成Web页和搜索引擎 26

2.10 小结 27

第3章 点击流数据源和Web服务器日志文件 28

3.1 Web服务器日志 28

3.1.1 标准日志文件格式 29

3.1.2 扩展Web服务器的日志………………………………(54 )3.1.3 Cookies 60

3.2 内部数据源 65

3.2.1 Web站点和日志文件分析工具 65

3.2.2 其他的Web服务器相关系统 71

3.2.3 商务应用 76

3.2.4 客户联系系统 77

3.3 外部数据源 79

3.3.1 内容缓存服务 79

3.3.2 合作伙伴 79

3.3.3 在线广告数据 80

3.3.4 代理商的关于用户或商业的数据 82

3.4 小结 83

第4章 用Cookies和其他机制跟踪用户身份 84

4.1 维持应用状态的Web编程技术 84

4.1.1 Cookies 85

4.1.2 查询字符串和URL重写 90

4.1.3 隐藏表单域 91

4.2 管理会话并跟踪用户 92

4.2.1 用Cookies跟踪会话 92

4.2.3 用隐藏域来跟踪会话 97

4.2.2 用URL重写来跟踪会话 97

4.2.4 会话管理的设计技术 98

4.2.5 跟踪用户 100

4.3 用户的身份验证和用户概要信息 108

4.3.1 在线用户分类 108

4.3.2 用户身份验证 111

4.3.3 处理用户身份的数据 117

4.3.4 建立用户概要信息 121

4.4 网站的个性化和用户概要信息 128

4.4.2 个性化的类型 129

4.4.1 基本的个性化方法 129

4.4.3 数据仓库和Web站点概要信息之间的链接 135

4.5 隐私权政策对点击流数据仓库的影响 135

4.6 小结 142

第二篇 逐步建立点击流数据仓库 145

第5章 点击流数据仓库的计划、管理及其人员配置 145

5.1 点击流数据仓库项目流程简介 145

5.2.1 第1阶段:项目定义和计划 147

5.2 项目管理 147

5.2.2 第2阶段:商业需求分析 153

5.2.3 第3阶段:数据仓库设计 161

5.2.4 第4阶段:数据仓库的实现 170

5.2.5 第5阶段:部署阶段 179

5.3 项目人员配置和组织 186

5.3.1 项目角色 187

5.3.2 项目组织 190

5.3.3 项目人员 195

5.4 小结 201

第6章 点击流数据仓库的元模式 202

6.1 由销售分析基准发展到元模型 204

6.1.1 CRM客户维 204

6.1.2 用户行为/站点点击事实表 205

6.1.3 用户维 206

6.1.4 财政时间维和用户时间维 206

6.1.5 物理、Web和站点地理维 208

6.1.6 内容和活动维 209

6.1.8 用户活动/站点点击元模式 210

6.1.7 内部促销维和外部促销维 210

6.2 元模式属性 211

6.2.1 财政时间维属性 212

6.2.2 用户时间维属性 213

6.2.3 物理地理维属性 215

6.2.4 Web地理维属性 216

6.2.5 站点地理维属性 218

6.2.6 用户维属性 219

6.2.7 内容维属性 221

6.2.8 活动维属性 222

6.2.9 内部促销维属性 222

6.2.10 外部促销维属性 223

6.2.11 用户活动/站点事实表属性 224

6.3 页面活动和会话活动聚合 228

6.3.1 页面维 229

6.3.2 会话维 231

6.3.3 会话聚合 232

6.4 元模式的B2B应用 234

6.5 对现有面向商务模式加入点击流特征 237

6.6 用多个冗余Web服务器来支持大型的站点 240

6.7 小结 241

第7章 实现合适的点击流数据仓库的技术基础 243

7.1 点击流数据仓库的数据库支持 243

7.1.1 RDBMS的批装载器 245

7.1.2 分区 247

7.1.3 索引 252

7.1.4 特殊的联接(joins) 261

7.1.5 聚合的创建、认识和管理 270

7.1.6 并行性 282

7.1.7 对SQL的有用分析扩展 290

7.2 磁盘驱动和卷管理 294

7.2.1 逻辑卷管理 295

7.2.2 数据库对象 303

7.2.3 对数据库对象磁盘布局的建议 307

7.3 选择合适的基础结构供应商 309

7.3.1 数据库软件 310

7.4 小结 312

7.3.2 逻辑卷管理软件(LVM)和磁盘子系统 312

第8章 建立点击流的抽取、转换和装载机制 313

8.1 抽取、转换和装载的体系结构 313

8.2 点击流ETL体系结构 317

8.2.1 更加复杂的点击流环境 317

8.2.2 点击流ETL体系结构 319

8.3 建立ETL子系统 320

8.3.1 第1步:数据分析 320

8.3.2 第2步:使Web站点适合点击流 321

8.3.3 第3步:创建高层ETL设计和体系结构 327

8.3.4 第4步:设计特定点击流的组件 338

8.3.5 第5步:设计和建立ETL组件维表 354

8.3.6 第6步:设计和建立事实表ETL组件 369

8.3.7 第7步:建立数据装载机制和整合ETL程序 376

8.3.8 第8步:为数据管理建立支持 377

8.4 小结 379

9.1 OLAP工具 380

第9章 点击流数据仓库中的数据分析 380

9.1.1 MOLAP概述 381

9.1.2 ROLAP概述 383

9.1.3 HOLAP概述 384

9.1.4 今天的OLAP 385

9.2 分析特点和技术 386

9.2.1 查询工具相关特点和技术 386

9.2.2 数据模型相关的特点和技术 389

9.2.3 数据库引擎相关特性和技术 393

9.3 小结 395

相关图书
作者其它书籍
返回顶部