Web数据仓库构建指南

Web数据仓库构建指南
作 者: Ralph Kimball Richard Merz 张丽萍 张丽萍
出版社: 清华大学出版社
丛编项:
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 数据库存储与管理
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  Ralph Kimball博士:自1982年以来一直都是数据仓库行业的头号空想家,现在则是最知名的演讲家,顾问和教师。他为lntelligent Enterprise 杂志撰写Webhouse Architect 专栏,是最畅销图书The Data Warehouse Toolkit和The Data Warehouse Lifecycle Toolkit(均由Wiley出版)的作者。

内容简介

在这本极富创造性的指南中,数据仓库领域最畅销的作用Ralph Kimball向读者介绍了Web数据仓库——Web数据仓库和Web之间的姻缘。如果设计和部署都很完美,Web仓库将会成为当代以客户为中心的公司的关键,向经理和战略决策者提供对他们而言至关重要的竞争信息。在本书中,Kimball博士阐述了Web仓库的关键元素,为设计、构建和管理Web仓库提供了详细的指导说明。仔细品读本书,将可以帮助您的企业更好地保持健康且极具竞争力的发展态势。 在此书中,您将要学习如下方法: 跟踪网站的用户操作 判断客户是否会转向竞争对手 判断特定的Web广告是否正常运行 捕获有关客户行为的数据 设计支持Web仓库的网站 构建点击流市场 管理和缩放Web数据仓库

图书目录

引言

第1部分 将Web引入数据仓库

第1章 为什么要把Web引入数据仓库

1. 1 为什么说点击流不只是另一种数据资源

1. 2 行为分析

1. 3 隐私保障

1. 4 Web数据仓库的结构

1. 4. 1 用户和ISP

1. 4. 2 公共Web服务器和商业事务

1. 4. 3 热响应缓存

1. 4. 4 Web数据仓库系统

1. 5 小结

第2章 跟踪网站用户的操作

2. 1 用户操作的主要类别

2. 2 购买产品的步骤

2. 2. 1 察觉需要

2. 2. 2 试着找到所需商品

2. 2. 3 搜索关于可替换产品的信息

2. 2. 4 选择

2. 2. 5 相关商品销售和升级商品销售

2. 2. 6 结账

2. 2. 7 订单之后的处理过程

2. 3 购买软件或内容的步骤

2. 4 跟踪的要素

2. 4. 1 用户来源

2. 4. 2 会话识别

2. 4. 3 用户识别

2. 5 行为分析

2. 5. 1 人口点

2. 5. 2 驻留时间

2. 5. 3 查询

2. 5. 4 站点导航

2. 5. 5 出口点

2. 6 关联各种操作

2. 7 个性化的要求

2. 7. 1 重访识别

2. 7. 2 用户界面和内容的个性化

2. 7. 3 相关销售和刺激性销售

2. 7. 4 有效协作过滤

2. 7. 5 工程表和有关生活方式的事件

2. 7. 6 本地化

2. 8 小结

第3章 利用点击流来进行决策

3. 1 关于辨认客户的决策

3. 1. 1 通过识别客户来定制营销活动

3. 1. 2 通过对客户进行集群分析来锁定营销活动的目标

3. 1. 3 决定是否鼓励或者支持引荐相关链接

3. 1. 4 判定客户是否将要离开

3. 2 关于通信的决策

3. 2. 1 判定一个特定的Web广告是否有效

3. 2. 2 判定客户问候是否有效

3. 2. 3 判定促销是否有利可图

3. 2. 4 对客户的生活变化做出响应

3. 2. 5 提高网站的有效性

3. 2. 6 培育社区感觉

3. 3 关于网络业务的基本决策

3. 3. 1 决定通过网络提供哪些产品和服务

3. 3. 2 提供对操作的实时状态跟踪

3. 3. 3 判断我们的Web业务是否有利可图

3. 4 小结

第4章 把点击流理解为数据源

4. 1 Web客户端/服务器互动--概要指南

4. 1. 1 基本的客户端/服务器互动

4. 1. 2 广告

4. 1. 3 引用站点

4. 1. 4 特征文件

4. 1. 5 复合站点

4. 2 代理服务器和浏览器缓冲

4. 3

Web服务器日志

4. 3. 1 主机

4. 3. 2 识别

4. 3. 3 审核

4. 3. 4 时间

4. 3. 5 请求

4. 3. 6 状态

4. 3. 7 字节数

4. 3. 8 访问者

4. 3. 9 用户代理

4. 3. 10 文件名

4. 3. 11 服务时间

4. 3. 12 IP地址

4. 3. 13 服务器端口

4. 3. 14 进程ID

4. 3. 15 URL

4. 4 Cookie

4. 4. 1 Cookie内容

4. 4. 2 Cookie手册--检查自己的cookie文件

4. 5 统一系统标识符

4. 6 查询字符串

4. 7 小结

第5章 支持数据仓库的网站设计

5. 1 单块集成电路与分布式Web服务器的比较

5. 2 使你的服务器同步

5. 3 页面内容标签

5. 3. 1 用于静态HTML的内容索引

5. 3. 2 用于动态HTML的内容索引

5. 3. 3 一个简单的内容索引应用程序

5. 4 一致的Cookie

5. 5 空日志记录服务器

5. 6 个人数据仓库

5. 7 建立信任

5. 8 小结

第6章 创建点击流数据集市

6. 1 多维建模快速浏览

6. 2 点击流维

6. 2. 1 日历日期维

6. 2. 2 一日时间维

6. 2. 3 客户维

6. 2. 4 页面维

6. 2. 5 事件维

6. 2. 6 会话维

6. 2. 7 引荐维

6. 2. 8 产品 或服务 维

6. 2. 9 因果关系维

6. 2. 10 商业实体维

6. 2. 11 点击流追踪关键字

6. 3 点击流数据集市

6. 3. 1 用于分析完整会话的点击流事实表

6. 3. 2 用于分析个体页面使用情况的点击流事实表

6. 3. 3 聚集点击流事实表

6. 4 小结

第7章 装配点击流价值链

7. 1 销售交易数据集市

7, 2 客户通信数据集市

7. 3 网络收益率数据集市

7. 4 针对网络零售商的供应链

7. 5 保险业中的保险单和索赔链

7. 6 销售流水线链

7. 7 卫生保健价值环

7. 8 小结

第8章 实现点击流后处理机

8. 1 后处理机体系结构

8. 1. 1 页面事件提取器

8. 1. 2 内容解析器

8. 1. 3 会话识别器

8. 1. 4 计算驻留时间

8. 1. 5 主机和引用站点解析器

8. 2 小结

第2部分 把数据仓库引入Web

第9章 为什么要把数据仓库引入Web

9. 1 Web拉动数据仓库

9. 2 Web推动数据仓库

9. 2. 1 紧化用户界面反馈回路

9. 2. 2 查询与更新的整合

9. 2. 3 速度是不可商量的

9. 2. 4 Sun从不设置Web数据仓库

9. 2. 5 多媒体合并到通信中

9. 2. 6 Web是大规模定制的

9. 2. 7 网络仓库是深度分布式的

9. 2. 8 我们必须面对安全及其隐私问题

9. 3 小结

第10章 设计用户体验

10. 1 两次革命之间的差异

10. 2 第二代用户界面指导方针

10. 2. 1 确保准瞬态性能

10. 2. 2 满足用户要求

10. 2. 3 让每个页面都成为愉快的体验

10. 2. 4 简单化过程

10. 2. 5 安定用户

10. 2. 6 提供分解问题的手段

10. 2. 7 建立信任

10. 2. 8 提供通信钩子 Communication Hook

10. 2. 9 支持国际化透明

10. 3 小结

第11章 通过网库驱动的数据挖掘

11. 1 数据挖掘的起源

11. 2 数据挖掘的行为

11. 3 数据挖掘的准备工作

11. 3. 1 一般的网库数据转换

11. 3. 2 适用于所有形式的数据挖掘的数据转换

11. 3. 3 依赖于数据挖掘工具的特定的数据转换

11. 4 将数据提交给数据挖掘工具

11. 5 OLAP. 数据挖掘和网库

11. 6 小结

第12章 创建国际Web数据仓库

12. 1 发展中的国际Web

12. 1. 1 UNICODE

12. 1. 2 并行的超文本和机器翻译

12. 1. 3 多语言搜索

12. 1. 4 时区转换服务

12. 1. 5 节日查找服务

12. 2 国际网库技术

12. 2. 1 在多个时区和时间格式之间实现同步

12. 2. 2 支持多国日历和日期格式

12. 2. 3 集中多种货币形式的收入

12. 2. 4 处理国际名称和地址

12. 2. 5 支持不同的数字格式

12. 2. 6 支持国际电话号码

12. 2. 7 处理跨国查询. 报表和对照序列

12. 2. 8 本地化在Web数据仓库中的应用

12. 3 小结

第13章 Web数据仓库安全

13. 1 推荐的安全技术

13. 1. 1 提供双因素认证

13. 1. 2 保护连接

13. 1. 3 将通过认证的用户与角色联系在一起

13. 1. 4 通过角色访问所有的网库对象

13. 2 管理安全过程, 而不是解决方案

13. 3 小结

第14章 网库的缩放

14. 1 网库不是Web服务器

14. 2 点击流活动突变

14. 2. 1 上网人数增长

14. 2. 2 越来越多的点击率

14. 2. 3 用户级自动搜索

14. 2. 4 更深的经济渗透

14. 2. 5 一夜成名

14. 2. 6 IP成为一种通用传输协议

14. 2. 7 XML--通用传输

14. 3 对数据仓库服务需求的剧变

14. 4 软硬件的严重瓶颈

14. 4. 1 避免单一瓶颈

14. 4. 2 避免进程重复

14. 4. 3 物理上的考虑:托管

14. 4. 4 操作系统

14. 4. 5 编程语言

14. 4. 6 数据库

14. 4. 7 查询和报告软件

14. 4. 8 平衡电子邮件和链接的使用

14. 4. 9 硬件特性

14. 5 粒度权衡

14. 6 小结

第15章 管理网库项目

15. 1 定义项目

15. 2 确定角色

15. 2. 1 全体决策人员:主管与监督人

15. 2. 2 教练:项目经理和领导

15. 2. 3 常规阵容:核心项目团队

15. 3 搜集业务需求和审计数据

15. 4 计划并管理实现

15. 5 启动系统

15. 6 回过头来再做一遍

15. 7 小结

第16章 网库的未来

16. 1 CRM将继续推动Web数据仓库

16. 2 更好地描述行为

16. 3 我们最终将需要数据挖掘

16. 4 ISP拥有一座金矿

16. 5 寻求更好的搜索引擎

16. 6 数据能否战胜存储和速度

16. 7 数据库的完全转置

16. 8 网站应用程序日志

16. 9 每件东西都是一个模块

16. 10 小结