点击流数据仓库

点击流数据仓库
作 者: 斯韦格特 陆昌辉 陆昌辉
出版社: 电子工业出版社
丛编项: 数据仓库与数据挖掘技术应用丛书
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 数据库存储与管理
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

暂缺《点击流数据仓库》作者简介

内容简介

本书解释了构建点击流数据仓库所需要的Web技术和IT基础设施,并对设计、实现点击流数据仓库的整个过程提供全面的指导,包括:计划、人员分工以及管理整个工程;使用创新的元模式设计模板设计点击流数据仓库;挑选合适的数据仓库软件和存储子系统以支撑点击流数据仓库;建立抽取、变形和装载(即ETL)机制,以及将数据传送给分析这些数据的终端用户。本书主要面向学习或在工作中运用点击流数据仓库技术的教师、学生或工程技术人员,特别适合对数据仓库技术有所了解,但希望进一步提高构建点击流数据仓库能力的应用开发人员。

图书目录

第一篇 点击流数据仓库的构建基础

第1章 典型电子商务体系结构

◣ 1.1 电子商务体系结构简述

◣ 1.2 INTERNET服务提供商——ISP

◣ 1.3 多种INTERNET连接服务

◣ 1.4 多种物理WEB服务器

◣ 1.5 不同类型的备份WEB服务器

◣ 1.6 集群商业交易系统

◣ 1.7 点击流数据仓库

◣ 1.8 规范的电子商务体系结构

◣ 1.9 小结

第2章 Web应用环境

◣ 2.1 状态无关的HTTP事务模型

◣ 2.2 HTTP事务间的信息交互

◣ 2.3 查询字符串

◣ 2.4 COOKIES, 用户标识以及WEB服务器日志记录

◣ 2.5 站点点击. 页面访问和用户会话

◣ 2.6 使用CGI调用其他可执行程序

◣ 2.7 使用脚本语言记录用户行为

◣ 2.8 网页服务器. 应用服务器及动态生成WEB页

◣ 2.9 动态生成WEB页和搜索引擎

◣ 2.10 小结

第3章 点击流数据源和Web服务器日志文件

◣ 3.1 WEB服务器日志

3.1.1 标准日志文件格式

3.1.2 扩展Web服务器的日志

3.1.3 Cookies

◣ 3.2 内部数据源

3.2.1 Web站点和日志文件分析工具

3.2.2 其他的Web服务器相关系统

3.2.3 商务应用

3.2.4 客户联系系统

◣ 3.3 外部数据源

3.3.1 内容缓存服务

3.3.2 合作伙伴

3.3.3 在线广告数据

3.3.4 代理商的关于用户或商业的数据

◣ 3.4 小结

第4章 用Cookies和其他机制跟踪用户身份

◣ 4.1 维持应用状态的WEB编程技术

4.1.1 Cookies

4.1.2 查询字符串和URL重写

4.1.3 隐藏表单域

◣ 4.2 管理会话并跟踪用户

4.2.1 用Cookies跟踪会话

4.2.2 用URL重写来跟踪会话

4.2.3 用隐藏域来跟踪会话

4.2.4 会话管理的设计技术

4.2.5 跟踪用户

◣ 4.3 用户的身份验证和用户概要信息

4.3.1 在线用户分类

4.3.2 用户身份验证

4.3.3 处理用户身份的数据

4.3.4 建立用户概要信息

◣ 4.4 网站的个性化和用户概要信息

4.4.1 基本的个性化方法

4.4.2 个性化的类型

4.4.3 数据仓库和Web站点概要信息之间的链接

◣ 4.5 隐私权政策对点击流数据仓库的影响

◣ 4.6 小结

第二篇 逐步建立点击流数据仓库

第5章 点击流数据仓库的计划. 管理及其人员配置

◣ 5.1 点击流数据仓库项目流程简介

◣ 5.2 项目管理

5.2.1 第1阶段:项目定义和计划

5.2.2 第2阶段:商业需求分析

5.2.3 第3阶段:数据仓库设计

5.2.4 第4阶段:数据仓库的实现

5.2.5 第5阶段:部署阶段

◣ 5.3 项目人员配置和组织

5.3.1 项目角色

5.3.2 项目组织

5.3.3 项目人员

◣ 5.4 小结

第6章 点击流数据仓库的元模式

◣ 6.1 由销售分析基准发展到元模型

6.1.1 CRM客户维

6.1.2 用户行为/站点点击事实表

6.1.3 用户维

6.1.4 财政时间维和用户时间维

6.1.5 物理. Web和站点地理维

6.1.6 内容和活动维

6.1.7 内部促销维和外部促销维

6.1.8 用户活动/站点点击元模式

◣ 6.2 元模式属性

6.2.1 财政时间维属性

6.2.2 用户时间维属性

6.2.3 物理地理维属性

6.2.4 Web地理维属性

6.2.5 站点地理维属性

6.2.6 用户维属性

6.2.7 内容维属性

6.2.8 活动维属性

6.2.9 内部促销维属性

6.2.10 外部促销维属性

6.2.11 用户活动/站点事实表属性

◣ 6.3 页面活动和会话活动聚合

6.3.1 页面维

6.3.2 会话维

6.3.3 会话聚合

◣ 6.4 元模式的B2B应用

◣ 6.5 对现有面向商务模式加入点击流特征

◣ 6.6 用多个冗余WEB服务器来支持大型的站点

◣ 6.7 小结

第7章 实现合适的点击流数据仓库的技术基础

◣ 7.1 点击流数据仓库的数据库支持

7.1.1 RDBMS的批装载器

7.1.2 分区

7.1.3 索引

7.1.4 特殊的联接(joins)

7.1.5 聚合的创建. 认识和管理

7.1.6 并行性

7.1.7 对SQL的有用分析扩展

◣ 7.2 磁盘驱动和卷管理

7.2.1 逻辑卷管理

7.2.2 数据库对象

7.2.3 对数据库对象磁盘布局的建议

◣ 7.3 选择合适的基础结构供应商

7.3.1 数据库软件

7.3.2 逻辑卷管理软件(LVM)和磁盘子系统

◣ 7.4 小结

第8章 建立点击流的抽取. 转换和装载机制

◣ 8.1 抽取. 转换和装载的体系结构

◣ 8.2 点击流ETL体系结构

8.2.1 更加复杂的点击流环境

8.2.2 点击流ETL体系结构

◣ 8.3 建立ETL子系统

8.3.1 第1步:数据分析

8.3.2 第2步:使Web站点适合点击流

8.3.3 第3步:创建高层ETL设计和体系结构

8.3.4 第4步:设计特定点击流的组件

8.3.5 第5步:设计和建立ETL组件维表

8.3.6 第6步:设计和建立事实表ETL组件

8.3.7 第7步:建立数据装载机制和整合ETL程序

8.3.8 第8步:为数据管理建立支持

◣ 8.4 小结

第9章 点击流数据仓库中的数据分析

◣ 9.1 OLAP 工具

9.1.1 MOLAP概述

9.1.2 ROLAP 概述

9.1.3 HOLAP 概述

9.1.4 今天的OLAP

◣ 9.2 分析特点和技术

9.2.1 查询工具相关特点和技术

9.2.2 数据模型相关的特点和技术

9.2.3 数据库引擎相关特性和技术

◣ 9.3 小结