数据挖掘技术:市场营销、销售与客户关系管理领域应用(原书第二版)

数据挖掘技术:市场营销、销售与客户关系管理领域应用(原书第二版)
作 者: 贝瑞 莱诺夫 别荣芳 尹静 邓六爱
出版社: 机械工业出版社
丛编项: 计算机科学丛书
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 数据库存储与管理
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  本书提供作译者介绍Michael J. A. Berry, Gordon S. Linoff,他们是专业的数据挖掘咨询公司DataMiners的创办人。他们合作出版了一些经典的数据挖掘著作,包括Data Mining Techniques、Mastering Data Mining和Mining the Web(均由Wilev公司出版)。作为数据挖掘顾问,他们一起为北美洲、欧洲和亚洲的许多大公司提供专业咨询,把客户数据、呼叫数据、网络日志条目、销售点记录和账单文件变成有用的信息,用于改善客户体验。他们都有近20年在营销和客户关系管理方面应用数据挖掘技术的经验。...

内容简介

本书是一本优秀的数据挖掘教材,全面而系统地介绍了数据挖掘酌商业环境、数据挖掘技术及其在商业环境中的应用。.全书共18章,内容涵盖核心的数据挖掘技术,包括:决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外,还提供了数据挖掘最佳实践的概观、数据挖掘的最新进展和一些极具挑战性的研究课题,极具技术深度与广度。通过学习本书,读者不仅可以精通数据挖掘的整体结构和核心技术,还可以领略数据挖掘在销售和客户关系管理等方面的成功应用,为实践数据挖掘打下坚实的基础。本书适合作为高等院校相关专业高年级本科生或研究生的教材或参考书,也适合当前和未来的数据挖掘实践者学习和参考。..本书是数据挖掘领域的经典著作,数年来畅销不衰。全书从技术和应用两个方面,全面、系统地介绍了数据挖掘的商业环境、数据挖掘技术及其在商业环境中的应用。自从1997年本书第1版出版以来,数据挖掘界发生了巨大的变化,其中的大部分核心算法仍然保持不变,但是算法嵌入的软件、应用算法的数据库以及用于解决的商业问题都有所演进。第2版展示如何利用基本的数据挖掘方法和技术,解决常见的商业问题。本书涵盖核心的数据挖掘技术,包括:决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外,还提供了数据挖掘最佳实践、数据挖掘的最新进展和一些富有挑战性的研究课题,极具技术深度与广度。配套网站www.data-miners.com/companion提供了每章的练习和用于测试各种数据挖掘技术的数据。全书语句凝炼、清新,对复杂概念的实际应用进行了生动解释,是必不可少的数据挖掘教材。...

图书目录

第1章数据挖掘的缘起和内容

11分析客户关系管理系统

111交易处理系统的作用

112数据仓库的作用

113数据挖掘的作用

114客户关系管理策略的作用

12什么是数据挖掘

13数据挖掘可以完成哪些工作

131分类

132估计

133预测

134关联分组或关联规则

135聚类

136建立简档

14为什么现在研究

141数据正在生成

142数据正在形成数据仓库

143计算能力足以承受

144客户关系管理的兴趣增强

145商业数据挖掘软件产品已经易于使用

15目前如何使用数据挖掘

151超级市场成为信息经纪人

152基于推荐的商业

153交叉销售

154抓住好的客户

155淘汰差的客户

156变革一个行业

157其他

16小结

第2章数据挖掘的良性循环

21商业数据挖掘案例研究

211识别商务挑战

212应用数据挖掘

213按照结果采取行动

214测试效果

22何谓良性循环

221识别商业机会

222挖掘数据

223采取行动

224测试结果

23良性循环环境下的数据挖掘

24移动通信公司建立恰当的联系

241机会

242如何应用数据挖掘

243处理行动

244完成循环

25神经网络和决策树驱动SUV的销售

251最初的挑战

252如何应用数据挖掘

253最终措施

254完成循环

26小结

第3章数据挖掘方法论和最佳实践

31为什么需要方法论

311获取不真实的知识

312获取真实但无用的知识

32假设测试

33模型、建立简档和预测

331建立简档

332预测

34方法论

341第一步:将商业问题转换为数据挖掘问题

342第二步:选取合适数据

343第三步:设法理解数据

344第四步:创建模型集

345第五步:修复数据问题

346第六步:变换数据,获取信息

347第七步:建立模型

348第八步:评估模型

349第九步:部署模型

3410第十步:评估结果

3911第十一步:重新开始

35小结

第4章数据挖掘在市场营销和客户关系管理中的应用

41寻找潜在客户

411识别好的潜在客户

412选择沟通渠道

413遴选适当的信息

42为选择正确的广告场所进行数据挖掘

421谁匹配简档

422测量读者群组的匹配度

43通过数据挖掘改进定向市场营销活动

431响应建模

432优化固定预算的响应率

433优化营销活动收益

434接触那些受相关信息影响最大的人们

435差别响应分析

44使用当前客户来了解潜在客户

441在他们成为客户前就开始跟踪客户

442从新客户那里收集信息

443获取时间变量可预测未来结果

45客户关系管理数据挖掘

451按客户需求策划营销活动

452划分客户群体

453减少信用风险

454决定客户价值

455交叉销售、提升销售和销售推荐

46保持和流失

461识别流失

462流失为什么重要

463不同类型的流失

464不同类型的流失模型

47小结

第5章统计学的魅力:数据挖掘常用的工具

51Occam的剃刀

511原假设

512p值

52观察数据

521观察离散数值

522观察连续变量

523另一对统计概念

53测定响应

531比例标准误差

532使用置信界限比较结果

533使用比例差值比较结果

534样本大小

535置信区间的真正含义

536实验的测试群组和对照群组大小

54多重比较

541多重比较下的置信层次

542Bonferroni修正

55卡方检验

551期望值

552卡方值

553卡方与比例差值的比较

56示例:区域和起点的卡方

57数据挖掘和统计学异同

571原始数据中没有测量误差

572有大量的数据

573时间从属性随处出现

574试验是艰难的

575数据审查和截取

58小结

第6章决策树

61什么是决策树

611分类

612评分

613估计

614树以多种形态生长

62决策树是如何长成的

621发现拆分

622生成完全树

623度量决策树的有效性

63选择最佳拆分的测试

631纯度和发散性

632基尼或总体发散性

633熵归约或信息增益

634信息增益比率

635卡方检验

636方差归约

637F测试

64修剪

641CART修剪算法

642C5修剪算法

643基于稳定性的修剪

65从树中提炼规则

66考虑成本

67决策树方法的进一步修正

671每次使用多于一个字段

672倾斜超平面

673神经树

674使用树分段回归

68决策树的替代表示法

681方格图

682树年轮图

69实际应用中的决策树

691决策树作为数据探查工具

692把决策树方法应用于顺序事件

693模拟未来

610小结

第7章人工神经网络

71历史回眸

72房地产评估

73用于定向数据挖掘的神经网络

74神经网络是什么

741神经网络的单元是什么

742前馈神经网络

743神经网络如何使用反向传播学习

744前馈网络和反向传播网络的启发

75选择训练集

751覆盖所有特征值

752特征数目

753训练集的大小

754输出数目

76准备数据

761具有连续数值的特征

762具有有序、离散(整数)数值的特征

763具有分类数值的特征

764其他类型的特征

77解释结果

78时间序列神经网络

79如何了解在神经网络内部正在运行的事情

710自组织映像

7101什么是自组织映像

7102实例: 发现簇

711小结

第8章最近邻方法: 基于存储的推理和协同过滤

81基于存储的推理

82MBR面临的挑战

821选择一组平衡的历史记录

822表示训练数据

823确定距离函数、 组合函数和邻居的数目

83案例研究: 分类新闻报导

831什么是代码

832应用MBR

833结果

84测量距离

841什么是距离函数

842每次每个字段只建立一个距离函数

843其他数据类型的距离函数

844当距离度量已经存在时

85组合函数: 向邻居求答案

851基本的方法: 民主

852加权投票

86协同过滤: 可以做出推荐的最近邻方法

861建立简档

862比较简档

863做出预测

87小结

第9章购物篮分析和关联规则

91定义购物篮分析

911购物篮数据的三个层次

912订单特征

913项流行性

914跟踪市场干预

915按用途聚类产品

92关联规则

921可操作的规则

922平凡的规则

923费解的规则

93一个关联规则有多好

94建立关联规则

941选择恰当的项集

942从所有这些数据中生成规则

943克服实际局限

944大数据的问题

95扩展思想

951使用关联规则比较店铺

952无关规则

96使用关联规则的顺序分析

97小结

第10章链接分析

101图论基础

1011哥尼斯堡七桥问题

1012旅行推销员问题

1013有向图

1014检测图中的环

102链接分析的一个熟悉的应用

1021Kleinberg算法

1022细节: 查找网络中心和权威

1023实践中的网络中心和权威

103案例研究: 谁在家中使用传真机

1031为什么发现传真机是有用的

1032用数据画图

1033方法

1034一些结果

104案例研究: 分段移动电话客户

1041数据

1042不使用图论的分析

1043两位客户的对比

1044链接分析的力量

105小结

第11章自动聚类探测

111搜索单纯岛状片段

1111星光与星的亮度

1112适应多维情况

112K平均聚类

1121K平均算法的三个步骤

1122K的意义

113相似性和距离

1131相似性度量与变量类型

1132相似性的常规度量

114聚类过程的数据准备

1141利用比例缩放使变量相对一致

1142使用权重编码外部信息

115聚类探测的其他途径

1151高斯混合模型

1152凝聚聚类

1153分裂聚类

1154自组织映像

116评价簇

1161在簇内部

1162在簇之外

117案例研究: 聚类城镇

1171创造城镇特征

1172创建簇

1173利用主题簇调整区域边界

118小结

第12章市场营销中的风险函数和生存分析

121客户保持

1211计算保持

1212保持曲线揭示的内容

1213从保持曲线找出平均保有期

1214把客户保持看做衰变

122风险

1221基本思想

1222风险函数示例

1223审查

1224其他类型的审查

123从风险到生存

1231保持

1232生存

124比例风险

1241比例风险实例

1242分层: 测量生存的初始结果

1243Cox比例风险

1244比例风险的局限性

125生存分析实践

1251处理不同的流失类型

1252客户何时会回来

1253预测

1254风险随时间变化

126小结

第13章遗传算法

131遗传算法如何工作

1311计算机上的遗传学

1312表示数据

132案例研究: 使用遗传算法进行资源优化

133模式: 遗传算法为什么起作用

134遗传算法的更多应用

1341在神经网络方面的应用

1342案例研究: 为响应建模完善一个解决方案

135超越简单算法

136小结

第14章数据挖掘贯穿客户生存周期

141客户关系层次

1411深度亲密

1412大众亲密

1413中间关系

1414间接关系

142客户生存周期

1421客户生存周期: 生存阶段

1422客户生存周期

1423基于订阅关系和基于事件关系的比较

143围绕客户生存周期组织商业过程

1431客户获取

1432客户激活

1433关系管理

1434保持

1435赢回

144小结

第15章数据仓库、 OLAP和数据挖掘

151数据结构

1511交易数据——基础层

1512操作汇总数据

1513决策支持汇总数据

1514数据库模式

1515元数据

1516商业规则

152数据仓库的大致结构

1521源系统

1522提取、 转化和加载

1523中央储存库

1524元数据储存库

1525数据集市

1526操作反馈

1527最终用户和桌面工具

153OLAP适用于何处

1531立方体中的内容

1532星形模式

1533OLAP和数据挖掘

154数据挖掘在哪里切入数据仓库

1541大量数据

1542一致的、 清洁的数据

1543假设测试和测量

1544可升级硬件及RDBMS支持

155小结

第16章构造数据挖掘环境

161以客户为中心的组织

162理想的数据挖掘环境

1621确定什么数据可用的能力

1622将数据转化为可操作信息的技巧

1623所有必需的工具

163返回现实世界

1631建立以客户为中心的组织

1632创建单个客户视图

1633定义以客户为中心的度量标准

1634收集正确的数据

1635从客户交互到学习机会

1636挖掘客户数据

164数据挖掘组

1641外包数据挖掘

1642内部数据挖掘

1643数据挖掘组成员需要具备的条件

165数据挖掘基础设施

1651挖掘平台

1652评分平台

1653一个产品数据挖掘结构实例

166数据挖掘软件

1661所应用的技术范围

1662可扩展性

1663评分支持

1664用户界面的多种层次

1665可理解的输出

1666处理各种数据类型的能力

1667文档及简单使用

1668对新手和高级用户的培训、咨询和支持

1669卖方可信度

167小结

第17章为挖掘准备数据

171数据应该像什么

1711客户特征标识

1712列

1713模型在建模中的角色

1714变量度量

1715用于数据挖掘的数据

172构建客户特征标识

1721编写数据目录

1722识别客户

1723第一次尝试

1724取得进展

1725实际的问题

173探查变量

1731直方图分布

1732随时间变化

1733交叉表

174衍生变量

1741提取来自单个数值的特征

1742在记录内合并数值

1743查找辅助信息

1744转轴正则时间序列

1745汇总交易记录

1746汇总跨越模型集的字段

175基于行为变量的例子

1751购买频率

1752衰减使用

1753旋转者、 交易商和便利用户:定义客户行为

176数据的黑暗面

1761缺失值

1762脏数据

1763不一致数值

177计算问题

1771源系统

1772提取工具

1773专用代码

1774数据挖掘工具

178小结

第18章应用数据挖掘

181开始

1811从概念验证方案中能期待什么

1812识别概念验证方案

1813实现概念验证方案

182选择数据挖掘技术

1821将商务目标转换为数据挖掘任务

1822决定数据的相关特性

1823考虑混合方法

183公司如何开展数据挖掘

1831保持的对照实验

1832数据

1833一些发现

1834实践出真知

184小结