数据挖掘Clementine应用实务

数据挖掘Clementine应用实务
作 者: 谢邦昌
出版社: 机械工业出版社
丛编项: 原创精品系列
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 数据理论
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  谢邦昌 台湾大学生物统计学博士。现任中华资料采矿协会理事长,辅仁大学统计资讯学系教授,华通人商用信息有限公司高级顾问,中国人民大学应用统计科学研究中心学术委员会委员,中国人民大学统计学系中心客座教授,上海财经大学统计学系客座教授,厦门大学计划统计学系客座教授,西南财经大学客座教授。 他是数据挖掘界领军人物及世界知名统计学家,发表过近三百篇关于统计和数据挖掘的论文。出版了近五十余本相关专著。

内容简介

Clementine是SPSS公司整合开发的数据挖掘工具平台。Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。.本书主要介绍了Clementine 11.0在数据挖掘中的应用。内容包括Clementine 11.0的新功能、数据挖掘入门、构建数据流、字段操作节点、建立CLEM表达式、建模节点和生成模型等,详细讨论了各种数据挖掘的分析方法,并介绍了大量的应用范例。本书结构清晰合理,内容翔实,可作为分析师、数据挖掘人员、企业管理人员的参考书。在Kdnuggets网站“你最常用哪种数据挖掘工具”的投票调查中,Clementine连续数年位居第一。它灵活的使用界面,强大的数据预处理以及分析演算功能,能够让分析者在最短的学习周期中,快速上手执行复杂的商业分析。..Clementine作为一套绝佳的数据挖掘软件,从数据收集整理,建立数据库,适当数据挖掘方法、精致报表输出到智能决策的拟定,为用户考虑到每一步骤。从工业数据挖掘,社会调查数据挖掘、生物数据挖掘、财务数据挖掘。教育数据挖掘甚至神经网络,Clementine都有一套适合的配套产品供用户解决相关领域问题。针对业界实务上的需求,本书主要介绍了如下内容:·数据挖掘的入门知识。数据挖掘的应用。数据挖掘在CRM(客户关系管理)中的角色。·SPSS Clementinell.0版本所拥有的所有节点的详细操作指南,包括构建数据流。字段操作节点、建立CLEM表达式,建模节点和生成模型节点等。本书还介绍了SPSS Clementine软件自带的示例数据流的案例讲解,包括:·通过监测一台机器的状态信息来识别和预测故障状态。·农业发展贷款申请中的欺诈探测。·零售行业中,预测促销所带来的影响。·市场购物篮研究。...

图书目录

第1章数据挖掘简介

11何谓数据挖掘

12数据仓库、 KDD、 数据挖掘的关系

13数据挖掘的应用

14数据挖掘的进行步骤

15个案研究

16数据挖掘的分析方法

161分类

162决策树

163回归

164时间序列

165聚类

166关联规则

167顺序规则

168其他分析方法

17数据挖掘的运用理论与实际运用功能

18数据挖掘软件

19数据挖掘在CRM中扮演的角色

191客服中心是顾客关系管理的火

车头

192从客服中心角度看顾客关系

管理

第2章Clementine 110简介

21Clementine的安装与启动

211安装Clementine 110

212启动Clementine 110

22Clementine 110一览

221Clementine 110界面

222在Clementine 110中使用鼠标

223利用快捷键

224Clementine 110中获得帮助

23Clementine选项设置

231系统选项

232默认目录的设置

233用户选项的设置

24Clementine自动化

25Clementine 110版本的新功能

251商业品质的图形展示

252改进的SPSS输出节点

253增强的数据审核节点

254增强的数据变换节点

255优化分块节点

256SPSS转换节点

257改进的数据挖掘模型和算法

258运行效率、 安全性和远程部署

第3章数据挖掘入门

31数据挖掘回顾

32机器学习技术

321神经网络

322规则归纳

323Kohonen网络

324关联规则

325统计模型

326聚类模型

33潜在数据挖掘应用评估

34数据挖掘的策略

35数据挖掘中的小技巧

第4章构建数据流

41概述

42建立数据流

421节点的操作

422数据流的操作

423执行数据流

424保存数据流

425装载文件

426映射数据流

第5章处理缺失值

51概述

52指定缺失值

53处理缺失值

531处理带缺失值的记录

532处理带缺失值的字段

54针对缺失值的CLEM函数

第6章来源节点

61概述

62变量文件节点

63固定文件节点

64为文本区设置数据存储

65数据库节点

651设置数据库节点选项

652添加数据库连接

653选择表

654数据库查询

66SPSS导入节点

67多维数据集导入节点

68SAS导入节点

69Excel输入节点

610用户输入节点

611一般来源节点项目

6111在来源节点中设置数据类型

6112在来源节点处过滤字段

第7章记录操作节点

71概述

72选择节点

73抽样节点

74均衡节点

75聚合节点

76排序节点

77合并节点

771指定合并方法和关键字段

772从合并节点过滤字段

773设置输入顺序并加上卷标

78区分节点

79附加节点

第8章字段操作节点

81概述

82类型节点

821数据类型

822什么是实例化

823读取数据值

824缺失值处理

825检查类型值

826设置字段方向

827复制类属性

83过滤节点

84导出节点

841设置导出节点的基本选项

842导出多重字段

843设置导出规则选项

844设置导出标记选项

845设置导出设置节点选项

846设置导出状态选项

847设置导出计数选项

848设置导出条件选项

85导出节点

86再分类节点

87分块节点

88分割节点

89设置标记节点

810调整节点

811换位节点

812时间间隔节点

813历史节点

814字段记录节点

815SPSS转移节点

第9章建立CLEM 表达式

91什么是CLEM

911值及数据类型

912表达式及条件

92使用表达式编辑器

921获取表达式编辑器

922构造表达式

923选择函数

924选择字段、 参数以及全局变量

925选择变量值

926检查CLEM表达式

93CLEM函数类型

94CLEM的常见用法

941对字符串的操作

942处理空缺和缺失值

943处理数字

944处理时间和日期

第10章图节点

101概述

1011层迭图

1012三维图像

1013动画效果

102建立图

1021为图设置输出选项

1022设置图外观选项

103使用图

104点图节点

1041为点图节点设置选项

1042使用点图

105分布节点

1051设置分布节点选项

1052使用一个分布图

106直方图节点

1061设置直方图节点更多选项

1062使用一个直方图

107堆积图节点

1071设置堆积图节点的更多选项

1072堆积图的使用

108多点图节点

1081为多点图节点设置选项

1082使用一个多点图

109网络图节点

1091设置网络图节点选项

1092设置网络图节点的更多选项

1093网络图节点的外观选项

1010评估图表节点

10101设置评估图表节点选项

10102设置评估图表的更多选项

10103读取模型评估的结果

10104一个评估图表的使用

1011时间序列点图

10111时间序列点图设置选项

10112时间序列点图的显示选项

10113时间序列点图的输出选项

10114使用一个时间序列点图

第11章建模节点

111概述

112建模节点字段选项

113二进位分类节点

1131二进位分类节点模型选项

1132二进位节点的高级选项

1133二进位节点的Discard选项

114神经网络节点

1141神经网络节点模型选项

1142神经网络节点的附加选项

1143神经网络节点高级选项——

快速方法

1144神经网络节点高级选项——

多重方法

1145神经网络节点高级选项——

修剪方法

1146神经网络节点高级选项——

RBFN方法

1147神经网络节点学习比率

115C50节点

1151C50节点模型选项

1152错误归类损失选项

116分类回归树节点

1161分类回归树节点模型选项

1162分类回归树节点高级选项

1163分类回归树节点终止选项

1164分类回归树节点先验概率

选项

117QUEST节点

1171QUEST分类模型选项

1172QUEST高级选项

1173QUEST的成本选项

118CHAID

1181CHAID模型选项

1182CHAID高级选项

1183CHAID的成本选项

119决策表

1191决策表模型选项

1192决策表高级选项

1110Kohonen 节点

11101Kohonen 节点模型选项

11102Kohonen 节点高级选项

1111KMeans节点

11111KMeans 节点型选项

11112KMeans 节点高级选项

1112两步聚类节点

1113时间序列节点

1114异常探测节点

11141异常探测节点模型选项

11142异常节点高级选项

1115Apriori 节点

11151Apriori 节点模型选项

11152Apriori 节点高级选项

1116广义规则归纳节点

1117Carma规则分析

11171Carma规则的模型选项

11172Carma高级选项

1118序列节点

11181序列节点字段选项

11182序列节点模型选项

11183序列节点高级选项

1119因子分析/主成分分析

11191因子分析/主成分分析

模型选项

11192因子分析/主成分分析

高级选项

11193因子分析/主成分分析

旋转选项

1120特征选择节点

11201特征选择节点的模型选项

11202特征选择节点的附加选项

1121线性回归节点

11211线性回归节点模型选项

11212线性回归节点高级选项

11213线性回归节点单步选项

11214线性回归节点输出选项

1122Logistic回归节点

11221Logistic回归节点模型选项

11222Logistic回归节点高级选项

11223Logistic回归节点收敛选项

11224Logistic回归输出选项

1123判别分析节点

11231判别分析节点模型选项

11232判别分析的高级选项

1124广义线性模型

11241广义线性模型选项

11242广义线性模型的高级选项

第12章输出节点

121概述

122使用输出

123输出浏览菜单

124输出节点输出页签

125表格节点

1251表格节点设置页签

1252表格节点格式页签

1253表格浏览器

126矩阵节点

1261矩阵节点设置页签

1262矩阵节点外观页签

1263矩阵输出浏览器

127分析节点

1271分析节点Analysis页签

1272分析输出浏览器

128数据审查节点

1281数据审查节点页签

1282数据审查输出浏览器

129转换节点

1291转换节点设置标签

1292转换输出浏览器

1210统计量节点

12101统计量节点设置页签

12102统计量输出浏览器

1211均值节点

12111均值节点设置标签

12112均值节点选项标签

12113均值节点输出标签

12114均值节点输出浏览器

1212报告节点

12121报告节点模板页签

12122报告节点输出浏览器

1213设置全局节点

1214SPSS 输出节点

12141SPSS 程序节点语法页签

12142SPSS 程序输出浏览器

1215数据库输出节点

1216平面文件节点

1217SPSS 导出节点

1218SAS导出节点

1219Excel导出节点

1220方案发布节点

1221应用软件帮助

第13章生成模型

131概述

132在生成模型选项板中利用生成

模型进行操作

133在数据流中使用生成模型

134使用生成模型浏览器

135生成二进制分类器

136生成网络节点

1361生成的神经网络概要页签

1362从神经网络中生成一个

过滤节点

137生成C50节点

138生成C&R决策树

1381决策树模型页签

1382决策树浏览页签

1383决策树概要页签

1384从决策树生成规则集

139生成QUEST节点

1310生成CHAID节点

1311生成决策表

1312生成Kohonen节点

1313生成KMeans节点

13131生成的KMeans模型页签

13132生成的KMeans概要页签

1314生成两步聚类节点

13141生成的两步聚类模型页签

13142生成的两步概要页签

1315生成时间序列节点

1316生成异常探测节点

1317生成Apriori节点

1318生成GRI节点

1319生成Carma节点

1320生成序列规则序列节点

13201生成的序列规则节点

13202序列规则模型页签

13203序列规则的概要页签

13204从序列规则节点生成规则

超级节点

1321因子分析/主成分分析节点

13211因子分析/主成分分析

模型页签

13212因子分析/主成分分析

概要页签

13213因子分析/主成分分析

高级输出

1322生成特征选择节点

1323Logistic回归方程节点

13231Logistic回归方程概要页签

13232高级Logistic回归输出

1324生成线性回归模型

13241线性回归概要页签

13242线性回归模型的高级输出

1325判别分析

1326广义线性回归模型

1327未精练的规则模型

13271未精练规则的模型页签

13272未精练规则的概要页签

13273生成规则集

1328生成的规则集节点

13281生成的规则集模型页签

13282生成的规则集概要页签

第14章PMML输出模型

141概述

142用PMML输出

第15章超级节点

151概述

152超级节点类型

153创建一个超级节点

1531嵌套超级节点

1532有效超级节点举例

1533无效超级节点举例

154编辑超级节点

1541修改超级节点的类型

1542注释和重命名超级节点

1543超级节点参数

1544超级节点和暂存

1545超级节点和脚本

155保存并装载超级节点

第16章建立项目和报告

161项目介绍

1611CRISPDM浏览窗口

1612Classes浏览窗口

162建立项目

1621增加新项目

1622加入到项目中

1623设置项目属性

1624评注项目

1625对象属性

1626关闭项目

163建构报告

1631生成报告

1632保存和输出报告

第17章批处理模式

171批处理模式一览

172在批处理模式下工作

1721软件调用

1722使用命令行参数

1723批处理模式日志文件

1724批处理模式中的脚本编程

1725在批处理模式中使用参数

1726在批处理模式下输出

第18章Clementine 110中的脚本

编程

181脚本编程介绍

1811脚本类型

1812Clementine脚本范例

182在用户接口上进行脚本编程

1821在流中使用脚本

1822在超级节点中使用脚本

1823使用独立脚本

183以批处理模式编写脚本

第19章Clementine外部模块接口

191概述

192执行CEMI

193系统体系结构

194规范说明文件

1941参数

1942外部程序

1943命令行选项

1944编辑对话框

1945输入和输出字段

1946输入和输出文件

1947元文件

1948结果

1949返回代码

195限制

196规范说明文件范例

1961节点说明

1962核心说明

1963参数

1964执行

1965选项

1966控件

1967输出字段

1968输出数据

1969返回代码

19610完整的规范文件

197CEMI节点管理

1971增加CEMI节点

1972清除CEMI节点

198编写外部程序的技巧

第20章应用范例

201概述

202状态监测范例

2021审视数据

2022数据准备

2023学习

203测试

2031欺诈探测范例

2032数据采集

2033数据探索

2034训练神经网络

2035总结

204零售业范例

2041数据审核

2042学习和测试

205市场购物篮分析范例

2051获取数据

2052购物关联分析

2053客户细分

2054小结

第21章ACMR企业数据库挖掘研究

211研究背景

212操作过程

附录A命令行参数

附录BCLEM 语言参考

附录C脚本语言参考

附录D节点及流属性

附录ECEMI规范文件参考

参考文献

英文参考文献

后记