Microsoft Azure机器学习和预测分析

Microsoft Azure机器学习和预测分析
作 者: Roger Barga 巴尔加 Valentine Fontama 李永伦
出版社: 人民邮电出版社
丛编项:
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  Roger Barga是***Web服务的总经理和开发总监。在加入***之前,Roger是微软的云与企业部门的云机器学习组的产品组程序经理,他的团队负责Azure机器学习服务的产品管理。Roger于1997年加入微软,在微软研究院的数据库产品组里担任研究员,他领导数据库、工作流和流处理系统的系统研究和产品开发。他提出了从基础研究,通过原型验证概念,到产品组孵化的设想。在加入微软之前,Roger是Pacific Northwest National Laboratory的机器学习组的研究科学家,他构建和部署基于机器学习的解决方案。Roger还是华盛顿大学的助理教授,他是数据科学和机器学习课程的讲师。Roger拥有计算机科学的博士学位(PhD),专攻机器学习。从1991年到2013年,他发表了超过90份同行评审的技术论文和专书论文,和214个合著者共事,有1084个作者超过700个引述。Valentine Fontama是微软Cloud & Enterprise Analytics and Insights产品组的数据科学家经理。Val在数据科学和业务上有着超过18年的经验。在获得人工神经网络的博士学位之后,他把数据挖掘应用到环境科学和信用行业。在加入微软之前,Val是伦敦Equifax的新技术咨询师,他zui先提倡把数据挖掘应用到消费信用行业的风险评估和市场营销。他目前是华盛顿大学的数据科学助理教授。他之前在微软的职位是Data and Decision Sciences Group(DDSG)的主要数据科学家,为微软客户(包括ThyssenKrupp和Dell)提供外部咨询。在那之前,他是一个资-深产品营销经理,负责云的大数据和预测分析以及企业营销。在这个角色里,他负责微软Azure机器学习的产品管理;HDInsight,微软的首-个Hadoop服务;Parallel Data Warehouse,微软的首-个数据仓库工具;Fast Track Data Warehouse的3个版本发布。Val拥有沃顿商学院的战略管理和市场营销的MBA学位,拥有神经网络的博士学位,拥有计算方面的硕士学位,拥有数学和电子的学士学位(获得一等荣誉)。他合著了《Introducing Microsoft Azure HDInsight》一书,发表过11份学术论文,有超过227个作者152个引述。Wee-Hyong Tok是...

内容简介

近年来,机器学习领域受到越来越多的关注,相关的机器学习算法开始成为热点。本书专门介绍了有关机器学习的内容,全书共分3部分:第1部分是数据科学和Microsoft Azure Machine Learning导论,介绍了数据科学和Microsoft Azure Machine Learning的基本知识以及需要用到的语言的基本知识;第二部分是统计学和机器学习算法,系统地讲解了统计学和机器学习的相关算法;第三部分是实用应用程序,这一部分介绍了新的微软Azure机器学习服务,讲解如何高效构建和部署预测模型,还讲解了如何解决倾向建模、产品推荐等实用技能。本书可供数据科学、商业分析和商业智能领域的开发人员,对机器学习感兴趣的开发者阅读。

图书目录

目 录

第1部分 数据科学和Microsoft Azure Machine Learning导论

第1章 数据科学导论\t3

1.1 数据科学是什么\t3

1.2 分析频谱\t4

1.2.1 描述性分析\t4

1.2.2 诊断性分析\t5

1.2.3 预测性分析\t5

1.2.4 规定性分析\t5

1.3 为何重要,为何现在\t6

1.3.1 把数据看作竞争资产\t6

1.3.2 客户需求的增长\t6

1.3.3 对数据挖掘技术认识的提高\t7

1.3.4 访问更多数据\t7

1.3.5 更快、更廉价的处理能力\t7

1.3.6 数据科学流程\t8

1.4 常见数据科学技术\t10

1.4.1 分类算法\t10

1.4.2 聚类算法\t11

1.4.3 回归算法\t12

1.4.4 模拟\t12

1.4.5 内容分析\t12

1.4.6 推荐引擎\t13

1.5 数据科学的前沿\t13

1.6 小结\t14

第2章 Microsoft Azure Machine

Learning导论\t15

2.1 你好,Machine Learning Studio\t15

2.2 实验的组件\t16

2.3 Gallery简介\t17

2.4 创建训练实验的5个简单步骤\t18

2.4.1 第1步:获取数据\t19

2.4.2 第2步:预处理数据\t20

2.4.3 第3步:定义特征\t22

2.4.4 第4步:选择和应用学习

算法\t23

2.4.5 第5步:在新数据之上做

预测\t24

2.5 在生产环境里部署你的模型\t26

2.5.1 创建预测实验\t26

2.5.2 把你的实验发布成Web

服务\t28

2.5.3 访问Azure Machine Learning的

Web服务\t28

2.6 小结\t30

第3章 数据准备\t31

3.1 数据清理和处理\t31

3.1.1 了解你的数据\t32

3.1.2 缺失值和空值\t37

3.1.3 处理重复记录\t38

3.1.4 识别并移除离群值\t39

3.1.5 特征归一化\t40

3.1.6 处理类别不均\t41

3.2 特征选择\t43

3.3 特征工程\t46

3.3.1 分装数据\t48

3.3.2 维度灾难\t50

3.4 小结\t53

第4章 整合R\t54

4.1 R概览\t54

4.2 构建和部署你的首个R脚本\t56

4.3 使用R进行数据预处理\t59

4.4 使用脚本包(ZIP)\t61

4.5 使用R构建和部署决策树\t64

4.6 小结\t68

第5章 整合Python\t69

5.1 概览\t69

5.2 Python快速上手\t70

5.3 在Azure ML实验里使用Python\t71

5.4 使用Python进行数据预处理\t76

5.4.1 使用Python合并数据\t76

5.4.2 使用Python处理缺失值\t79

5.4.3 使用Python进行特征选择\t80

5.4.4 在Azure ML实验里运行

Python代码\t82

5.5 小结\t86

第2部分 统计学和机器学习算法

第6章 统计学和机器学习算法概览\t89

6.1 回归算法\t89

6.1.1 线性回归\t89

6.1.2 神经网络\t90

6.1.3 决策树\t92

6.1.4 提升决策树\t93

6.2 分类算法\t94

6.2.1 支持向量机\t95

6.2.2 贝叶斯点机\t96

6.3 聚类算法\t97

6.4 小结\t99

第3部分 实用应用程序

第7章 构建客户倾向模型\t103

7.1 业务问题\t103

7.2 数据获取和准备\t104

7.3 训练模型\t109

7.4 模型测试和验证\t111

7.5 模型的性能\t112

7.6 确定评估指标的优先级\t115

7.7 小结\t116

第8章 使用Power BI可视化你的

模型\t117

8.1 概览\t117

8.2 Power BI简介\t117

8.3 使用Power BI可视化的三种

方案\t119

8.4 在Azure Machine Learning里给你的

数据评分,并在Excel里可视化\t120

8.5 在Excel里评分并可视化你的

数据\t123

8.6 在Azure Machine Learning里给你的

数据评分,并在powerbi.com里

可视化\t124

8.6.1 加载数据\t125

8.6.2 构建你的仪表板\t125

8.7 小结\t127

第9章 构建流失模型\t128

9.1 流失模型概览\t128

9.2 构建和部署客户流失模型\t129

9.2.1 准备和了解数据\t129

9.2.2 数据预处理和特征选择\t132

9.2.3 用于预测流失的分类模型\t135

9.2.4 评估客户流失模型的性能\t137

9.3 小结\t138

第10章 客户细分模型\t139

10.1 客户细分模型概览\t139

10.2 构建和部署你的第一个K均值聚

类模型\t140

10.2.1 特征散列\t142

10.2.2 找出合适的特征\t142

10.2.3 K均值聚类算法的属性\t144

10.3 批发客户的客户细分\t145

10.3.1 从UCI机器学习库加载

数据\t145

10.3.2 使用K均值聚类算法进行批发

客户细分\t146

10.3.3 新数据的聚类分配\t147

10.4 小结\t148

第11章 构建预见性维护模型\t149

11.1 概览\t149

11.2 预见性维护场景\t150

11.3 业务问题\t150

11.4 数据获取和准备\t151

11.4.1 数据集\t151

11.4.2 数据加载\t151

11.4.3 数据分析\t151

11.5 训练模型\t154

11.6 模型测试和验证\t155

11.7 模型性能\t156

11.8 改善模型的技术\t158

11.9 模型部署\t161

11.9.1 创建预测实验\t161

11.9.2 把你的实验部署成Web

服务\t162

11.10 小结\t163

第12章 推荐系统\t164

12.1 概览\t164

12.2 推荐系统的方案和场景\t164

12.3 业务问题\t165

12.4 数据获取和准备\t166

12.5 训练模型\t170

12.6 模型测试和验证\t171

12.7 小结\t175

第13章 使用和发布Azure Marketplace

上的模型\t176

13.1 什么是机器学习API\t176

13.2 如何使用Azure Marketplace的

API\t178

13.3 在Azure Marketplace里发布你

自己的模型\t182

13.4 为你的机器学习模型创建和

发布Web服务\t182

13.4.1 创建评分实验\t183

13.4.2 把你的实验发布成Web

服务\t183

13.5 获取API密钥和OData端点

信息\t184

13.6 把你的模型发布为Azure

Marketplace里的API\t184

13.7 小结\t186

第14章 Cortana分析\t187

14.1 Cortana分析套件是什么\t187

14.2 Cortana分析套件的功能\t187

14.3 示例场景\t189

14.4 小结\t190