机器学习案例分析(基于Python语言)

机器学习案例分析(基于Python语言)
作 者: 王恺 闫晓玉 李涛
出版社: 电子工业出版社
丛编项: 英特尔FPGA中国创新中心系列丛书
版权说明: 本书为出版图书,暂不支持在线阅读,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  北京海云捷迅科技有限公司(AWcloud),国内领先的企业级OpenStack云服务提供商。总部位于北京中关村高新技术园区,拥有行业内*专业的研发。海云捷迅以OpenStack为契机,与包括Intel、HP、Oracle、Canonical、东软等企业在内的国内外各大软硬件厂商及IT服务提供商建立了紧密的战略合作关系,构建了一套完整的OpenStack服务生态体系,为企业提供基于OpenStack的私有云、混合云、融合计算等解决方案,为IDC企业提供联合运营服务。此外,还为客户提供OpenStack的架构咨询、设计、实施、培训、运维等一条龙服务。截至目前,海云捷迅已经部署物理服务器超过2000台,运行云主机的规模超过30000台,客户遍及高校、科研院所、新媒体、医疗、IDC、电力、公众服务等领域,在同行业中居于领先地位。王恺,博士,副教授/硕士生导师,公共计算机基础教学部副主任。研究兴趣包括计算机视觉和机器学习,主持***、省部级及校企合作项目10余项,在国内外重要期刊/会议上发表科研论文30余篇。主讲《计算机基础(理)》、《数据结构与算法》、《Python和机器学习入门》、《Python和数据分析基础》等课程,出版教材11部。

内容简介

《机器学习案例分析(基于Python语言)》共分为4个部分:1、基础知识:主要介绍机器学习的基本概念、Python的基础知识、常用第三方库,并结合网络爬虫及信息提取案例和股票数据图表绘制案例使读者对本部分内容有更好的理解。2、有监督分类案例:包括Iris数据分类、新闻文本数据分类、手写数字图像识别和场景文字检测共4个案例。3、无监督聚类案例:包括人脸图像聚类和文本聚类共2个案例。4、回归预测案例:包括房价预测、员工离职预测和广告点击率预测共3个案例。

图书目录

第1 章 基础知识 ................................................................................................................. 001

1.1 机器学习简介 ....................................................................................................... 002

1.1.1 基本概念 .................................................................................................... 002

1.1.2 机器学习分类 ............................................................................................ 003

1.2 Python 基础 .......................................................................................................... 005

1.2.1 Python 编程环境 ....................................................................................... 005

1.2.2 基本数据类型 ............................................................................................ 011

1.2.3 分支语句和循环语句 ................................................................................ 018

1.2.4 函数 ............................................................................................................ 021

1.2.5 类和对象 .................................................................................................... 025

1.2.6 打开、关闭、读/写文件 ........................................................................... 028

1.2.7 异常处理 .................................................................................................... 031

1.3 常用第三方库 ....................................................................................................... 033

1.3.1 NumPy ....................................................................................................... 033

1.3.2 SciPy .......................................................................................................... 039

1.3.3 Pandas ....................................................................................................... 041

1.3.4 Matplotlib .................................................................................................. 053

1.3.5 Scikit-learn ............................................................................................... 056

1.4 案例分析 ............................................................................................................... 058

1.4.1 网络爬虫及信息提取 ................................................................................ 058

1.4.2 股票数据图表绘制 .................................................................................... 063

1.5 本章小结 ............................................................................................................... 069

1.6 参考文献 ............................................................................................................... 069

第2 章 分类案例 ................................................................................................................ 071

2.1 员工离职预测 ....................................................................................................... 072

2.1.1 问题描述及数据集获取 ............................................................................ 072

2.1.2 求解思路和相关知识介绍 ........................................................................ 073

2.1.3 代码实现及分析 ........................................................................................ 076

2.2 Iris 数据分类 ......................................................................................................... 081

2.2.1 问题描述及数据集获取 ............................................................................ 081

2.2.2 求解思路和相关知识介绍 ........................................................................ 082

2.2.3 代码实现及分析 ........................................................................................ 089

2.3 新闻文本分类 ....................................................................................................... 099

2.3.1 问题描述及数据集获取 ............................................................................ 099

2.3.2 求解思路和相关知识介绍 ........................................................................ 100

2.3.3 代码实现及分析 ........................................................................................ 113

2.4 手写数字识别 ....................................................................................................... 128

2.4.1 问题描述及数据集获取 ............................................................................ 128

2.4.2 求解思路和相关知识介绍 ........................................................................ 129

2.4.3 代码实现及分析 ........................................................................................ 134

2.5 本章小结 ............................................................................................................... 139

2.6 参考文献 ............................................................................................................... 139

第3 章 聚类案例 ................................................................................................................ 143

3.1 人脸图像聚类 ....................................................................................................... 144

3.1.1 问题描述及数据集获取 ............................................................................ 144

3.1.2 求解思路和相关知识介绍 ........................................................................ 146

3.1.3 代码实现及分析 ........................................................................................ 150

3.2 文本聚类 ............................................................................................................... 162

3.2.1 问题描述及数据集获取 ............................................................................ 162

3.2.2 求解思路和相关知识介绍 ........................................................................ 163

3.2.3 代码实现及分析 ........................................................................................ 167

3.3 本章小结 ............................................................................................................... 173

3.4 参考文献 ............................................................................................................... 174

第4 章 回归预测案例 ........................................................................................................ 175

4.1 房价预测 ............................................................................................................... 176

4.1.1 问题描述及数据集获取 ............................................................................ 176

4.1.2 求解思路和相关知识介绍 ........................................................................ 177

4.1.3 代码实现及分析 ........................................................................................ 184

4.2 基于LSTM 的股票走势预测 ............................................................................... 191

4.2.1 问题描述及数据集获取 ............................................................................ 191

4.2.2 求解思路和相关知识介绍 ........................................................................ 192

目 录

XI

4.2.3 代码实现及分析 ........................................................................................ 197

4.3 本章小结 ............................................................................................................... 204

4.4 参考文献 ............................................................................................................... 204

第5 章 综合案例................................................................................................................. 206

5.1 场景文本检测 ....................................................................................................... 207

5.1.1 问题描述及数据集获取 ............................................................................ 207

5.1.2 求解思路和相关知识介绍 ........................................................................ 208

5.1.3 代码实现及分析 ........................................................................................ 217

5.2 面部认证 ............................................................................................................... 235

5.2.1 问题描述及数据集获取 ............................................................................ 236

5.2.2 求解思路和相关知识介绍 ........................................................................ 236

5.2.3 代码实现及分析 ........................................................................................ 241

5.3 本章小结 ............................................................................................................... 275

5.4 参考文献 ............................................................................................................... 275

附录A ..................................................................................................................................... 277

A.1 逻辑回归分类器原理介绍 ................................................................................... 278

A.2 自己编程实现决策树分类器 ............................................................................... 280

A.3 支持向量机的数学推导 ....................................................................................... 287

A.3.1 最小间隔最大化 ........................................................................................ 287

A.3.2 对偶问题 .................................................................................................... 288

A.4 Adaboost 的数学推导和代码实现 ..................................................................... 292

A.4.1 数学推导 .................................................................................................... 292

A.4.2 代码实现 .................................................................................................... 294

A.5 神经网络的数学推导和代码实现 ....................................................................... 298

A.5.1 数学推导 .................................................................................................... 298

A.5.2 代码实现 .................................................................................................... 302

A.6 期望最大化算法和高斯混合模型 ....................................................................... 308

A.6.1 EM 算法的原理和数学推导 ..................................................................... 308

A.6.2 EM 算法估计高斯混合模型参数的数学推导 ......................................... 310

A.7 基于波士顿房价数据集的房价预测代码实现 ................................................... 312