机器学习算法(原书第2版)

机器学习算法(原书第2版)
作 者: 朱塞佩·博纳科尔索 罗娜 汪文发
出版社: 机械工业出版社
丛编项: 智能系统与技术丛书
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  朱塞佩·博纳科尔索(Giuseppe Bonaccorso) 一家大型跨国公司的数据科学主管。他拥有意大利卡塔尼亚大学电子工程专业工程学硕士学位,然后在意大利罗马第二大学、英国埃塞克斯大学深造过。在他的职业生涯中,担任过公共管理、军事、公用事业、医疗保健、诊断和广告等多个业务领域的IT工程师,使用Java、Python、Hadoop、Spark、Theano和TensorFlow等多种技术进行过项目开发与管理。他的主要研究兴趣包括人工智能、机器学习、深度学习、强化学习、数据科学等。 ◆ 译者简介 ◆ 罗娜 博士,副研究员,在华东理工大学信息科学工程学院任教。研究方向为机器学习算法及其在工业中的应用。作为项目负责人,先后承担了国家自然科学基金青年科学基金、上海市自然科学基金等多项课题的研究工作,并作为技术负责人承担了多项中石化科技攻关项目,发表相关学术论文20余篇,申请国家发明专利两项,登记软件著作权两项。

内容简介

与机器学习领域很多偏重于理论的书相比,本书在简明扼要地阐明基本原理的基础上,侧重于介绍如何在Python环境下使用机器学习方法库,并通过大量实例清晰形象地展示了不同场景下机器学习方法的应用。从这个角度来说,本书是一本使机器学习算法通过Python实现真正“落地”的书,而这无疑将给想要或致力于机器学习应用的读者带来方法理解和实现上的巨大裨益。书中所有实例都是用Python编写,使用了scikit-learn机器学习框架、自然语言工具包(NLTK)、Crab、langdetect、Spark(PySpark)、Gensim、Keras和TensorFlow(深度学习框架)。这些程序适用于基于Linux、和Windows系统的Python 2.7和3.3+版本。本书主要面向希望在预测分析和机器学习领域建立扎实基础的机器学习工程师、数据工程师和数据科学家。

图书目录

译者序

前言

第1章机器学习简介

1.1简介——经典机器和自适应的机器

1.1.1描述性分析

1.1.2预测性分析

1.2关于学习

1.2.1监督学习

1.2.2无监督学习

1.2.3半监督学习

1.2.4强化学习

1.2.5计算神经科学

1.3超越机器学习——深度学习和基于生物启发的适应系统

1.4机器学习和大数据

1.5本章小结

第2章机器学习的重要元素

2.1数据格式

2.2可学习性

2.2.1欠拟合和过拟合

2.2.2误差度量和成本函数

2.2.3PAC学习

2.3统计学习方法介绍

2.3.1最大后验概率学习

2.3.2最大似然学习

2.4类平衡

2.4.1可置换的重采样

2.4.2合成少数类过采样

2.5信息论的要素

2.5.1熵

2.5.2交叉熵和互信息

2.5.3两个概率分布的散度

2.6本章小结

第3章特征选择与特征工程

3.1scikit-learn的toy数据集

3.2创建训练集和测试集

3.3管理分类数据

3.4管理缺失特征

3.5数据缩放和归一化

3.6特征选择和过滤

3.7主成分分析

3.7.1非负矩阵分解

3.7.2稀疏PCA

3.7.3核PCA

3.8独立成分分析

3.9原子提取和字典学习

3.10使用t-SNE可视化高维数据集

3.11本章小结

第4章回归算法

4.1线性模型

4.2一个二维的例子

4.3基于scikit-learn的线性回归和更高维

4.3.1决定系数

4.3.2可解释方差

4.3.3回归的解析表达

4.4Ridge回归、Lasso回归和ElasticNet

4.4.1Ridge回归

4.4.2Lasso回归

4.4.3ElasticNet

4.5稳健回归

4.5.1随机抽样一致算法

4.5.2Huber回归

4.6贝叶斯回归

4.7多项式回归

4.8保序回归

4.9本章小结

第5章线性分类算法

5.1线性分类

5.2逻辑回归

5.3实现和优化

5.4随机梯度下降算法

5.5被动攻击算法

5.6通过网格搜索找到最优超参数

5.7评估分类的指标

5.7.1混淆矩阵

5.7.2精确率

5.7.3召回率

5.7.4F-Beta

5.7.5Kappa系数

5.7.6分类报告

5.7.7学习曲线

5.8ROC曲线

5.9本章小结

第6章朴素贝叶斯和判别分析

6.1贝叶斯定理

6.2朴素贝叶斯分类器

6.3scikit-learn中的朴素贝叶斯

6.3.1伯努利朴素贝叶斯

6.3.2多项式朴素贝叶斯

6.3.3高斯朴素贝叶斯

6.4判别分析

6.5本章小结

第7章支持向量机

7.1线性支持向量机

7.2scikit-learn实现

7.3基于内核的分类

7.3.1径向基函数

7.3.2多项式核

7.3.3Sigmoid核

7.3.4自定义核

7.3.5非线性例子

7.4受控支持向量机

7.5支持向量回归

7.6半监督支持向量机简介

7.7本章小结

第8章决策树和集成学习

8.1二元决策树

8.1.1二元决策

8.1.2不纯度的衡量

8.1.3特征重要度

8.2基于scikit-learn的决策树分类

8.3决策树回归

8.4集成学习简介

8.4.1随机森林

8.4.2AdaBoost

8.4.3梯度树提升

8.4.4投票分类器

8.5本章小结

第9章聚类原理

9.1聚类基础

9.2k-NN算法

9.3高斯混合

9.4k-means

9.5基于样本标记的评价方法

9.5.1同质性

9.5.2完整性

9.5.3修正兰德指数

9.6本章小结

第10章高级聚类

10.1DBSCAN

10.2谱聚类

10.3在线聚类

10.3.1mini-batch k-means

10.3.2BIRCH

10.4双聚类

10.5本章小结

第11章层次聚类

11.1分层策略

11.2凝聚聚类

11.2.1树形图

11.2.2scikit-learn中的凝聚聚类

11.2.3连接限制

11.3本章小结

第12章推荐系统介绍

12.1朴素的基于用户的系统

12.2基于内容的系统

12.3无模式(或基于内存的)协同过滤

12.4基于模型的协同过滤

12.4.1奇异值分解策略

12.4.2交替最小二乘法策略

12.4.3用Apache Spark MLlib实现交替最小二乘法策略

12.5本章小结

第13章自然语言处理简介

13.1NLTK和内置语料库

13.2词袋策略

13.2.1标记

13.2.2停止词的删除

13.2.3词干抽取

13.2.4向量化

13.3词性

13.4示例文本分类器

13.5本章小结

第14章NLP中的主题建模与情感分析

14.1主题建模

14.1.1隐性语义分析

14.1.2概率隐性语义分析

14.1.3隐性狄利克雷分配

14.2使用Gensim的Word2vec简介

14.3情感分析

14.4本章小结

第15章神经网络介绍

15.1深度学习简介

15.2基于Keras的MLP

15.3本章小结

第16章高级深度学习模型

16.1深层结构

16.2基于Keras的深度卷积网络示例

16.3基于Kears的LSTM网络示例

16.4TensorFlow简介

16.4.1梯度计算

16.4.2逻辑回归

16.4.3用多层感知器进行分类

16.4.4图像卷积

16.5本章小结

第17章创建机器学习架构

17.1机器学习框架

17.1.1数据收集

17.1.2归一化

17.1.3降维

17.1.4数据扩充

17.1.5数据转换

17.1.6建模、网格搜索和交叉验证

17.1.7可视化

17.1.8GPU支持

17.1.9分布式架构简介

17.2用于机器学习架构的scikit-learn工具

17.2.1管道

17.2.2特征联合

17.3本章小结