| ISBN | 出版时间 | 包装 | 开本 | 页数 | 字数 |
|---|---|---|---|---|---|
| 未知 | 暂无 | 暂无 | 未知 | 0 | 暂无 |
第 1 章 Apache Spark 简介
1.1 Apache Spark 的历史与现状
1.2 安装和运行 Apache Spark
1.3 Apache Spark 编程简介
1.4 Scala 语言简介
1.4.1 Scala 开发环境配置及 IntelliJ IDEA
1.4.2 Scala 编程简介
1.4.3 PySpark 编程简介
1.5 Spark 编程
1.5.1 Spark 系统简介
1.5.2 弹性分布式数据集
1.5.3 RDD 文件上的操作
1.5.4 Spark 中两个抽象概念
1.6 公共数据集
第 2 章 Breeze 程序包
2.1 创建向量、矩阵及其简单计算
2.2 整行或整列的运算
2.3 常用数学计算
2.4 常用分布
2.5 基于 Breeze 包的分布式计算
第 3 章 随机模拟和统计推断
3.1 随机数的产生
3.1.1 逆累积分布函数法
3.1.2 拒绝法
3.1.3 示例:从回归模型中模拟数据
3.2 EM 优化
3.2.1 EM 算法
3.2.2 收敛性分析
3.2.3 分布式 EM 算法
3.2.4 示例:高斯混合模型
第 4 章 马尔科夫链蒙特卡洛方法
4.1 Metropolis-Hastings 算法
4.2 Slice 取样法
4.3 Gibbs 取样法
第 5 章 优化算法
5.1 数值计算方法
5.1.1 (随机) 梯度下降算法
5.1.2 示例:分布式的线性回归估计
5.2 近端梯度算法
5.2.1 算法介绍
5.2.2 示例:基于近端梯度算法的分布式 Lasso 回归参数估计
5.3 交替方向乘子法
5.3.1 算法介绍
5.3.2 示例:分位数回归分布式参数估计
5.4 有限内存 BFGS 算法
第 6 章 自举法
6.1 自由自举法
6.2 子集合自举法
第 7 章 常用统计机器学习方法
7.1 聚类分析
7.1.1 K 组中心法
7.1.2 隐狄利克雷分配法
7.1.3 功效迭代聚类法
7.2 分类分析
7.2.1 逻辑回归
7.2.2 线性支持向量机
7.2.3 线性判别分析
7.2.4 决策树
7.3 数据降维
7.3.1 基于正则化的稀疏性方法
7.3.2 示例:SCAD、MCP 等正则化项的 Scala 代码实现
7.3.3 主成分分析
7.3.4 奇异值分解
7.3.5 示例:基于分布式计算的主成分分析
7.4 集成学习方法
7.4.1 基于 Bagging 算法――以随机森林为例
7.4.2 基于 Boosting 算法――以 AdaBoost 为例
7.4.3 基于树的集成学习算法
7.4.4 示例:航班延误预测分类
第 8 章 主流分布式算法简介
8.1 分治法
8.1.1 算法思想介绍
8.1.2 分治法在统计学习中的应用
8.1.3 示例:线性支持向量机
8.2 基于梯度更新的分布式算法
8.2.1 算法介绍
8.2.2 示例:基于近端梯度算法的 Lasso 问题求解
8.2.3 示例:非参数岭回归
8.3 联邦学习算法简介
8.3.1 算法分类
8.3.2 联邦平均算法介绍
8.3.3 安全联邦线性回归
第 9 章 案例集
9.1 案例一:基于 MM 算法和 EM 算法的负二项分布参数估计
9.1.1 负二项分布
9.1.2 MM 算法的负二项分布参数估计求解
9.1.3 EM 算法的负二项分布参数估计求解
9.1.4 数值模拟
9.1.5 实证分析
9.1.6 结论
9.1.7 源码附录
9.2 案例二:基于 EM 算法的混合指数分布参数估计
9.2.1 混合指数分布简介
9.2.2 EM 算法
9.2.3 Spark 实现
9.2.4 效果评估
9.2.5 源码附录
9.3 案例三:基于 EM 算法的有限混合泊松分布的参数估计
9.3.1 有限混合泊松分布简介
9.3.2 参数估计的 EM 算法
9.3.3 EM 加速算法――均方外推算法
9.3.4 实验设计
9.3.5 SQUAREM 加速算法比较
9.3.6 源码附录
9.4 案例四:基于不同优化算法的逻辑回归模型参数的估计
9.4.1 常用优化算法简介
9.4.2 逻辑回归模型简介
9.4.3 模拟数据应用不同优化算法的分布式实现及比较
9.4.4 源码附录
参考文献