| ISBN | 出版时间 | 包装 | 开本 | 页数 | 字数 |
|---|---|---|---|---|---|
| 未知 | 暂无 | 暂无 | 未知 | 0 | 暂无 |
前言
第1章 概论
1.1 揭秘大数据
1.1.1 大数据概念和特征
1.1.2 大数据的计量
1.1.3 大数据生命周期
1.1.4 大数据与云计算
1.1.5 大数据时代的重大变革
1.2 大数据关键技术
练习1
第2章 大数据生态系统
2.1 Hadoop
2.1.1 Hadoop简介
2.1.2 Hadoop优势
2.2 HDFS
2.2.1 HDFS体系结构
2.2.2 HDFS存储原理
2.2.3 HDFS常用操作
2.3 MapReduce
2.3.1 MapReduce简介
2.3.2 MapReduce的适用场景
2.3.3 MapReduce的优点和缺点
2.4 大数据编程语言
2.4.1 Python
2.4.2 Spark
2.4.3 R语言
练习2
第3章 大数据采集与预处理
3.1 数据采集
3.1.1 数据采集分类
3.1.2 数据采集方法
3.1.3 数据采集工具
3.2 数据清洗
3.2.1 数据清洗任务
3.2.2 数据清洗过程
3.3 数据变换
3.3.1 规范化
3.3.2 数据变换分类
3.4 数据分析与采集实例:线性回归和逻辑回归
练习3
第4章 数据挖掘与分析
4.1 大数据分析概述
4.1.1 数据分析原则
4.1.2 大数据分析特点
4.1.3 大数据分析流程
4.1.4 数据分析师基本技能和素质
4.1.5 大数据分析难点
4.2 数据认知
4.2.1 数据预处理
4.2.2 概率分析