| 作 者: | 猿媛之家 |
| 出版社: | 机械工业出版社 |
| 丛编项: | |
| 版权说明: | 本书为公共版权或经版权方授权,请支持正版图书 |
| 标 签: | 暂缺 |
| ISBN | 出版时间 | 包装 | 开本 | 页数 | 字数 |
|---|---|---|---|---|---|
| 未知 | 暂无 | 暂无 | 未知 | 0 | 暂无 |
前言
环境搭建视频教程二维码清单
第1章大数据简介
1.1大数据的概述
1.2大数据的特点
1.3大数据的应用领域
1.4目前企业应用的主流大数据技术
1.5大数据开发流程
第2章大数据基础架构Hadoop
2.1Hadoop简介
2.2Hadoop架构详解
2.2.1分布式存储系统HDFS
2.2.2分布式资源管理框架YARN
2.2.3离线计算框架MapReduce
2.3HDFS读、写文件流程
2.3.1HDFS写文件流程
2.3.2HDFS读文件流程
2.4HDFS的实战操作
2.4.1HDFS上传文件
2.4.2HDFS创建文件
2.4.3HDFS创建目录
2.4.4HDFS重命名文件
2.4.5HDFS删除文件
2.5YARN原理
2.6YARN调度器详解
2.7MapReduce工作原理
2.8MapReduce核心的原理Shuffle
2.8.1Map端
2.8.2Reduce端
2.9MapReduce常用三大组件
2.9.1MapReduce中的Partitioner
2.9.2MapReduce中的Sort
2.9.3MapReduce中的Combiner
2.10MapReduce项目实战
2.10.1清洗日志
2.10.2统计电影最高评分
第3章分布式协调服务Zookeeper
3.1ZooKeeper简介
3.2ZooKeeper结构和工作原理
3.2.1ZooKeeper集群角色
3.2.2ZooKeeper的数据结构
3.2.3ZooKeeper的工作流程
3.2.4ZooKeeper的监听器
3.3ZooKeeper实战
3.3.1ZooKeeper创建持久节点
3.3.2ZooKeeper创建临时节点
3.3.3ZooKeeper递归创建节点
3.3.4ZooKeeper读取数据
3.3.5ZooKeeper更新数据
3.3.6ZooKeeper监听节点
3.3.7ZooKeeper监听子节点
3.3.8ZooKeeper实现服务注册与发现
第4章数据仓库Hive
4.1Hive简介和特点
4.2Hive结构和原理
4.2.1Hive结构
4.2.2Hive运行的流程
4.2.3Hive的HQL转换过程
4.3电商用户行为分析
4.3.1项目背景及目的
4.3.2数据导入
4.3.3数据清洗
4.3.4数据分析
第5章面向列的数据库HBase
5.1HBase简介
5.2HBase架构
5.2.1HBase的组件
5.2.2HBase工作机制
5.3HBase数据模型
5.4HBase读写流程
5.4.1HBase写操作流程
5.4.2HBase读操作流程
5.5HBase的API示例
5.5.1HBase创建表
5.5.2HBase保持数据
5.5.3HBase更新数据
5.5.4HBase获取数据
5.5.5HBase删除数据
5.5.6使用HBase获取某一行数据
5.6HBase存储订单案例
第6章大数据开发实战数据迁移工具Sqoop
6.1Sqoop架构和工作原理
6.1.1Sqoop导入原理
6.1.2Sqoop导出原理
6.2Sqoop将HDFS数据导入MySQL
6.3Sqoop将MySQL数据导入HDFS
第7章数据采集工具Flume
7.1Flume简介
7.2Flume构成和工作原理
7.2.1Flume构成
7.2.2Flume工作原理
7.3Flume实战
7.3.1Flume监听目录实战
7.3.2Flume一对多实战
7.3.3Flume拦截器实战
7.3.4Flume采集数据到HDFS
7.3.5Kafka对接Flume实战
第8章发布订阅消息系统Kafka
8.1Kafka 简介
8.2Kafka的消息生产者
8.2.1Kafka生产者的运行流程
8.2.2Kafka生产者分区
8.2.3副本的同步复制和异步复制
8.2.4Kafka消息发送确认机制
8.3Kafka的Broker保存消息
8.3.1存储方式与策略
8.3.2Topic创建与删除
8.4Kafka的消息消费者
8.4.1消费机制
8.4.2消费者组
8.5Kafka 的存储机制
8.5.1Kafka主题Topic
8.5.2Kafka分片Partition
8.5.3Kafka日志Segment File
8.6Kafka 实战
8.6.1Kafka发送消息
8.6.2Kafka自定义分区发送消息
8.6.3Spring Boot整合Kafka发送消息
第9章数据处理分析引擎Spark
9.1Spark 简介
9.2Spark 运行原理
9.2.1Spark的基本概念
9.2.2Spark运行的原理
9.2.3Driver运行在Client
9.2.4Driver运行在Worker节点
9.3Spark算子RDD
9.3.1RDD的属性
9.3.2RDD的依赖关系
9.3.3RDD的shuffle过程
9.3.4RDD的缓存和检查机制
9.4Spark SQL
9.4.1Spark SQL概念
9.4.2Spark SQL的架构
9.4.3DataSets和DataFrames
9.4.4Spark SQL示例
9.5Spark Streaming
9.5.1Spark Streaming介绍/9.5.2DStream转换操作
9.5.3Spark Streaming窗口操作
9.5.4DStream输入
9.5.5DStream 输出
9.5.6DSFrame和SQL操作
9.5.7Spark Streaming检查点
9.6Spark Streaming接收Flume数据实战
9.7Spark Streaming接收Kafka数据实战
第10章全文搜索引擎Elasticsearch
10.1Elasticsearch简介
10.2Elasticsearch架构和原理
10.2.1Elasticsearch核心概念
10.2.2Elasticsearch工作原理
10.2.3Elasticsearch倒排索引
10.3Elasticsearch实战
10.3.1Elasticsearch索引创建
10.3.2Elasticsearch索引更新
10.3.3Elasticsearch索引查询
10.3.4Elasticsearch索引删除
10.3.5Elasticsearch保存文档
10.3.6Elasticsearch更新文档
10.3.7Elasticsearch精确查询
10.3.8Elasticsearch模糊查询
10.3.9Elasticsearch范围查询
10.3.10Elasticsearch布尔查询
10.3.11Elasticsearch聚合查询
10.3.12Elasticsearch高亮查询
10.4Elasticsearch实现搜索系统
10.4.1搜索系统项目环境准备
10.4.2Elasticsearch实现搜索功能
第11章分布式处理引擎Flink
11.1Flink 概述
11.2Flink基本组件和运行时架构
11.2.1Flink运行时架构
11.2.2Flink的分层
11.3Flink流处理流程
11.3.1Flink环境设置(Environment)
11.3.2Flink源算子(Source)
11.3.3Flink支持的数据类型
11.3.4