| 作 者: | 刘科峰 |
| 出版社: | 机械工业出版社 |
| 丛编项: | |
| 版权说明: | 本书为公共版权或经版权方授权,请支持正版图书 |
| 标 签: | 暂缺 |
| ISBN | 出版时间 | 包装 | 开本 | 页数 | 字数 |
|---|---|---|---|---|---|
| 未知 | 暂无 | 暂无 | 未知 | 0 | 暂无 |
前言第1章Hadoop概述1.1大数据简介1.2Hadoop简介1.3Hadoop特性1.4Hadoop核心组件1.4.1HDFS1.4.2MapReduce1.4.3YARN1.5Hadoop生态系统1.5.1HBase1.5.2Hive1.5.3Pig1.5.4Spark1.5.5ZooKeeper1.5.6Sqoop1.5.7Flume1.5.8Mahout1.5.9Ambari1.6本章小结习题第2章Hadoop伪分布式安装2.1Linux操作系统2.1.1概述2.1.2Linux的组成2....
Workstation2.2.2在VMware上安装CentOS
72.2.3配置CentOS
72.3Hadoop伪分布式安装与配置2.3.1安装WinSCP2.3.2安装JDK2.3.3安装Hadoop2.4本章小结习题实验Hadoop伪分布式安装与配置第3章Hadoop分布式文件系统HDFS3.1HDFS的架构和原理3.1.1计算机集群结构3.1.2HDFS的假设前提和设计目标3.1.3HDFS的相关概念3.1.4HDFS体系结构3.1.5HDFS存储原理3.2HDFS
Shell3.3HDFS
Java
API3.3.1搭建Linux操作系统下的Eclipse开发环境3.3.2HDFS
Java
API常用的类3.3.3HDFS
Java
API
编程3.4本章小结习题实验HDFS基本命令的使用和HDFS的Java编程第4章分布式计算框架MapReduce4.1认识MapReduce4.1.1分布式并行编程4.1.2MapReduce核心思想4.1.3MapReduce运行环境4.1.4Hadoop内置数据类型4.2MapReduce工作流程4.2.1MapReduce工作流程概述4.2.2Shuffle过程分析4.3MapReduce入门示例:WordCount4.3.1WordCount程序任务4.3.2准备被统计的文件4.3.3Word...
Shell5.5.1HBase
Shell常用命令5.5.2HBase
Shell应用实例5.6HBase
Java
API5.6.1HBase
Java
API
简介5.6.2HBase
Java
API
编程5.7本章小结习题实验HBase编程实践第6章数据仓库Hive6.1概述6.1.1数据仓库简介6.1.2Hive简介6.1.3Hive与关系型数据库的区别6.1.4Hive系统架构6.2Hive伪分布式安装6.2.1MySQL的安装和配置6.2.2Hive的安装和配置6.3Hive编程基础6.3.1Hive的数据类型6.3.2数据库相关操作6.3.3表相关操作6.3.4表中数据的加载6.3.5HiveQL基本查询6.3.6Hive函数6.4Hive编程实例6.4.1雇员表统计6.4.2词频统计6...
Shell的启动和退出7.4.2RDD创建7.4.3常用的RDD操作7.4.4RDD编程实例7.5IDEA的安装和使用7.5.1IDEA的安装7.5.2IDEA的使用7.5.3独立应用程序实例7.6本章小结习题实验Spark
Shell交互式编程参考文献