Hive性能调优实战

Hive性能调优实战
作 者: 林志煌
出版社: 机械工业出版社
丛编项:
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: 暂缺
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

  林志煌曾在中国互联网头部公司长期从事大数据相关项目的研发。擅长并能够熟练使用Hive、MapReduce和Spark等大数据相关技术。经手过日数据流量TB级别和总量PB级别的Hadoop大数据平台建设。从事过数据采集、数据清洗、数据仓库模型构建及数据产品研发等工作,涵盖了数据生命周期的主要阶段。

内容简介

《Hive性能调优实战》旨在介绍如何进行Hive性能调优,以及调优时所涉及的工具。书中重点介绍了Hive性能调优所涉及的Hadoop组件和Hive工具。考虑到很多调优方法的着眼点有一定的相似性,这些调优方法可以适用于多个Hive版本,所以《Hive性能调优实战》在介绍Hive的相关内容时会穿插Hive 1.x、Hive 2.x及Hive 3.x等多个版本的内容。 《Hive性能调优实战》共11章,涵盖的内容如下: 举例感受Hive性能调优的多样性 Hive问题排查与调优思路 环境搭建 Hive及其相关大数据组件 深入MapReduce计算引擎 Hive SQL执行计划 Hive数据处理模式 YARN日志 数据存储 发现并优化Hive中的性能问题 Hive知识体系总结 《Hive性能调优实战》内容实用,非常适合对大数据技术感兴趣的读者阅读,尤其是Hive进阶读者。另外,《Hive性能调优实战》还适合IT培训机构的大数据培训学员和高校相关专业的学生阅读。

图书目录

第1章 举例感受Hive性能调优的多样性 1 1.1 感受改写SQL对性能的影响 1 1.1.1 数据准备 1 1.1.2 union案例 4 1.1.3 改写SQL实现union的优化 5 1.1.4 失败的union调优 8 1.2 感受调整数据块大小对性能的影响 10 1.2.1 数据准备 11 1.2.2 案例比较 11 1.3 感受不同数据格式对性能的提升 15 1.3.1 数据准备 15 1.3.2 案例比较 16 1.4 感受不同的表设计对性能的影响 18 1.4.1 数据准备 19 ...