前言

大数据核心技术系列教材是为大数据技术学习者量身打造的学习用书,可实现对大数据领域核心技能的全面覆盖。

本书面向对大数据技术感兴趣的学习者,旨在帮助读者理解Hive的工作原理,掌握使用Hive进行大数据处理与分析的能力。

本书的写作背景

数据仓库是为企业所有级别的决策制定过程,并提供所有类型数据支持的战略集合,是企业大数据系统的重要组成部分。Hive是目前企业中使用很广泛的数据仓库工具。开发人员在Hive中可以通过使用类SQL语句实现MapReduce快速统计,进而提高大数据开发效率。

如今Hive应用已经成为了大数据开发人员必须要掌握的核心技能之一。本书将全方位讲解Hadoop数据仓库解决方案Hive的应用方法,并通过提供丰富的案例、练习和项目,提炼大量的业务需求,强化读者的项目实战能力。

Hive学习路线图

为了帮助读者快速了解本书的知识结构,我们整理了本书的学习路线图,如下所示。

本书特色

1. 贯穿项目与实战项目相结合

贯穿项目:雇员信息、零售数据分析贯穿每章,及时巩固Hive各知识点。

实战项目:电商消费数据分析综合实训,提升Hive企业级应用开发能力。

2. 教学资源丰富多样

配套素材及示例代码。

每章课后作业及答案。

重难点内容讲解视频(扫码直接观看)。

3. 学习效果随时可测

每章提供“本章目标”及“重难点”,助力读者确定学习要点。

课后作业辅助读者巩固阶段性学习内容。

课工场题库助力在线测试。

读者对象

大数据技术相关从业人员。

大数据技术的相关爱好者和自学者。

各类高校及培训机构中大数据相关专业的教师和学生。

本书由课工场大数据开发教研团队组织编写,参与编写的还有兰伟、廖春琼、刘兵、李永明、胡淑新等院校老师。尽管编者在写作过程中力求准确、完善,但书中不妥之处仍在所难免,殷切希望广大读者批评指正!