本套视频教程是基于Hive on Spark版本的离线数仓调优指南,通过对Yarn配置、Spark配置、Hive SQL中聚合优化、分组优化和并行度优化等方式,结合代码和具体参数详细介绍如何进行离线数仓的调优。
教程特色:一、真实,采用阿里云服务器,配置拉满;二、数据体量大,以电商表为模板,单表数据量达160G;三、调优手段多,从聚合、Join等多方面着手,调优效果明显。
学习前置知识:Hive、Spark、离线数仓。