项目特色
依托国内电商巨头的实际业务场景,引入海量的真实点击数据和业务数据,紧跟大数据主流技术需求,配备AI辅助开发技巧详解,拥有丰富的数据仓库功能模块。
学习目标
- 全面了解数据仓库建模理论
- 充分熟悉电商行业数据分析指标体系
- 快速掌握多种大数据技术框架
- 了解认识多种数据仓库技术模块、掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
DataX
Maxwell
Kafka
Spark
DolphinScheduler
SpringBoot
Echart
SuperSet
Kylin
Presto
Ranger
项目特色
参考众多大厂的实时数仓项目的经典架构研发推出,采用当前主流的实时数据流处理框架Flink作为主要计算引擎,涉及多种实时计算关键技术,新增AI辅助开发技巧的讲解,全面满足企业对实时开发的要求。
学习目标
- 了解实时数据仓库的建模理论
- 灵活应用Flink的流式计算技术,多种技术框架协调配合
- 灵活应用AI,提升开发效率
- 优化项目代码,融汇贯通整个大数据开发的关键技术
主要技术栈
Flume
Maxwell
Kafka
Flink
HBase
Phoenix
Redis
ClickHouse
SpringBoot
SugarBI
项目特色
基于在线教育行业的实际业务场景,引入海量的真实点击数据和业务数据,紧跟大数据的主流技术需求,穿插AI辅助开发技巧讲解,搭建了一整套完整的离线数据仓库和实时数据仓库。
学习目标
- 充分了解在线教育行业的业务数据体系,熟悉在线教育行业的离线指标体系
-
熟悉在线教育行业的实时指标体系,充分掌握多种大数据技术框架的协调应用,充分掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
DataX
Maxwell
Kafka
Spark
DolphinScheduler
SpringBoot
Echarts
SuperSet
Kylin
Presto
Ranger
Flink
HBase
Phoenix
Redis
Doris
SugarBI
项目特色
涵盖了大数据的数仓建模理论、数据处理技术手段和大数据平台搭建方法,依托真实在线听书行业的实际业务场景,展示全面的离线与实时的指标体系,配备AI辅助开发技巧详解。
学习目标
- 充分了解在线听书行业的业务数据体系,熟悉在线听书行业的离线指标体系
-
熟悉在线听书行业的实时指标体系,充分掌握多种大数据技术框架的协调应用,充分掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
Kafka
Maxwell
DataX
Hive
Spark
Flink
SugarBI
ClickHouse
Redis
HBase
Phoenix
DolphinScheduler
项目特色
站在汽车物联网数据仓库的技术前列,依托真实汽车传感器数据,展示完整的离线指标体系,搭建功能完善的离线数据仓库,熟练应用大数据技术框架。
学习目标
- 充分了解汽车物联网行业的业务数据体系
- 熟悉汽车物联网行业的离线指标体系
- 充分掌握多种大数据技术框架的协调应用
- 掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
Kafka
Maxwell
DataX
Hive
Spark
DolphinScheduler
项目特色
依托真实广告行业的实际业务场景,透彻讲解互联网广告发展历程和广告完整运营流程,展示全面的广告指标体系,学习数据分析工具,配备AI辅助开发技巧详解。
学习目标
- 全面了解数据仓库建模理论
- 充分熟悉广告行业运营流程、专业术语和数据分析指标体系
- 彻底掌握多种大数据技术框架
- 掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
DataX
Kafka
Hive
Spark
DolphinScheduler
ClickHouse
FineBI
项目特色
依托真实的金融审批行业的海量业务数据,构建离线数据仓库,依据数仓建模理论完成数据的存储、分析与调取,分析实现整套金融审批指标体系,构建指标分析仪表盘。
学习目标
- 充分了解金融审批行业的业务数据体系
- 熟悉金融审批行业的离线指标体系
- 充分掌握多种大数据技术框架的协调应用
- 掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
Kafka
Maxwell
DataX
Hive
Spark
DolphinScheduler
SuperSet
项目特色
依托真实的医疗问诊行业的海量业务数据,构建离线数据仓库,依据数仓建模理论完成数据的存储、分析与调取,分析实现整套医疗问诊指标体系,构建指标分析仪表盘。
学习目标
- 充分了解医疗问诊行业的业务数据体系
- 熟悉医疗问诊行业的离线指标体系
- 充分掌握多种大数据技术框架的协调应用
- 掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
Kafka
Maxwell
DataX
Hive
Spark
DolphinScheduler
SuperSet
项目特色
依托物流行业的真实业务场景,基于目前各大互联网企业对于腾讯云EMR架构体系的需求,将整个电商的数据仓库体系搭建在腾讯云架构上。课程中穿插对AI辅助开发技巧详细讲解,令AI真正赋能大数据开发。
学习目标
- 掌握腾讯云常用大数据技术框架的使用、选型和购买
- 掌握基于腾讯云EMR进行离线数据仓库和利用EMR进行实时数据仓库的搭建
- 充分掌握AI辅助开发技巧
主要技术栈
腾讯云EMR中的Hive
Spark
Hadoop
Flink
Flume
Kafka
项目特色
依托国内电商巨头的真实业务场景,基于目前各大互联网企业对于阿里云架构体系的需求,将整个电商的数据仓库体系搭建在阿里云架构上,做到全项目全流程上云。
学习目标
- 掌握阿里云常用大数据技术框架
- 掌握基于阿里云服务器进行离线数据仓库和实时数据仓库的搭建
主要技术栈
Flume
RDS
DataHub
DataWorks
DataV
QuickBI
Flink
MaxCompute
项目特色
该项目是一个完整可落地的湖仓一体项目,依托真实电商行业的海量数据集,充分利用Hudi,将数据湖概念与数仓建模理论融汇贯通,将Hudi与其他主要大数据框架充分集成。
学习目标
- 充分了解数据湖与数据仓库的概念区别
- 熟悉数据湖的构建开发流程
- 充分掌握Hudi与多种大数据框架的协调应用
主要技术栈
Flink
Hudi
Hadoop
Flume
Kafka
FlinkCDC
Hive
Superset
项目特色
一站式搞定数据治理、血缘管理、元数据管理、数据质量监控、批处理和实时处理的可视化调度、可视化即席查询、可视化数据采集配置。
学习目标
- 掌握技术中台中的核心功能开发原理
- 掌握大数据、JavaEE和前端技术的融合
主要技术栈
SpringBoot
Vue
ClickHouse
Presto
Spark
Hive
Flink
DolphinScheduler
项目特色
着眼于用数字化的标签描述用户个性特征、勾画目标用户,实现了从标签定义、标签任务处理、任务调度、任务监控、用户分区、用户洞察的全功能平台化管理。
学习目标
- 充分理解用户画像管理平台的搭建及使用
- 了解用户画像系统的设计思路
- 掌握标签的设计流程及应用
- 初步了解机器学习算法
主要技术栈
Spark MLib
ClickHouse
Redis
Vue
SpringBoot
MyBatis
项目特色
依托于真实的中文亚马逊电商数据集,以及真实的电商企业业务数据体系,构建了符合教学体系的一体化电商推荐系统,充分理解推荐系统的运作流程,拓宽技术视野。
学习目标
- 系统性梳理整合大数据技术知识与机器学习相关知识
- 深入了解推荐系统在电商企业中的实际应用
- 深入学习并掌握多种推荐算法
主要技术栈
Flume
Kafka
MongoDB
Spark Streaming
ElasticSearch
Git
Redis
项目特色
依托企业级真实的实时数据分析环境,对目前互联网大厂中常见的实时分析场景提出了一套基于SparkStreaming的全面实用的技术解决方案,丰富实时技术栈。
学习目标
- 全面掌握Scala语言开发Spark的实时计算任务的开发技巧
- 了解使用不同的CDC框架,提升实时方向的项目开发经验
主要技术栈
Flume
Canal
Maxwell
Kafka
SparkStreaming
HBase
Phoenix
Redis
ElasticSearch
Kibana
SpringBoot
SugarBI
项目特色
依托真实的彩票行业的海量业务数据,构建离线数据仓库,依据数仓建模理论完成数据的存储、分析与调取,分析实现整套彩票指标体系,构建指标分析仪表盘。
学习目标
- 充分了解彩票行业的业务数据体系
- 熟悉彩票行业的离线指标体系
- 充分掌握多种大数据技术框架的协调应用
- 掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
Kafka
Maxwell
DataX
Hive
Spark
DolphinScheduler
SuperSet
项目特色
依托真实的保险行业的海量业务数据,构建离线数据仓库,依据数仓建模理论完成数据的存储、分析与调取,分析实现整套保险指标体系,构建指标分析仪表盘。
学习目标
- 充分了解保险行业的业务数据体系
- 熟悉保险行业的离线指标体系
- 充分掌握多种大数据技术框架的协调应用
- 掌握AI辅助开发技巧
主要技术栈
Hadoop
Flume
Kafka
Maxwell
DataX
Hive
Spark
DolphinScheduler
SuperSet
项目特色
该项目是一个完整可落地的流批一体项目,依托真实电商行业的海量数据集,充分利用Doris,将Doris概念与数仓建模理论融汇贯通,将Doris与其他主要大数据框架充分集成。
学习目标
- 充分了解流批一体与数据仓库的区别
- 熟悉流批一体的构建开发流程
- 充分掌握Doris与多种大数据框架的协调应用
主要技术栈
Flink
Doris
SeaTunnel
DolphinScheduler
FineBI