尚硅谷Java培训

数据湖Iceberg

视频介绍

Iceberg是由Netflix开发的面向海量数据分析场景的数据组织形式,在众多数据湖技术中独树一帜,目前已经晋升Apache重要项目,是各大互联网公司的优选数据湖技术,腾讯即选择了Iceberg作为数据湖存储引擎。

本套教程由尚硅谷联合Iceberg开发团队共同推出。从Iceberg的技术特点和存储结构入手展开讲解,详细介绍了与大数据主流框架的集成与使用,包括Hive、Spark SQL、Flink SQL、Flink DataStream,从简单的安装配置,到详细的日常操作,再到解决集成中的各种问题,实用更实战!

教程延续了尚硅谷一贯的风格:保姆式讲解,败家式赠送。课程由浅入深,从理论到实操涵盖全面,手把手教学,视频、代码、笔记、资料,一股脑全部送送送!

视频目录 选集

  • 01.Iceberg_课程介绍
  • 02.Iceberg简介_概述
  • 03.Iceberg简介_特性
  • 04.Iceberg简介_其他数据湖框架的对比
  • 05.Iceberg存储结构_基本概念
  • 06.Iceberg存储结构_查询流程分析
  • 07.Iceberg与Hive集成_版本对应关系
  • 08.Iceberg与Hive集成_环境准备
  • 09.Iceberg与HIve集成_Catalog说明
  • 10.Iceberg与Hive集成_使用默认Catalog
  • 11.Iceberg与Hive集成_指定Catalog演示
  • 12.Iceberg与Hive集成_指定路径加载表
  • 13.Iceberg与Hive集成_创建表
  • 14.Iceberg与Hive集成_修改&插入&删除
  • 15.Iceberg与SparkSQL集成_环境准备
  • 16.Iceberg与SparkSQL集成_创建Catalog
  • 17.Iceberg与SparkSQL集成_创建分区表&隐藏分区
  • 18.Iceberg与SparkSQL集成_使用CTAS和REPLACE建表
  • 19.Iceberg与SparkSQL集成_删除表
  • 20.Iceberg与SparkSQL集成_修改表
  • 21.Iceberg与SparkSQL集成_添加列
  • 22.Iceberg与SparkSQL集成_修改和删除列
  • 23.Iceberg与SparkSQL集成_修改分区
  • 24.Iceberg与SparkSQL集成_插入MERGE INTO&查询元数据
  • 25.Iceberg与SparkSQL集成_存储过程调用
  • 26.Iceberg与DF API集成_环境准备
  • 27.Iceberg与DF API集成_读取表
  • 28.Iceberg与DF API集成_检查表
  • 29.Iceberg与DF API集成_写入表
  • 30.Iceberg与DF API集成_维护表_获取Table对象
  • 31.Iceberg与DF API集成_维护表_快照过期清理
  • 32.Iceberg与DF API集成_维护表_清理无效文件&合并小文件
  • 33.Iceberg与FlinkSQL集成_环境准备
  • 34.Iceberg与FLinkSQL集成_创建Catalog
  • 35.Iceberg与FlinkSQL集成_建表及限制
  • 36.Iceberg与FlinkSQL集成_修改表和删除表
  • 37.Iceberg与FlinkSQL集成_插入表&upsert问题分析
  • 38.Iceberg与FlinkSQL集成_流式链路问题分析对比
  • 39.Iceberg与FlinkSQL集成_与Flink集成的不足
  • 40.Iceberg与Flink DataStream集成_环境准备
  • 41.Iceberg与Flink DataStream集成_读取数据
  • 42.Iceberg与Flink DataStream集成_FLIP-27方式读取
  • 43.Iceberg与Flink DataStream集成_写入数据
  • 44.Iceberg与Flink DataStream集成_合并文件&元数据管理API