尚硅谷·大数据项目Flink实时数仓

尚硅谷·大数据项目Flink实时数仓

课程简介

在大数据处理领域,实时和离线各占非常大的比重,本套视频教程综合展示实时数据处理领域的一个重要应用:实时数仓项目。项目从数据采集开始,分别讲解了针对不同数据采取的不同采集策略,使用的不同数据采集工具。在数据处理部分,将实时采集的数据按照数据建模要求进行合理分层,使用当前最火热的实时计算引擎Flink,对实时计算结果进行可视化展示。

内容包括:搭建用户行为数据的实时数据采集框架Flume-Kafka-Flink;采用Canal、Maxwell、Flink CDC三种方案实现业务数据的实时采集;分层搭建实时数据仓库,包括ODS层、DWD层、DIM层、DWM层、DWS层、ADS层;数据可视化接口的实现;ClickHouse技术的深入讲解……

每一部分讲解均参照实际开发环境,提供了多种问题的解决方案,引导学员对问题进行更深层的思考。通过本套教程的学习,你将掌握企业实际开发中实时数仓搭建的全流程,深入理解Flink的高阶应用实例,掌握开发环节多种框架技术。教程总计40小时+,附赠全部视频、代码、笔记及资料。

教程涵盖的关键技术点:

数仓架构深入讲解、离线架构与实时架构对比分析、SpringBoot项目搭建讲解、Nginx安装配置使用、Flink CDC深入案例分析、Maxwell与Canal对比分析、使用侧输出流分流操作、Flink与HBase交互、Flink状态编程应用、Flink CEP循环模式匹配、双流join、旁路缓存、异步IO编码、ClickHouse多引擎讲解、Flink SQL、数据可视化接口编写、Flink实战优化方案等。

课程目录

001-课程介绍

002-项目介绍

003-采集模块-课程介绍

004-采集模块-数仓分层之为什么分层

005-采集模块-数仓分层之分层明细

006-采集模块-整体需求介绍

007-采集模块-离线架构分析之Sqoop&Flume

008-采集模块-离线架构分析之FlumeTairDirSource问题提出&解决

009-采集模块-离线架构分析之Kafka

010-采集模块-离线架构分析之其他

011-采集模块-实时架构分析

012-采集模块-架构对比

013-采集模块-日志数据采集之需求分析

014-采集模块-日志数据采集之MockJar包测试

015-采集模块-日志数据采集之SpringBoot简单介绍

016-采集模块-日志数据采集之SpringBoot创建项目&简单测试

017-采集模块-日志数据采集之SpringBoot创建项目&加参数测试

018-采集模块-日志数据采集之数据落盘&写入Kafka 编码

019-采集模块-日志数据采集之数据落盘&写入Kafka 本地测试

020-采集模块-日志数据采集之数据落盘&写入Kafka 单机测试

021-采集模块-日志数据采集之Nginx 介绍

022-采集模块-日志数据采集之Nginx 安装&启动

023-采集模块-日志数据采集之Nginx 配置负载均衡&测试

024-采集模块-日志数据采集之集群测试

025-采集模块-业务数据采集之建库&建表

026-采集模块-业务数据采集之FlinkCDC 什么是CDC&对比

027-采集模块-业务数据采集之FlinkCDC 介绍

028-采集模块-业务数据采集之FlinkCDC DataStream方式 编码

029-采集模块-业务数据采集之FlinkCDC DataStream方式 测试

030-采集模块-业务数据采集之FlinkCDC DataStreamAPI 设置CK&打包&开启集群

031-采集模块-业务数据采集之FlinkCDC DataStreamAPI 打包进行断点续传测

032-采集模块-业务数据采集之FlinkCDC FlinkSQLAPI 编码&测试

033-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 格

034-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 编

035-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 代

036-采集模块-业务数据采集之FlinkCDC DataStreamAPI&FlinkSQL对比

037-采集模块-业务数据采集之Maxwell 安装说明&测试

038-采集模块-业务数据采集之Canal 安装说明&测试

039-采集模块-业务数据采集之CDC对比

040-采集模块-业务数据采集之读取MySQL数据并写入Kafka 编码

041-采集模块-业务数据采集之读取MySQL数据并写入Kafka 测试

042-DWD&DIM-课程介绍

043-DWD&DIM-行为数据 需求分析

044-DWD&DIM-行为数据 思路整理&消费Kafka数据

045-DWD&DIM-行为数据 将数据转换为JSON对象

046-DWD&DIM-行为数据 新老用户校验

047-DWD&DIM-行为数据 侧输出流&写入Kafka

048-DWD&DIM-行为数据 测试

049-DWD&DIM-业务数据之需求分析

050-DWD&DIM-业务数据之代码逻辑梳理

051-DWD&DIM-业务数据之代码编写 消费数据并过滤

052-DWD&DIM-业务数据之代码编写 读取配置表创建广播流

053-DWD&DIM-业务数据之代码编写 配置表字段分析&建表&JavaBean

054-DWD&DIM-业务数据之代码编写 开启配置表Binlog并测试

055-DWD&DIM-业务数据之代码编写 连接主流&广播流并分析业务逻辑

056-DWD&DIM-业务数据之代码编写 创建TableProcessFunction并初始化相关参数

057-DWD&DIM-业务数据之代码编写 处理广播流数据 解析数据&建表

058-DWD&DIM-业务数据之代码编写 处理广播流数据 写入状态

059-DWD&DIM-业务数据之代码编写 处理主流数据 读取状态&过滤字段

060-DWD&DIM-业务数据之代码编写 处理主流数据 补充SinkTable&分流

061-DWD&DIM-业务数据之代码编写 检查代码

062-DWD&DIM-业务数据之代码编写 测试准备

063-DWD&DIM-业务数据之代码编写 测试

064-DWD&DIM-业务数据之代码编写 将数据写入HBase 编码

065-DWD&DIM-业务数据之代码编写 将数据写入Kafka 编码

066-DWD&DIM-业务数据之整体测试 环境准备

067-DWD&DIM-业务数据之整体测试 测试完成

068-ODS&DWD&DIM-小总结

069-ODS&DWD&DIM-SQL分享 需求说明&建表&导数据

070-ODS&DWD&DIM-SQL分享 方案一

071-ODS&DWD&DIM-SQL分享 方案二

072-ODS&DWD&DIM-SQL分享 HiveOnSpark Bug说明

073-DWM层-需求分析

074-DWM层-访客UV 需求分析

075-DWM层-访客UV 代码编写 消费数据并转换为JSON对象

076-DWM层-访客UV 代码编写 过滤数据

077-DWM层-访客UV 代码编写 设置状态超时时间防止状态过大

078-DWM层-访客UV 代码测试

079-DWM层-跳出明细 需求分析

080-DWM层-跳出明细 代码编写

081-DWM层-跳出明细 代码测试

082-DWM层-跳出明细 测试

083-DWM层-跳出明细 CEP 循环模式

084-DWM层-订单宽表 需求分析

085-DWM层-订单宽表 双流JOIN 官方文档说明

086-DWM层-订单宽表 双流JOIN 代码编写

087-DWM层-订单宽表 双流JOIN 代码测试

088-DWM层-订单宽表 代码编写 消费Kafka数据&转换JavaBean&提取事件时间

089-DWM层-订单宽表 代码编写 订单与订单明细表双流JOIN

090-DWM层-订单宽表 代码测试 准备工作

091-DWM层-订单宽表 代码测试 测试完成

092-DWM层-订单宽表 关联维度 思路梳理

093-DWM层-订单宽表 关联维度 JDBCUtil 返回值&参数说明

094-DWM层-订单宽表 关联维度 JDBCUtil 查询&封装泛型对象

095-DWM层-订单宽表 关联维度 JDBCUtil 测试

096-DWM层-订单宽表 关联维度 DimUtil封装&优化的必要性

097-DWM层-订单宽表 关联维度 优化1旁路缓存 思路分析

098-DWM层-订单宽表 关联维度 优化1旁路缓存 Redis工具类&Key的设计

099-DWM层-订单宽表 关联维度 优化1旁路缓存 代码编写

100-DWM层-订单宽表 关联维度 优化1旁路缓存 代码测试

101-DWM层-订单宽表 回顾

102-DWM层-订单宽表 关联维度 优化2 异步IO说明

103-DWM层-订单宽表 关联维度 优化2 异步IO编码步骤

104-DWM层-订单宽表 关联维度 优化2 异步IO编码 初始化函数

105-DWM层-订单宽表 关联维度 优化2 异步IO编码 异步函数完成

106-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试准备

107-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试完成

108-DWM层-订单宽表 关联维度 补充其他维度信息

109-DWM层-订单宽表 最终测试

110-DWM层-订单宽表 不丢维度数据说明

111-DWM层-支付宽表 需求分析

112-DWM层-支付宽表 代码编写

113-DWM层-支付宽表 代码测试

114-DWM层-支付宽表 时间工具类说明

115-DWS层-课程介绍

116-DWS层-访客主题宽表 需求分析

117-DWS层-访客主题宽表 思路整理&读取Kafka数据

118-DWS层-访客主题宽表 处理输出流&union&提取时间戳分组

119-DWS层-访客主题宽表 开窗&聚合

120-DWS层-访客主题宽表 打印测试

121-DWS层-ClickHouse 课程介绍

122-DWS层-ClickHouse 概述&特点

123-DWS层-ClickHouse 安装准备工作

124-DWS层-ClickHouse 安装&启动

125-DWS层-ClickHouse 数据类型

126-DWS层-ClickHouse 简单引擎介绍

127-DWS层-ClickHouse MergeTree

128-DWS层-ClickHouse MergeTree之Partition By

129-DWS层-ClickHouse MergeTree之Primary Key

130-DWS层-ClickHouse MergeTree之Order By

131-DWS层-ClickHouse MergeTree之TTL

132-DWS层-ClickHouse ReplacingMergeTree

133-DWS层-ClickHouse SummingMergeTree

134-DWS层-ClickHouse 引擎选择分析

135-DWS层-ClickHouse SQL操作 一

136-DWS层-ClickHouse SQL操作 二

137-DWS层-ClickHouse 副本机制

138-DWS层-ClickHouse 分片机制 说明

139-DWS层-ClickHouse 分片机制 实操

140-DWS层-访客主题 ClickHouseUtil 创建

141-DWS层-访客主题 ClickHouseUtil 封装

142-DWS层-访客主题 ClickHouseUtil 封装完成

143-DWS层-访客主题 ClickHouseUtil 测试完成

144-DWS层-商品主题 需求分析

145-DWS层-商品主题 JavaBean说明

146-DWS层-商品主题 代码编写 思路整理&消费数据创建流

147-DWS层-商品主题 代码编写 处理页面日志&收藏数据&购物车数据

148-DWS层-商品主题 代码编写 处理订单&支付数据

149-DWS层-商品主题 代码编写 处理退单&评价数据

150-DWS层-商品主题 代码编写 分组开窗&聚合

151-DWS层-商品主题 代码编写 关联维度&将数据写入ClickHouse

152-DWS层-商品主题-整体测试

153-DWS层-商品主题-需求分析

154-DWS层-商品主题 代码编写 创建环境&使用DDL方式读取Kafka数据

155-DWS层-商品主题 代码编写 分组开窗聚合

156-DWS层-商品主题 代码编写 将动态表转换为流并打印

157-DWS层-商品主题 代码编写 将数据写入ClickHouse&测试

158-DWS层-关键词主题 需求分析

159-DWS层-关键词主题 代码编写 分词工具类封装

160-DWS层-关键词主题 代码编写 分词UDTF

161-DWS层-关键词主题 代码编写 思路分析&读取数据&建表

162-DWS层-关键词主题 代码编写 分词&开窗聚合

163-DWS层-关键词主题 代码编写 动态表转换为流&写入ClickHouse

164-DWS层-关键词主题 代码测试

165-数据可视化-课程介绍

166-数据可视化-Sugar 创建大屏

167-数据可视化-Sugar 使用步骤介绍

168-数据可视化-数据接口 项目构建

169-数据可视化-数据接口 依赖导入&分层说明

170-数据可视化-数据接口 GMV接口 Mapper完成

171-数据可视化-数据接口 GMV接口 Service&Controller完成

172-数据可视化-数据接口 GMV接口 测试

173-数据可视化-数据接口 GMV接口 对接Sugar

174-数据可视化-数据接口 品牌GMV接口 Mapper完成

175-数据可视化-数据接口 品牌GMV接口 Service完成

176-数据可视化-数据接口 品牌GMV接口 Controller完成

177-数据可视化-数据接口 品牌GMV接口 测试完成

178-数据可视化-数据接口 品牌GMV接口 对接Sugar

179-数据可视化-数据接口 导入代码&品类GMV&SPU GMV

180-数据可视化-数据接口 其他需求图表

181-数据可视化-最终测试

182-Flink优化-课程介绍

183-Flink优化-资源优化之内存设置

184-Flink优化-资源优化之并行度设置

185-Flink优化-资源优化之RockDB配置

186-Flink优化-资源优化之CheckPoint配置

187-Flink优化-资源优化之ParameterTool的介绍

188-Flink优化-反压处理之反压介绍&定位

189-Flink优化-反压处理之反压问题解决

190-Flink优化-数据倾斜之定位问题

191-Flink优化-数据倾斜之KeyBy之前的数据倾斜

192-Flink优化-数据倾斜之KeyBy之后直接聚合

193-Flink优化-数据倾斜之KeyBy之后开窗聚合

194-Flink优化-KafkaSource

195-Flink优化-FlinkSQL优化之MiniBatch

196-Flink优化-FlinkSQL优化之LocalGlobal

197-Flink优化-FlinkSQL优化之SplitDistinct

198-Flink优化-FlinkSQL优化之Agg With Filter

199-Flink优化-FlinkSQL优化之TopN优化

200-Flink优化-FlinkSQL优化之去重方案&其他

评论0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址