课程简介
在大数据处理领域,实时和离线各占非常大的比重,本套视频教程综合展示实时数据处理领域的一个重要应用:实时数仓项目。项目从数据采集开始,分别讲解了针对不同数据采取的不同采集策略,使用的不同数据采集工具。在数据处理部分,将实时采集的数据按照数据建模要求进行合理分层,使用当前最火热的实时计算引擎Flink,对实时计算结果进行可视化展示。
内容包括:搭建用户行为数据的实时数据采集框架Flume-Kafka-Flink;采用Canal、Maxwell、Flink CDC三种方案实现业务数据的实时采集;分层搭建实时数据仓库,包括ODS层、DWD层、DIM层、DWM层、DWS层、ADS层;数据可视化接口的实现;ClickHouse技术的深入讲解……
每一部分讲解均参照实际开发环境,提供了多种问题的解决方案,引导学员对问题进行更深层的思考。通过本套教程的学习,你将掌握企业实际开发中实时数仓搭建的全流程,深入理解Flink的高阶应用实例,掌握开发环节多种框架技术。教程总计40小时+,附赠全部视频、代码、笔记及资料。
教程涵盖的关键技术点:
数仓架构深入讲解、离线架构与实时架构对比分析、SpringBoot项目搭建讲解、Nginx安装配置使用、Flink CDC深入案例分析、Maxwell与Canal对比分析、使用侧输出流分流操作、Flink与HBase交互、Flink状态编程应用、Flink CEP循环模式匹配、双流join、旁路缓存、异步IO编码、ClickHouse多引擎讲解、Flink SQL、数据可视化接口编写、Flink实战优化方案等。
课程目录
001-课程介绍
002-项目介绍
003-采集模块-课程介绍
004-采集模块-数仓分层之为什么分层
005-采集模块-数仓分层之分层明细
006-采集模块-整体需求介绍
007-采集模块-离线架构分析之Sqoop&Flume
008-采集模块-离线架构分析之FlumeTairDirSource问题提出&解决
009-采集模块-离线架构分析之Kafka
010-采集模块-离线架构分析之其他
011-采集模块-实时架构分析
012-采集模块-架构对比
013-采集模块-日志数据采集之需求分析
014-采集模块-日志数据采集之MockJar包测试
015-采集模块-日志数据采集之SpringBoot简单介绍
016-采集模块-日志数据采集之SpringBoot创建项目&简单测试
017-采集模块-日志数据采集之SpringBoot创建项目&加参数测试
018-采集模块-日志数据采集之数据落盘&写入Kafka 编码
019-采集模块-日志数据采集之数据落盘&写入Kafka 本地测试
020-采集模块-日志数据采集之数据落盘&写入Kafka 单机测试
021-采集模块-日志数据采集之Nginx 介绍
022-采集模块-日志数据采集之Nginx 安装&启动
023-采集模块-日志数据采集之Nginx 配置负载均衡&测试
024-采集模块-日志数据采集之集群测试
025-采集模块-业务数据采集之建库&建表
026-采集模块-业务数据采集之FlinkCDC 什么是CDC&对比
027-采集模块-业务数据采集之FlinkCDC 介绍
028-采集模块-业务数据采集之FlinkCDC DataStream方式 编码
029-采集模块-业务数据采集之FlinkCDC DataStream方式 测试
030-采集模块-业务数据采集之FlinkCDC DataStreamAPI 设置CK&打包&开启集群
031-采集模块-业务数据采集之FlinkCDC DataStreamAPI 打包进行断点续传测
032-采集模块-业务数据采集之FlinkCDC FlinkSQLAPI 编码&测试
033-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 格
034-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 编
035-采集模块-业务数据采集之FlinkCDC DataStreamAPI 自定义反序列化器 代
036-采集模块-业务数据采集之FlinkCDC DataStreamAPI&FlinkSQL对比
037-采集模块-业务数据采集之Maxwell 安装说明&测试
038-采集模块-业务数据采集之Canal 安装说明&测试
039-采集模块-业务数据采集之CDC对比
040-采集模块-业务数据采集之读取MySQL数据并写入Kafka 编码
041-采集模块-业务数据采集之读取MySQL数据并写入Kafka 测试
042-DWD&DIM-课程介绍
043-DWD&DIM-行为数据 需求分析
044-DWD&DIM-行为数据 思路整理&消费Kafka数据
045-DWD&DIM-行为数据 将数据转换为JSON对象
046-DWD&DIM-行为数据 新老用户校验
047-DWD&DIM-行为数据 侧输出流&写入Kafka
048-DWD&DIM-行为数据 测试
049-DWD&DIM-业务数据之需求分析
050-DWD&DIM-业务数据之代码逻辑梳理
051-DWD&DIM-业务数据之代码编写 消费数据并过滤
052-DWD&DIM-业务数据之代码编写 读取配置表创建广播流
053-DWD&DIM-业务数据之代码编写 配置表字段分析&建表&JavaBean
054-DWD&DIM-业务数据之代码编写 开启配置表Binlog并测试
055-DWD&DIM-业务数据之代码编写 连接主流&广播流并分析业务逻辑
056-DWD&DIM-业务数据之代码编写 创建TableProcessFunction并初始化相关参数
057-DWD&DIM-业务数据之代码编写 处理广播流数据 解析数据&建表
058-DWD&DIM-业务数据之代码编写 处理广播流数据 写入状态
059-DWD&DIM-业务数据之代码编写 处理主流数据 读取状态&过滤字段
060-DWD&DIM-业务数据之代码编写 处理主流数据 补充SinkTable&分流
061-DWD&DIM-业务数据之代码编写 检查代码
062-DWD&DIM-业务数据之代码编写 测试准备
063-DWD&DIM-业务数据之代码编写 测试
064-DWD&DIM-业务数据之代码编写 将数据写入HBase 编码
065-DWD&DIM-业务数据之代码编写 将数据写入Kafka 编码
066-DWD&DIM-业务数据之整体测试 环境准备
067-DWD&DIM-业务数据之整体测试 测试完成
068-ODS&DWD&DIM-小总结
069-ODS&DWD&DIM-SQL分享 需求说明&建表&导数据
070-ODS&DWD&DIM-SQL分享 方案一
071-ODS&DWD&DIM-SQL分享 方案二
072-ODS&DWD&DIM-SQL分享 HiveOnSpark Bug说明
073-DWM层-需求分析
074-DWM层-访客UV 需求分析
075-DWM层-访客UV 代码编写 消费数据并转换为JSON对象
076-DWM层-访客UV 代码编写 过滤数据
077-DWM层-访客UV 代码编写 设置状态超时时间防止状态过大
078-DWM层-访客UV 代码测试
079-DWM层-跳出明细 需求分析
080-DWM层-跳出明细 代码编写
081-DWM层-跳出明细 代码测试
082-DWM层-跳出明细 测试
083-DWM层-跳出明细 CEP 循环模式
084-DWM层-订单宽表 需求分析
085-DWM层-订单宽表 双流JOIN 官方文档说明
086-DWM层-订单宽表 双流JOIN 代码编写
087-DWM层-订单宽表 双流JOIN 代码测试
088-DWM层-订单宽表 代码编写 消费Kafka数据&转换JavaBean&提取事件时间
089-DWM层-订单宽表 代码编写 订单与订单明细表双流JOIN
090-DWM层-订单宽表 代码测试 准备工作
091-DWM层-订单宽表 代码测试 测试完成
092-DWM层-订单宽表 关联维度 思路梳理
093-DWM层-订单宽表 关联维度 JDBCUtil 返回值&参数说明
094-DWM层-订单宽表 关联维度 JDBCUtil 查询&封装泛型对象
095-DWM层-订单宽表 关联维度 JDBCUtil 测试
096-DWM层-订单宽表 关联维度 DimUtil封装&优化的必要性
097-DWM层-订单宽表 关联维度 优化1旁路缓存 思路分析
098-DWM层-订单宽表 关联维度 优化1旁路缓存 Redis工具类&Key的设计
099-DWM层-订单宽表 关联维度 优化1旁路缓存 代码编写
100-DWM层-订单宽表 关联维度 优化1旁路缓存 代码测试
101-DWM层-订单宽表 回顾
102-DWM层-订单宽表 关联维度 优化2 异步IO说明
103-DWM层-订单宽表 关联维度 优化2 异步IO编码步骤
104-DWM层-订单宽表 关联维度 优化2 异步IO编码 初始化函数
105-DWM层-订单宽表 关联维度 优化2 异步IO编码 异步函数完成
106-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试准备
107-DWM层-订单宽表 关联维度 优化2 异步IO编码 测试完成
108-DWM层-订单宽表 关联维度 补充其他维度信息
109-DWM层-订单宽表 最终测试
110-DWM层-订单宽表 不丢维度数据说明
111-DWM层-支付宽表 需求分析
112-DWM层-支付宽表 代码编写
113-DWM层-支付宽表 代码测试
114-DWM层-支付宽表 时间工具类说明
115-DWS层-课程介绍
116-DWS层-访客主题宽表 需求分析
117-DWS层-访客主题宽表 思路整理&读取Kafka数据
118-DWS层-访客主题宽表 处理输出流&union&提取时间戳分组
119-DWS层-访客主题宽表 开窗&聚合
120-DWS层-访客主题宽表 打印测试
121-DWS层-ClickHouse 课程介绍
122-DWS层-ClickHouse 概述&特点
123-DWS层-ClickHouse 安装准备工作
124-DWS层-ClickHouse 安装&启动
125-DWS层-ClickHouse 数据类型
126-DWS层-ClickHouse 简单引擎介绍
127-DWS层-ClickHouse MergeTree
128-DWS层-ClickHouse MergeTree之Partition By
129-DWS层-ClickHouse MergeTree之Primary Key
130-DWS层-ClickHouse MergeTree之Order By
131-DWS层-ClickHouse MergeTree之TTL
132-DWS层-ClickHouse ReplacingMergeTree
133-DWS层-ClickHouse SummingMergeTree
134-DWS层-ClickHouse 引擎选择分析
135-DWS层-ClickHouse SQL操作 一
136-DWS层-ClickHouse SQL操作 二
137-DWS层-ClickHouse 副本机制
138-DWS层-ClickHouse 分片机制 说明
139-DWS层-ClickHouse 分片机制 实操
140-DWS层-访客主题 ClickHouseUtil 创建
141-DWS层-访客主题 ClickHouseUtil 封装
142-DWS层-访客主题 ClickHouseUtil 封装完成
143-DWS层-访客主题 ClickHouseUtil 测试完成
144-DWS层-商品主题 需求分析
145-DWS层-商品主题 JavaBean说明
146-DWS层-商品主题 代码编写 思路整理&消费数据创建流
147-DWS层-商品主题 代码编写 处理页面日志&收藏数据&购物车数据
148-DWS层-商品主题 代码编写 处理订单&支付数据
149-DWS层-商品主题 代码编写 处理退单&评价数据
150-DWS层-商品主题 代码编写 分组开窗&聚合
151-DWS层-商品主题 代码编写 关联维度&将数据写入ClickHouse
152-DWS层-商品主题-整体测试
153-DWS层-商品主题-需求分析
154-DWS层-商品主题 代码编写 创建环境&使用DDL方式读取Kafka数据
155-DWS层-商品主题 代码编写 分组开窗聚合
156-DWS层-商品主题 代码编写 将动态表转换为流并打印
157-DWS层-商品主题 代码编写 将数据写入ClickHouse&测试
158-DWS层-关键词主题 需求分析
159-DWS层-关键词主题 代码编写 分词工具类封装
160-DWS层-关键词主题 代码编写 分词UDTF
161-DWS层-关键词主题 代码编写 思路分析&读取数据&建表
162-DWS层-关键词主题 代码编写 分词&开窗聚合
163-DWS层-关键词主题 代码编写 动态表转换为流&写入ClickHouse
164-DWS层-关键词主题 代码测试
165-数据可视化-课程介绍
166-数据可视化-Sugar 创建大屏
167-数据可视化-Sugar 使用步骤介绍
168-数据可视化-数据接口 项目构建
169-数据可视化-数据接口 依赖导入&分层说明
170-数据可视化-数据接口 GMV接口 Mapper完成
171-数据可视化-数据接口 GMV接口 Service&Controller完成
172-数据可视化-数据接口 GMV接口 测试
173-数据可视化-数据接口 GMV接口 对接Sugar
174-数据可视化-数据接口 品牌GMV接口 Mapper完成
175-数据可视化-数据接口 品牌GMV接口 Service完成
176-数据可视化-数据接口 品牌GMV接口 Controller完成
177-数据可视化-数据接口 品牌GMV接口 测试完成
178-数据可视化-数据接口 品牌GMV接口 对接Sugar
179-数据可视化-数据接口 导入代码&品类GMV&SPU GMV
180-数据可视化-数据接口 其他需求图表
181-数据可视化-最终测试
182-Flink优化-课程介绍
183-Flink优化-资源优化之内存设置
184-Flink优化-资源优化之并行度设置
185-Flink优化-资源优化之RockDB配置
186-Flink优化-资源优化之CheckPoint配置
187-Flink优化-资源优化之ParameterTool的介绍
188-Flink优化-反压处理之反压介绍&定位
189-Flink优化-反压处理之反压问题解决
190-Flink优化-数据倾斜之定位问题
191-Flink优化-数据倾斜之KeyBy之前的数据倾斜
192-Flink优化-数据倾斜之KeyBy之后直接聚合
193-Flink优化-数据倾斜之KeyBy之后开窗聚合
194-Flink优化-KafkaSource
195-Flink优化-FlinkSQL优化之MiniBatch
196-Flink优化-FlinkSQL优化之LocalGlobal
197-Flink优化-FlinkSQL优化之SplitDistinct
198-Flink优化-FlinkSQL优化之Agg With Filter
199-Flink优化-FlinkSQL优化之TopN优化
200-Flink优化-FlinkSQL优化之去重方案&其他
评论0