简介:本课程会依次向大家介绍中台的诞生背景、数据中台的架构以及如何进行合理得技术选型,并结合一个通用的关系型数据库同步至HDFS的工具套件实现,带大家拓展了基于Spark的多源异构数据同步工具的设计思路。
第1章 中台的前世今生
本章中会依次向大家介绍,中台的系统架构是如何诞生的、各类型架构的特点和存在的问题、数据中台架构是如何解决这些问题的,以及中台的演进过程,帮助大家对中台有初步得了解。
第2章 数据中台体系
在本章中,首先会从数据应用的角度带大家回顾数据中台的诞生过程;然后介绍一个成熟的数据中台应该具备的核心能力,并对数据中台的架构按照模块进行分解,介绍每个模块的功能,以及各自得技术选型。
第3章 基于Spark的多源异构数据同步套件
本章中会依次介绍数据采集、汇聚的技术架构;一个成熟的数据同步套件的架构以及具备的功能,并带领大家实现一个具备完整功能的关系型数据库同步至HDFS的工具套件,拓展基于Spark的通用的数据同步套件的设计思路。
- 3-1 数据采集、汇聚的技术架构 (10:40)
- 3-2 构建异构数据源的同步套件 (05:29)
- 3-3 DataX数据同步案例 (15:30)
- 3-4 移植DataX的配置管理功能 (07:30)
- 3-5 配置管理的功能点代码演示 (09:32)
- 3-6 关系型数据库同步至HDFS的功能开发 (07:44)
- 3-7 同步流程抽象为三大模块 (06:04)
- 3-8 三大模块的整体架构实现 (11:02)
- 3-9 三大模块的具体功能实现 (10:29)
- 3-10 数据转换模块的插件化管理 (12:37)
- 3-11 基于Spark的数据同步套件设计思路 (04:33)
- 3-12 本章总结 (02:35)