1 概述

1.1 版本

服务器版本
v7.3.0及之后版本

1.2 应用场景

企业在构建数仓和中间库时,由于业务数据量级较大,如果使用“数据同步”批量定时同步数据很难做到高性能的增量同步,若使用清空目标表再写入数据的方式时,还会面临目标表一段时间不可用、抽取耗时长等问题。
因此希望能在数据库数据量大或表结构规范的情况下,实现高性能的实时数据同步。

1.3 功能说明

支持对数据源进行单表、多表、多对一数据的实时全量和增量同步,可以根据数据源适配情况,配置实时同步任务。

2 实现原理

利用 Flink CDC 作为实时数据同步框架,实时监听同步任务来源端的数据库日志变化,进而实现向目标端实时写入数据。

注:只有来源端的数据库开启了日志,才能使用实时同步进行数据监听。

3 功能概述

功能 描述
数据源 实时同步支持多种数据源,可以将多种来源端及目标端数据源搭配组成同步链路进行数据实时同步。
任务配置 实时同步任务采用向导式配置,包括三个步骤:数据来源、数据去向和任务控制。
任务详情 支持查看实时同步任务的基本信息、运行状况、查看读写统计、查看日志、处理脏数据。
任务运维 监控每个任务的运行状态以及运行详情等。
作者:fancy  创建时间:2024-12-07 11:08
最后编辑:fancy  更新时间:2025-03-27 15:47