Apache Flink 是一个为无界和有界数据流提供数据驱动、有状态计算的框架和分布式处理引擎。它的架构遵循主从模式(Master-Slave)。
在一个 Flink 程序中,数据从一个或多个源开始,经过一系列转换操作,最后被发送到一个或多个目的地(Sink)。这种结构形成了一个有向无环图(DAG)。
变更数据捕获(Change Data Capture, CDC)是一种设计模式,用于确定和跟踪数据发生的变化,以便后续可以对这些变化做出响应。在 Flink 的场景下,Flink CDC 连接器能够以极低的延迟从 MySQL、PostgreSQL、MongoDB 等数据库中捕获行级别的变更,并将它们作为数据流进行处理。这种方式避免了传统的双重写入或轮询查询数据库带来的开销和延迟。