1.Flink Connector 详解
2.Flink调优之前,必须先看懂的TaskManager内存模型
3.十二、flink源码解析-创建和启动TaskManager二
4.Flink 的集群资源管理
Flink Connector 详解
Flink Connector 详解
连接器 Connector 是 Flink 与外部系统间沟通的桥梁,它作为 Flink 数据的重要来源和去向,发挥着至关重要的作用。例如,cnew源码从 Kafka 读取数据,经过 Flink 处理后再写回到 HIVE、Elasticsearch 等外部系统。
在处理流程中,事件控制、负载均衡、数据解析与序列化等方面,连接器扮演着关键角色。事件处理水印(watermark)和检查点对齐记录,以及数据在不同格式间的转换,都是连接器需要处理的问题。
Source API 作为 Flink 数据的入口,经历了接口演进,notpad 查看函数源码从 Flink 1. 版本之前的 SourceFunction API 和 InputFormat API,到引入的新 Source API。新 API 的特点是批流统一,实现简单,简化了开发者开发工作。
核心抽象包括记录分片(Split)、记录分片枚举器(Split Enumerator)和 Source 读取器(Source Reader)。记录分片是带有编号的记录集合,记录分片枚举器负责发现和分配记录分片,Source 读取器负责从记录分片读取数据、处理事件时间水印和数据解析。
枚举器-读取器架构中,枚举器运行在 Job Master 上,负责协调和分配任务;读取器运行在 Task Executor 上,负责执行任务。他们的检查点存储各自分开,但存在通信。
Source 读取器设计简化了开发者的莱玩麻将源码开发工作,提供了 SourceReaderBase 类供开发者继承,从而减少开发工作量。
Sink API 作为 Flink 数据的出口,实现了精确一次的语义,通过二阶段提交机制保障数据的完整性和一致性。
Sink 模型未来发展包括连接器测试框架的引入,为连接器提供统一的测试标准,简化开发者的测试工作,降低开发门槛,吸引更多开发者参与 Flink 生态建设。
Flink调优之前,必须先看懂的TaskManager内存模型
在深入Flink调优之前,理解Task Manager内存模型至关重要。Flink程序运行在内存中,内存管理直接影响性能和稳定性。Task Manager负责任务执行,其内存模型相对复杂,由堆内存、流量魔盒源码开发堆外内存、直接内存、MetaSpace内存和JVM Overhead构成,总内存大小由taskmanager.memory.process.size配置。
通过Web UI,我们可以查看Task Manager的资源细节,如物理内存、JVM堆内存和Flink管理的内存。Task Manager的内存模型图清晰展示了内存区域划分,每个部分都承担着特定职责,如Heap用于Java对象,Native Memory/Off-Heap不在堆内,而Direct Memory则是为了高效序列化对象。Total Flink Memory代表Task Executor可用内存,减去Metaspace和Overhead。
进一步分析,JVM Heap分为Flink框架所需和任务执行所需,而Managed Memory用于缓存和数据结构,面试问看源码Task Off-heap Memory处理Native方法调用,Network Memory负责shuffle过程中的数据交换。JVM Metaspace Memory和Overhead则负责元数据存储和额外开销。在调优时,理解这些内存分配和使用机制可以帮助我们优化资源分配,提升任务执行效率。
十二、flink源码解析-创建和启动TaskManager二
深入探讨Flink源码中创建与启动TaskManager的过程,我们首先聚焦于内部启动onStart阶段。此阶段核心在于启动TaskExecutorServices服务,具体步骤包括与ResourceManager的连接、注册和资源分配。
当TaskExecutor启动时,首先生成新的注册并创建未完成的future,随后等待注册成功并执行注册操作。这一过程由步骤1至步骤5组成,确保注册与资源连接的无缝集成。一旦注册成功,资源管理器会发送SlotReport报告至TaskExecutor,然后分配slot。
TaskSlotTable开始分配slot,JobTable获取并提供slot至JobManager。这一流程确保资源的有效分配与任务的高效执行。与此同时,ResourceManager侧的TaskExecutor注册流程同样重要,包括连接与注册TaskExecutor。
一旦完成注册与资源分配,ResourceManager会发送SlotReport报告至JobMaster,提供slot以供调度任务。这一步骤标志着slot的分配与JobManager的准备工作就绪,为后续任务部署打下基础。
在ResourceManager侧,slot管理组件注册新的taskManager,根据规则更新slot状态、释放资源或继续执行注册。这一过程确保资源的高效管理与任务的顺利进行。
在JobMaster侧,slot的分配与管理通过slotPool进行,确保待调度任务能够得到所需资源。这一阶段标志着任务调度与执行的准备就绪。
流程的最后,回顾整个创建与启动TaskManager的过程,从资源连接与注册到slot分配与任务调度,各个环节紧密相连,确保Flink系统的高效运行与任务的顺利执行。
Flink 的集群资源管理
ResourceManager作为Flink集群资源管理的核心,负责统一管理集群计算资源,包括CPU、内存等。它与JobManager、TaskManager等组件协同工作,确保作业的高效执行。ResourceManager的实现通常分为ActiveResourceManager、StandaloneResourceManager、MesosResourceManager等不同版本,其中ActiveResourceManager支持动态资源管理,能够根据作业需求调整TaskManager实例的数量。KubernetesResourceManager和YarnResourceManager是支持动态管理的主要实现。
ResourceManager提供RPC访问能力,通过实现ResourceManagerGateway接口,允许JobManager、TaskManager等服务通过RPC方式与其交互。它继承自FencedRpcEndpoint基本实现类,通过ResourceManagerGateway接口,实现与其他服务节点的RPC通信。此外,ResourceManager实现LeaderContender接口,通过LeaderElectionService进行高可用集群中Leader节点的选举,确保服务的稳定运行。
ResourceManager内部结构包含多个关键成员变量,如resourceld(唯一资源ID)、jobManagerRegistrations(存储JobManager注册信息)、jmResourceldRegistrations(存储JobManager注册信息,以资源ID为键)、jobLeaderldService(获取Job Leader ID的服务)、taskExecutors(注册的TaskExecutor列表)、taskExecutorGatewayFutures(TaskExecutorGateway的CompletableFuture存储)、highAvailabilityServices(系统高可用服务支持)、heartbeatServices(用于创建心跳管理服务)、fatalErrorHandler(异常错误处理)、slotManager(管理集群可用Slot资源)、clusterinformation(Flink集群共享信息)、resourceManagerMetricGroup(监控指标收集)以及leaderElectionService(基于ZooKeeper实现的Leader选举服务)等。
ResourceManagerGateway接口提供RPC方法,允许JobManager、TaskExecutor、WebMonitorEndpoint和Dispatcher等组件调用ResourceManager服务。通过梳理这些组件与ResourceManagerGateway之间的调用关系图,可以明确各个组件如何与ResourceManager交互,如JobManager注册、请求Slot资源、心跳管理、关闭连接等。
Slot计算资源管理是ResourceManager的核心功能之一,主要通过SlotManager服务实现。SlotManager包含Register Slot和Free Slot集合,用于存储和管理Slot资源。TaskManager在注册时,将资源信息存储在TaskManagerSlot中,同时更新注册和空闲状态的Slot集合。ResourceManager接收Slot申请,通过SlotManager分配Slot资源给JobManager,确保资源的有效利用。流程图展示了Slot注册、资源申请以及分配的整个过程,确保集群资源的高效管理和调度。