-
Client:
1、用户提交一个Flink程序时,会首先创建一个Client,该Client首先会对用户提交的Flink程序进行预处理,并提交到Flink集群。
2、Client会将用户提交的Flink程序组装成一个JobGraph,并且是以JobGraph的形式提交的。
查看全部 -
TaskManager:
1、实际负责执行计算的worker,在其上执行Flink Job的一组Task。
2、TaskManager负责管理其所在节点上的资源信息,比如内存、磁盘、网络,在启动的时候将资源的状态向JobManager汇报。
查看全部 -
JobManager:
1、Flink系统的协调者,它负责接收Flink Job,调度组成Job的多个Task的执行。
2、收集Job的状态信息,并管理Flink集群中从节点TaskManager。
查看全部 -
Flink是基于Master-Slave风格的架构。
Flink集群启动时,会启动一个JobManager进程、至少一个TaskManager进程。
查看全部 -
基础概念:
1、Flink程序的基础构建模块是流(Streams)与转换(transformations)。
2、每一个数据流起始于一个或多个source,并终止于一个或多个sink。
查看全部 -
Flink优势:
1、支持高吞吐、低延迟、高性能流处理。
2、支持高度灵活的窗口操作。
3、支持有状态计算的Exactly-once语义。
4、提供DataStream API和DataSet API。
查看全部 -
Libaries层:
在API层之上构建的满足特定应用的实现计算框架,也分别对应于面向流处理和面向批处理两类。
查看全部 -
API层:
主要实现了面向无界Stream的流处理和面向Batch的批处理API,其中面向流处理对应DataStream API,面向批处理对应的DataSet API。
查看全部 -
Runtime层:
提供了支持Flink计算的全部核心实现,比如:支持分布式Stream处理、JobGraph到ExecutionGraph的映射、调度等等,为上层API层提供基础服务。
查看全部 -
Deployment层
主要涉及Flink部署模式:
1、本地
2、集群(Standalone、YARN)
3、云(GCE/EC2)
查看全部 -
Flink特点:
Flink是完全支持流处理(作为流处理看待时,输入数据流是无界的)。
批处理被作为一种特殊的流处理,只是它的输入数据流被定义为有界的。
查看全部 -
Flink定义:
Apache Flink是一个面向分布式数据流处理和批量数据处理的开源计算平台,提供支持流处理和批处理两种类型。
查看全部 -
处理模型与延迟
数据处理保证
查看全部 -
架构和容错比较
flink基于Chandy-Lamport checkpoint分布式快照模型
spark streaming是基于WAL及RDD血统机制,高容错
storm Records ACK
查看全部 -
flink自身优势
查看全部
举报