前言

再上一篇文章中 《从0到1学习Flink》—— Data Source 介绍 讲解了 Flink Data Source ,那么这里就来讲讲 Flink Data Sink 吧。

首先 Sink 的意思是:

大概可以猜到了吧!Data sink 有点把数据存储下来(落库)的意思。

如上图,Source 就是数据的来源,中间的 Compute 其实就是 Flink 干的事情,可以做一系列的操作,操作完后就把计算后的数据结果 Sink 到某个地方。(可以是 MySQL、ElasticSearch、Kafka、Cassandra 等)。这里我说下自己目前做告警这块就是把 Compute 计算后的结果 Sink 直接告警出来了(发送告警消息到钉钉群、邮件、短信等),这个 sink 的意思也不一定非得说成要把数据存储到某个地方去。其实官网用的 Connector 来形容要去的地方更合适,这个 Connector 可以有 MySQL、ElasticSearch、Kafka、Cassandra RabbitMQ 等。

Flink Data Sink

前面文章 《从0到1学习Flink》—— Data Source 介绍 介绍了 Flink Data Source 有哪些,这里也看看 Flink Data Sink 支持的有哪些。

看下源码有哪些呢?

可以看到有 Kafka、ElasticSearch、Socket、RabbitMQ、JDBC、Cassandra POJO、File、Print 等 Sink 的方式。

SinkFunction

从上图可以看到 SinkFunction 接口有 invoke 方法,它有一个 RichSinkFunction 抽象类。

上面的那些自带的 Sink 可以看到都是继承了 RichSinkFunction 抽象类,实现了其中的方法,那么我们要是自己定义自己的 Sink 的话其实也是要按照这个套路来做的。

这里就拿个较为简单的 PrintSinkFunction 源码来讲下:

 1@PublicEvolving
2public class PrintSinkFunction<INextends RichSinkFunction<IN{
3    private static final long serialVersionUID = 1L;
4
5    private static final boolean STD_OUT = false;
6    private static final boolean STD_ERR = true;
7
8    private boolean target;
9    private transient PrintStream stream;
10    private transient String prefix;
11
12    /**
13     * Instantiates a print sink function that prints to standard out.
14     */

15    public PrintSinkFunction() {}
16
17    /**
18     * Instantiates a print sink function that prints to standard out.
19     *
20     * @param stdErr True, if the format should print to standard error instead of standard out.
21     */

22    public PrintSinkFunction(boolean stdErr) {
23        target = stdErr;
24    }
25
26    public void setTargetToStandardOut() {
27        target = STD_OUT;
28    }
29
30    public void setTargetToStandardErr() {
31        target = STD_ERR;
32    }
33
34    @Override
35    public void open(Configuration parameters) throws Exception {
36        super.open(parameters);
37        StreamingRuntimeContext context = (StreamingRuntimeContext) getRuntimeContext();
38        // get the target stream
39        stream = target == STD_OUT ? System.out : System.err;
40
41        // set the prefix if we have a >1 parallelism
42        prefix = (context.getNumberOfParallelSubtasks() > 1) ?
43                ((context.getIndexOfThisSubtask() + 1) + "> ") : null;
44    }
45
46    @Override
47    public void invoke(IN record) {
48        if (prefix != null) {
49            stream.println(prefix + record.toString());
50        }
51        else {
52            stream.println(record.toString());
53        }
54    }
55
56    @Override
57    public void close() {
58        this.stream = null;
59        this.prefix = null;
60    }
61
62    @Override
63    public String toString() {
64        return "Print to " + (target == STD_OUT ? "System.out" : "System.err");
65    }
66}

可以看到它就是实现了 RichSinkFunction 抽象类,然后实现了 invoke 方法,这里 invoke 方法就是把记录打印出来了就是,没做其他的额外操作。

如何使用?

1SingleOutputStreamOperator.addSink(new PrintSinkFunction<>();

这样就可以了,如果是其他的 Sink Function 的话需要换成对应的。

使用这个 Function 其效果就是打印从 Source 过来的数据,和直接 Source.print() 效果一样。

下篇文章我们将讲解下如何自定义自己的 Sink Function,并使用一个 demo 来教大家,让大家知道这个套路,且能够在自己工作中自定义自己需要的 Sink Function,来完成自己的工作需求。

最后

本文主要讲了下 Flink 的 Data Sink,并介绍了常见的 Data Sink,也看了下源码的 SinkFunction,介绍了一个简单的 Function 使用, 告诉了大家自定义 Sink Function 的套路,下篇文章带大家写个。

关注我

转载请务必注明原创地址为:http://www.54tianzhisheng.cn/2018/10/29/flink-sink/

另外我自己整理了些 Flink 的学习资料,目前已经全部放到微信公众号了。你可以加我的微信:zhisheng_tian,然后回复关键字:Flink 即可无条件获取到。

相关文章

1、《从0到1学习Flink》—— Apache Flink 介绍

2、《从0到1学习Flink》—— Mac 上搭建 Flink 1.6.0 环境并构建运行简单程序入门

3、《从0到1学习Flink》—— Flink 配置文件详解

4、《从0到1学习Flink》—— Data Source 介绍

5、《从0到1学习Flink》—— 如何自定义 Data Source ?

6、《从0到1学习Flink》—— Data Sink 介绍

7、《从0到1学习Flink》—— 如何自定义 Data Sink ?


©著作权归作者所有:来自51CTO博客作者mb5fdb0aaa540da的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 《从0到1学习Flink》—— Flink Data transformation(转换)
  2. 《从0到1学习Flink》—— 如何自定义 Data Source ?
  3. 简化数据获取!Uber开源深度学习分布训练库Petastorm
  4. 9月份最热门的机器学习开源项目TOP 5
  5. 6大最常用的Java机器学习库一览
  6. AI面试必备!你不可不知的10个深度学习方法
  7. 作为普通Ruby开发,我如何从零转型机器学习
  8. 最有趣的机器学习可视化图集
  9. DeepMind PotArt多任务深度强化学习获突破性进展

随机推荐

  1. android 窗口式activity
  2. Android应用开发编程规范
  3. Android(安卓)内存泄漏 - 不要用static修
  4. android 压缩图片、生成缩略图 和转换Bas
  5. android EditText TextView的属性整理 最
  6. Android平板开发注意点
  7. android RelativeLayout属性和布局实例
  8. android surfaceView 概述
  9. Android实现3个圆圈的动画
  10. Android简易注解View(java反射实现)