3,Structured Streaming使用checkpoint进行故障恢复

浪尖 浪尖聊大数据

使用checkpoint进行故障恢复

如果发生故障或关机,可以恢复之前的查询的进度和状态,并从停止的地方继续执行。这是使用Checkpoint和预写日志完成的。您可以使用检查点位置配置查询,那么查询将将所有进度信息(即,每个触发器中处理的偏移范围)和运行聚合(例如,示例中的wordcount)保存到检查点位置。此检查点位置必须是HDFS兼容文件系统中的路径,并且可以在启动查询时将其设置为DataStreamWriter中的选项。

aggDF .writeStream .outputMode("complete") .option("checkpointLocation", "path/to/HDFS/dir") .format("memory") .start()

具体测试代码如下:

val lines = spark.readStream.format("socket").option("host", "localhost").option("port", 9999).load()val words = lines.as[String].flatMap(_.split(" "))val wordCounts = words.groupBy("value").count()val query = wordCounts.writeStream.queryName("aggregates").outputMode("complete").option("checkpointLocation", "memory/").format("memory").start()spark.sql("select * from aggregates").show()kill掉submit进行测试
©著作权归作者所有:来自51CTO博客作者mob604756ed02fe的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 成为大数据高手的活法-晚上复盘
  2. blink解决的一个flink分析痛点
  3. 注定不平凡的2019~~
  4. 重要|Spark driver端得到executor返回值的方法
  5. Spark Core读取ES的分区问题分析
  6. Flink通过异步IO实现redis维表join
  7. 浪尖刷过leetcode的题
  8. flink sql使用中的一个问题
  9. spark面试该准备点啥

随机推荐

  1. XML串行化的示例代码分享
  2. 详细介绍XML操作总结的示例代码
  3. 使用xlst将xml转换html的示例代码
  4. XML实战秘籍第四卷:选单连动
  5. XML学习(二)详解DOM操作XML文档
  6. XML实战秘籍第三卷:动态分页
  7. XML学习(一)元素,属性,读取详解
  8. XML实战秘籍第二卷:动态查询
  9. 详细介绍XML和HTML常用转义字符
  10. XML实战秘籍第一卷:动态排序