Flink容易忽视的重启策略

  • Post author:
  • Post category:其他



失败率重启策略

// 重启策略
restart-strategy: failure-rate
// 重启次数
restart-strategy.failure-rate.max-failures-per-interval: 3
// 重启总时间
restart-strategy.failure-rate.failure-rate-interval: 5 min
// 每次重启时间间隔
restart-strategy.failure-rate.delay: 10 s

任务失败后,重启时,每两次连续尝试之间间隔10秒,在5分钟内任务重启失败3次,则任务最终失败,配置默认全局生效。


后备重启策略


后备重启策略,保底策略,即所谓的默认重启策略;集群中如果没有在配置文件(flink-conf.yaml)中显示的配置重启策略,也没有在编程中织入,在检查点机制开启的情况下,任务失败,flink会默认的选用Fixed Delay Restart Strategy重启,且会无限尝试重连(Integer.MAX_VALUE次)。


指数延迟重启策略


指数延迟重启策略尝试无限重启作业, 延迟增加直到最大延迟

工作永远不会失败, 在两次连续的重启尝试之间, 重启策略保持指数增长, 直到达到最大次数, 它将延迟保持在最大数量

当作业正确执行后, 指数延迟值会在一段时间后重置, 这个阈值是可配置的

restart-strategy: exponential-delay
// 首次重新启动间隔
restart-strategy.exponential-delay.initial-backoff: 10 s
// 最长重新启动时间间隔
restart-strategy.exponential-delay.max-backoff: 2 min
// 每次乘以的指数
restart-strategy.exponential-delay.backoff-multiplier: 2.0
// 作业正常运行后,恢复初始值的时间
restart-strategy.exponential-delay.reset-backoff-threshold: 10 min
// 避免同时重新启动多个作业的参数
restart-strategy.exponential-delay.jitter-factor: 0.1



版权声明:本文为weixin_38401971原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。