云服务器内容精选

华为云首页用户手册

Flink作业性能调优类

数据湖探索 DLI-Flink作业重启后，如何判断是否可以从checkpoint恢复:应用场景

应用场景本文列举了一些常见的从checkpoint恢复的场景供您参考，如表1所示。更多场景你可以使用从checkpoint恢复的原则结合实际情况进行判断。表1 从checkpoint恢复的常见场景场景是否支持恢复说明调整或者增加并行数不支持该操作修改了作业的并行数，即修改了作业的运行逻辑。修改Flink SQL语句、Flink Jar作业等操作不支持该操作修改了作业对资源的算法逻辑。例如原有的算法的语句是执行加减运算，当前需要恢复的状态将算法的语句修改成为乘除取余的运算，是无法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数支持对计算资源的修改并没有影响到作业算法或算子的运行逻辑。作业运行异常或物理停电支持当对作业参数未作出修改。

数据湖探索 DLI Flink作业性能调优类
数据湖探索 DLI-Flink作业运行异常，如何定位

Flink作业运行异常，如何定位在“Flink作业”管理页面，对应作业“操作”列单击“编辑”按钮，在作业运行界面确认作业是否勾选“保存作业日志”参数。图1 保存作业日志是，则执行3。否，则运行日志不会转储OBS桶，需要先执行2保存作业运行日志。在作业运行界面勾选“保存作业日志”，在“OBS桶”参数选择存储运行日志的OBS桶。单击“启动”重新运行作业。作业重新运行完成后再执行3及后续步骤。在Flink作业列表单击对应作业名称，进入作业详情页面，选择“运行日志”页签。单击OBS桶，获取对应作业的完整运行日志。图2 查看运行日志下载最新“jobmanager.log”文件，搜索“RUNNING to FAILED”关键字，通过上下文的错误栈，确认失败原因。如果“jobmanager.log”文件中的信息不足以定位，可以在运行日志中找到对应的“taskmanager.log”日志，搜索“RUNNING to FAILED”关键字，确认失败原因。父主题： Flink作业性能调优类

数据湖探索 DLI Flink作业性能调优类