-
Flink Jar作业设置backend为OBS,报错不支持OBS文件系统 - 数据湖探索 DLI
确认客户esdk-obs-java-3.1.3.jar的版本。 确认是集群存在问题。 处理步骤 设置依赖关系provided。 重启clusteragent应用集群升级后的配置。 去掉OBS依赖,否则checkpoint会写不进OBS。 父主题: Flink Jar作业相关问题
-
跨源连接运维报错 - 数据湖探索 DLI
通过DLI跨源写DWS表,非空字段出现空值异常 更新跨源目的端源表后,未同时更新对应跨源表,导致insert作业失败 父主题: 跨源连接相关问题
-
Flink SQL作业Kafka分区数增加或减少,不用停止Flink作业,实现动态感知 - 数据湖探索 DLI
Flink SQL作业Kafka分区数增加或减少,不用停止Flink作业,实现动态感知 问题描述 用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大,后期需要更改Kafka区分数。
-
查看DLI SQL日志 - 数据湖探索 DLI
查看DLI SQL日志 场景概述 日常运维时需要查看DLI SQL日志。 操作步骤 在DataArts Studio控制台获取DataArts Studio执行DLI作业的job id。 图1 查看日志 图2 查找job id 在DLI控制台,选择“作业管理”>“SQL作业”。 在SQL作业管理页面,输入对应的job
-
如何查看Flink作业输出结果? - 数据湖探索 DLI
如何查看Flink作业输出结果? DLI支持将流作业的结果数据输出到DIS上,因此用户需要到DIS上去查看输出结果,详细操作请参见《数据接入服务用户指南》中的“从DIS获取数据”章节。 DLI支持将Flink作业的结果数据输出到RDS上,因此用户需要到RDS上去查看输出结果,详细操作请参见《关系型数据库快速入门》。
-
Flink作业设置“异常自动重启” - 数据湖探索 DLI
Flink作业设置“异常自动重启” 场景概述 DLI Flink作业具有高可用保障能力,通过设置“异常自动重启”功能,可在周边服务短时故障恢复后自动重启。 操作步骤 登录DLI控制台,选择“作业管理”>“Flink作业”。 在Flink作业编辑页面,勾选“异常自动重启”。例如,图1所示。
-
Flink作业如何保存作业日志 - 数据湖探索 DLI
Flink作业如何保存作业日志 在创建Flink SQL作业或者Flink Jar作业时,可以在作业编辑页面,勾选“保存作业日志”参数,将作业运行时的日志信息保存到OBS。 勾选“保存作业日志”参数后,需配置“OBS桶”参数,选择OBS桶用于保存用户作业日志信息。如果选择的OBS
-
Flink SQL作业消费Kafka后sink到es集群,作业执行成功,但未写入数据 - 数据湖探索 DLI
作业执行成功,但未写入数据 问题现象 客户创建Flink SQL作业,消费Kafka后sink到es集群,作业执行成功,但无数据。 原因分析 查看客户作业脚本内容,排查无问题,作业执行成功,出现该问题可能的原因如下: 数据不准确。 数据处理有问题。 处理步骤 在Flink UI
-
Flink SQL作业的消费能力如何,即一天可以处理多大的数据量? - 数据湖探索 DLI
Flink SQL作业的消费能力与源端的数据发送、队列大小、作业参数配置均有关系,每秒10M峰值。 父主题: Flink SQL作业相关问题
-
查看DLI队列负载 - 数据湖探索 DLI
查看DLI队列负载 场景概述 如果需要确认DLI队列的运行状态,决定是否运行更多的作业时需要查看队列负载。 操作步骤 在控制台搜索“云监控服务 CES”。 图1 搜索CES 进入CES后,在页面左侧“云服务监控”列表中,单击“数据湖探索”。 图2 云服务监控 选择队列进行查看。 图3
-
Spark jar 如何读取上传文件 - 数据湖探索 DLI
Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径,即:SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的,所以不能将Driver中获取到的
-
怎样升级DLI作业的引擎版本 - 数据湖探索 DLI
怎样升级DLI作业的引擎版本 DLI提供了Spark和Flink计算引擎,为用户提供了一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务,当前,Flink计算引擎推荐版本:Flink 1.15,Spark计算引擎推荐版本: Spark 3.3.1。 本节操作介绍如何升级作业的引擎版本。
-
提交SQL作业时,返回“unsupported media Type”信息 - 数据湖探索 DLI
tion/json”,若设置为“text”则会报错,报错信息为“unsupported media Type”。 父主题: 使用API相关问题
-
count函数如何进行聚合 - 数据湖探索 DLI
count函数如何进行聚合 使用count函数进行聚合的正确用法如下: SELECT http_method, count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method
-
OBS表压缩率较高 - 数据湖探索 DLI
OBS表压缩率较高 当Parquet/Orc格式的OBS表对应的文件压缩率较高时(跟文本相比,超过5倍压缩率),建议在提交导入数据到DLI表作业时,在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”,
-
查看DLI的执行SQL记录 - 数据湖探索 DLI
查看DLI的执行SQL记录 场景概述 执行SQL作业过程中需要查看对应的记录。 操作步骤 登录DLI管理控制台。 在左侧导航栏单击“作业管理”>“SQL作业”进入SQL作业管理页面。 输入作业ID或者执行的语句可以筛选所要查看的作业。 父主题: 运维指导
-
DLI如何访问OBS桶中的数据 - 数据湖探索 DLI
DLI如何访问OBS桶中的数据 创建OBS表。 具体语法请参考《数据湖探索SQL语法参考》。 添加分区。 具体语法请参考《数据湖探索SQL语法参考》。 往分区导入OBS桶中的数据。 具体语法请参考《数据湖探索SQL语法参考》。 查询数据。 具体语法请参考《数据湖探索SQL语法参考》。
-
DLI Flink与MRS Flink有什么区别? - 数据湖探索 DLI
DLI Flink与MRS Flink有什么区别? DLI Flink是天然的云原生基础架构。在内核引擎上DLI Flink进行了多处核心功能的优化,并且提供了企业级的一站式开发平台,自带开发和运维功能,免除自建集群运维的麻烦;在connector方面除了支持开源connecto
-
DLI创建跨源连接,进行绑定队列一直在创建中怎么办? - 数据湖探索 DLI
即可创建成功。 若刚刚对队列进行网段修改,立即进行绑定队列。通常需要等待5~10分钟,待后台重建集群后,即可创建成功。 父主题: 跨源连接问题
-
Flink作业提交错误,如何定位 - 数据湖探索 DLI
Flink作业提交错误,如何定位 在Flink作业管理页面,将鼠标悬停到提交失败的作业状态上,查看失败的简要信息。 常见的失败原因可能包括: CU资源不足:需扩容队列。 生成jar包失败:检查SQL语法及UDF等。 如果信息不足以定位或者是调用栈错误,可以进一步单击作业名称,进入