搜索_华为云

Spark jar 如何读取上传文件 - 数据湖探索 DLI

Spark jar 如何读取上传文件 Spark可以使用SparkFiles读取 –-file中提交上来的文件的本地路径，即：SparkFiles.get("上传的文件名")。 Driver中的文件路径与Executor中获取的路径位置是不一致的，所以不能将Driver中获取到的路径作为参数传给Executor去执行。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

启动作业后，系统将自动跳转到Flink作业管理页面，新创建的作业将显示在作业列表中，在“状态”列中可以查看作业状态。作业提交成功后，状态将由“提交中”变为“运行中”。如果作业状态为“提交失败”或“运行异常”，表示作业提交或运行失败。用户可以在作业列表中的“状态”列中，将鼠标移动到状态图标上查看错误信息，单击可以

 帮助中心 > 数据湖探索 DLI > 快速入门
Flink作业运行异常，如何定位 - 数据湖探索 DLI

Flink作业运行异常，如何定位在“Flink作业”管理页面，对应作业“操作”列单击“编辑”按钮，在作业运行界面确认作业是否勾选“保存作业日志”参数。图1 保存作业日志是，则执行3。否，则运行日志不会转储OBS桶，需要先执行2保存作业运行日志。在作业运行界面勾选“保存作

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
从Kafka读取数据写入到RDS - 数据湖探索 DLI

称，进入到Kafka的基本信息页面。在“连接信息”中获取该Kafka的“内网连接地址”，在“基本信息”的“网络”中获取该实例的“虚拟私有云”和“子网”信息，方便后续操作步骤使用。单击“网络”中的安全组名称，在“入方向规则”中添加放通队列网段的规则。例如，本示例队列网段为“10

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

双击DLI表名dli_testtable，单击“执行”查询DLI表数据。图16 查询DLI表数据注释掉DLI表查询语句，双击OBS表名dli_testobstable，单击“执行”查询OBS表数据。图17 查询OBS表数据如果作业运行失败则作业状态显示为“已失败”，单击“操作”列“更多”下的“Driv

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

功能描述本节操作介绍删除分区表的一个或多个分区。分区表分为两种，OBS表和DLI表。在删除分区时，DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 分区表相关
创建DLI表关联DWS - 数据湖探索 DLI

SERIALIZABLE 默认值为“READ_UNCOMMITTED”。注意事项创建DWS关联表时，不需要指定关联表的Schema。DLI会自动获取DWS中对应参数"dbtable"中的表的Schema。示例 1 2 3 4 5 6 CREATE TABLE IF NOT EXISTS

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
插入数据至OpenTSDB表 - 数据湖探索 DLI

插入数据至OpenTSDB表功能描述使用INSERT INTO命令将DLI表中的数据插入到已关联的OpenTSDB metric中。若OpenTSDB上不存在metric，插入数据时会在OpenTSDB上自动创建一个新的metric。语法格式 1 INSERT INTO TABLE

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 跨源连接OpenTSDB表
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

作业时，开启“恢复保存点”，作业将从选择的savepoint文件中恢复消费位点及状态。同时，由于Flink Checkpoint和Savepoint生成机制及格式一致，因而，也可以通过Flink作业列表“操作”列中的“更多”>“导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

如何给子用户授权查看Flink作业？子用户使用DLI时，可以查看队列，但是不能查看Flink作业，可以通过在DLI中对子用户授权，或在IAM中对子用户授权： DLI授权管理使用租户账号，或者作业owner账号，或有DLI Service Administrator权限的账号，登录DLI控制台。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
创建DLI表关联DDS - 数据湖探索 DLI

database DDS的数据库名，如果在"url"中同时指定了数据库名，则"url"中的数据库名不生效。 collection DDS中的collection名，如果在"url"中同时指定了collection，则"url"中的collection不生效。 user （已废弃）访问DDS集群用户名。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
配置时间模型 - 数据湖探索 DLI

SET WATERMARK(rows literal, interval {time_unit}) 一个逗号表示一个参数，第一个参数表示Watermark发送周期，第二个参数表示允许最大延迟时间。注意事项无。示例 time2事件产生时间开始，每10s发送一次watermark，事件最大允许延迟时间为20s。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
配置时间模型 - 数据湖探索 DLI

SET WATERMARK(rows literal, interval {time_unit}) 一个逗号表示一个参数，第一个参数表示Watermark发送周期，第二个参数表示允许最大延迟时间。注意事项无。示例 time2事件产生时间开始，每10s发送一次watermark，事件最大允许延迟时间为20s。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

步骤3：创建数据库 DLI元数据是SQL作业开发的基础。在执行作业前您需要根据业务场景定义数据库和表。步骤4：创建表数据库创建完成后，需要在数据库db1中基于OBS上的样本数据创建表。步骤5：查询数据使用标准SQL语句进行数据的查询和分析。准备工作已注册华为账号并开通华

 帮助中心 > 数据湖探索 DLI > 快速入门
如何申请扩大配额 - 数据湖探索 DLI

如何申请扩大配额如何申请扩大配额？登录管理控制台。在页面右上角，选择“资源 > 我的配额”。系统进入“服务配额”页面。图1 我的配额单击“申请扩大配额”。在“新建工单”页面，根据您的需求，填写相关参数。其中，“问题描述”项请填写需要调整的内容和申请原因。填写完毕后，勾选协议并单击“提交”。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度操作场景 Spark作业在执行shuffle类语句，包括group by、join等场景时，常常会出现数据倾斜的问题，导致作业任务执行缓慢。该问题可以通过设置spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Jar作业是否支持上传配置文件，要如何操作？ Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName.class

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

ckpoint恢复。应用场景本文列举了一些常见的从checkpoint恢复的场景供您参考，如表1所示。更多场景你可以使用从checkpoint恢复的原则结合实际情况进行判断。表1 从checkpoint恢复的常见场景场景是否支持恢复说明调整或者增加并行数不支持

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

列到外部数据源之间的网络。当前Spark作业支持访问的外部数据源详情请参考DLI常用跨源分析开发方式。创建跨源连接操作请参见配置DLI与数据源网络连通（增强型跨源连接）。创建完跨源连接后，可以通过“资源管理 > 队列管理”页面，单击“操作”列“更多”中的“测试地址连通性”，

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DWS输出流（通过OBS转储方式） - 数据湖探索 DLI

使用ORC格式，需先在DWS中创建外部服务器，具体可参考《数据仓库服务数据库开发指南》中“创建外部服务器”章节。 CSV： CSV格式默认记录分隔符为换行符，若属性内容中有换行符，建议配置quote，具体参见表1。如果要写入的表不存在，则会自动创建表。由于DLI SQL类型不支

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流

总条数： 1124

上一页
1
...
10
11
12
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark jar 如何读取上传文件 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Flink作业运行异常，如何定位 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

插入数据至OpenTSDB表 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

如何给子用户授权查看Flink作业？ - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

配置时间模型 - 数据湖探索 DLI

配置时间模型 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

如何申请扩大配额 - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

DWS输出流（通过OBS转储方式） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线