搜索_华为云

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

注意：创建队列时，队列类型必须要选择为：SQL队列。前期准备创建DLI数据库登录DLI管理控制台，选择“SQL编辑器”，在SQL编辑器中“执行引擎”选择“spark”，“队列”选择已创建的SQL队列。在SQL编辑器中输入以下语句创建数据库“testdb”。详细的DLI创建数据库的语法可以参考创建DLI数据库。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Studio数据开发页面，选择左侧导航栏的“数据开发 > 作业开发”。图6 新建作业编辑作业信息，本例定义SQL作业名称为 “job_create_tables”。图7 编辑作业信息在作业开发页面，拖动DLI SQL节点到画布中，并单击节点编辑属性。 SQL或脚本：本例选择“SQL脚本”。并选择2.b中创建的脚本。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
设置Flink作业优先级 - 数据湖探索 DLI

作业优先级的调整需要停止作业进行编辑，并提交运行才能生效。对于Flink作业，请参考开启Flink作业动态扩缩容设置flink.dli.job.scale.enable=true开启动态扩缩容功能，再设置作业优先级。调整作业优先级需要停止作业后编辑，并重新提交运行才能生效。设置Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
将OBS数据导入至DLI - 数据湖探索 DLI

在管理控制台的左侧，单击“SQL编辑器”。在“SQL编辑器”页面左侧导航栏选择“数据库”页签，鼠标左键单击需要导入数据的表对应的数据库名，进入“表”区域。鼠标左键单击对应表右侧的，在列表菜单中选择“导入”，弹出“导入数据”页面。图2 SQL编辑器-导入数据在“导入数据”页面，参见表1填写相关信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
库表管理标签管理 - 数据湖探索 DLI

在对应数据库的操作列，选择“更多> 标签”。进入标签管理页面，显示当前数据库的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。输入框输入内容后单击'添加'，将标签添加到输入框中。图1 数据库添加/编辑标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

autoBroadcastJoinThreshold=-1，具体操作如下：登录DLI管理控制台，单击“作业管理 > SQL作业”，在对应报错作业的“操作”列，单击“编辑”进入到SQL编辑器页面。单击“设置”，在参数设置中选择“spark.sql.autoBroadcastJoinThreshold”参数，其值设置为“-1”。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
设置SQL作业优先级 - 数据湖探索 DLI

资源，即如果高优先级作业计算资源不足，则会减少低优先级作业的计算资源 SQL队列上运行的作业优先级默认为3。调整作业优先级需要停止作业后编辑，并重新提交运行才能生效。设置SQL作业优先级在“ 设置 > 参数配置”中配置如下参数，其中x为优先级取值。 spark.sql.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
在DLI控制台创建数据库和表 - 数据湖探索 DLI

创建数据库的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面创建数据库。在管理控制台左侧，单击“数据管理”>“库表管理”。在库表管理页面右上角，单击“创建数据库”可创建数据库。在“SQL编辑器”页面创建数据库。在管理控制台左侧，单击“SQL编辑器”。在左侧导航栏单击“数据库”页签右侧可创建数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。根据该验证方式，初步定位是因为文件数据量较大，文本编辑器无法全部读取。通过执行查询语句，查询OBS数据进一步进行确认，查询结果确认数据量正确。因此，该问题为验证方式不正确造成。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Key; JOIN数据倾斜解决方案登录数据湖探索管理控制台，选择“SQL作业”，在要修改的作业所在行的“操作”列，单击“编辑”进入SQL编辑器界面。在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。参数项如下，冒号前是配置项，冒号后是配置项的值。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
设置Spark作业优先级 - 数据湖探索 DLI

调整作业优先级需要停止作业后编辑，并重新提交运行才能生效。 Spark作业操作步骤在“Spark参数”中配置如下参数，其中x为优先级取值。 spark.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > Spark作业”。选择待配置的作业，单击操作列下的编辑。在“Spark参数”中配置spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

11-2.1.0.luxor.jar 10 ./spark-submit --name <name> --queue <queue_name> word_count.py 请使用"./spark-submit"，不要使用"spark-submit"，后者可能会使用本地环境中已有的Spark环境，而不是DLI队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
弹性资源池标签管理 - 数据湖探索 DLI

在对应队列的“操作”列，选择“更多> 标签”。进入标签管理页面，显示当前队列的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。配置完成一个标签，单击“添加”将标签添加到输入框中。图1 添加/编辑标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

Latest Partition 特性，仅在 Flink STREAMING 模式下支持。创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。数据类型的使用，请参考Format章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
导出DLI表数据至OBS中 - 数据湖探索 DLI

和“SQL编辑器”页面。在“数据管理”页面导出数据。在管理控制台左侧，单击“数据管理”>“库表管理”。单击需导出数据的表对应的数据库，进入该数据的“表管理”页面。在对应表（DLI表）的“操作”栏中选择“更多”中的“导出”，弹出“导出数据”页面。在“SQL编辑器”页面导出数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
队列标签管理 - 数据湖探索 DLI

在对应队列的“操作”列，选择“更多”>“标签”。进入标签管理页面，显示当前队列的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。配置完成一个标签，单击“添加”将标签添加到输入框中。图1 添加/编辑标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
创建DLI自定义委托权限 - 数据湖探索 DLI

业的正常运行。 Flink Jar作业指定委托登录DLI管理控制台，选择“作业管理 > Flink作业”。选择待编辑的Flink Jar作业，单击操作列的“编辑”。在作业配置区域配置委托信息： Flink版本：选择1.15。优化参数：配置新建的委托key-value信息，key固定为“flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

型的数据。主要是描述数据自身信息，包含源、大小、格式或其它数据特征。数据库字段中，元数据用于诠释数据仓库的内容。 SQL作业在SQL作业编辑器执行的SQL语句、导入数据和导出数据等操作，在系统中对应的执行实体，称之为SQL作业。 SQL作业适用于使用标准SQL语句进行查询的场景。通常用于结构化数据的查询和分析。

帮助中心 > 数据湖探索 DLI > 产品介绍
添加Flink作业标签 - 数据湖探索 DLI

单击需要查看的作业名称，进入“作业详情”页面。单击“标签”页签，显示当前作业的标签信息。图1 管理作业标签单击“添加/编辑标签”，弹出“添加/编辑标签”对话框。在“添加/编辑标签”对话框中配置标签参数。图2 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

击“立即授权”即可，填写其他作业执行参数后，再执行作业。图2 在DLI Spark作业编辑页面，选择自定义镜像图3 Spark作业镜像授权操作图4 在DLI Flink jar作业编辑页面，选择自定义镜像在使用API时，在作业参数中指定image参数，即可使用自定义镜像运

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作

总条数： 219

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

库表管理标签管理 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

弹性资源池标签管理 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

队列标签管理 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线