搜索_华为云

管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

Driver日志：查看运行作业的日志。重新执行作业在“Spark作业”页面，单击对应作业“操作”列中的“编辑”，跳转至“Spark作业编辑”页面，可根据需要修改参数，执行作业。查找作业在“Spark作业”页面，选择“状态”或“队列”。系统将根据设置的过滤条件，在作业列表显示符合对应条件的作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业本节操作介绍在DLI使用Hudi提交Flink SQL作业的操作步骤。具体语法说明请参考Flink OpenSource SQL1.15语法概览。进入DLI控制台，随后单击左侧菜单的“作业管理 > Flink作业”，进入Flink作业的界面。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

properties程序包创建Flink Jar作业并运行。创建Flink Jar作业，在应用程序、其他依赖文件选择步骤3导入Flink Jar，并指定主类。主要参数的填写说明：所属队列：选择Flink Jar作业运行的队列。应用程序：自定义的程序包主类：指定类名：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

OBS上的桶名称。该桶用于存放Spark程序中使用的jar包、Python程序文件、配置文件等。 obsPath 是 dli-spark-submit-resources OBS上存放jar包、Python程序文件、配置文件等的目录，该目录在bucketName指定的桶下。如果该目录不存在，程序会自动创建。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
数据赋权（用户）（废弃） - 数据湖探索 DLI

列名”，指定的列将被共享。 “jobs.flink.flink作业ID”，指定的作业将被共享。 “groups.程序包组名”，指定的程序包组将被共享。 “resources.程序包名”，指定程序包将被共享。示例值：databases.db1.tables.tb2.columns.column1。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
在DLI控制台配置数据库权限 - 数据湖探索 DLI

回收某用户具备的所有权限，或回收某项目具备的所有权限。在“用户权限信息”区域的用户列表中，选择需要回收权限的子用户，在“操作”栏中单击“回收”，在“回收用户权限”对话框中单击“确定”后，此用户将不具备数据库的任意权限。用户为管理员用户时，“回收”为灰色，表示不可回收该用户的权限。在“项目权限信息”区域的项

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？问题现象使用default队列提交SQL作业，作业运行异常，排查作业日志显示Execution Timeout异常。异常日志参考如下： [ERROR] Execute DLI SQL failed. Please

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？配置DLI队列与内网数据源的网络连通 DLI在创建运行作业需要连接外部其他数据源，如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。 DLI提供的增强型跨源连接功能，底层采用对等连接的方式打通

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

”SQL作业”跳转到SQL作业记录中检查。在执行SQL的时候配置Hudi参数： DLI不支持直接使用SET语句配置参数点击”设置”，随后在”参数设置”一栏可以配置键和值，Hudi的参数可以通过此处提交。配置在此处的参数会在提交SQL作业时被应用。随后可以在左侧菜单点击”作业管理”->”SQL作业”，随后在列表中

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

数据湖探索”，进入到云服务监控页面。在云服务监控页面，“名称”列对应队列名称，单击对应队列名称，进入到队列监控页面。在队列监控页面，分别查看以下指标查看当前队列的作业运行情况。 “提交中作业数”：展示当前队列中状态为“提交中”的作业数量。 “运行中作业数”：展示当前队列中状态为“运行中”的作业数量。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
查看Flink作业详情 - 数据湖探索 DLI

每个作业的创建时间。开始时间 Flink作业开始运行的时间。运行时长作业运行所消耗的时间。操作编辑：编辑已经创建好的作业。启动：启动作业并运行。更多 FlinkUI：单击后，将跳转至Flink任务运行情况界面。说明：如果是新建队列，在该队列提交作业后，如果立即单击Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

您也可以通过 unicode 编码在纯 SQL 文本中指定一些特殊字符，例如'csv.field-delimiter' = U&'\0001' 代表 0x01 字符。 csv.disable-quote-character 否 false Boolean 是否禁止对引用的值使用引号 (默认是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
了解数据目录、数据库和表 - 数据湖探索 DLI

数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。在DLI数据目录库下创建数据库和表请参考在DLI控制台创建数据库和表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

DLI ReadOnlyAccess 数据湖探索只读权限。只读权限可控制部分开放的、未鉴权的DLI资源和操作。例如创建全局变量、创建程序包以及程序包组、default队列提交作业、default数据库下建表、创建跨源连接、删除跨源连接等操作。系统策略无 Tenant Administrator

帮助中心 > 数据湖探索 DLI > 产品介绍
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

上。在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后点击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

剩余一个task在运行，即为数据倾斜的情况。图1 数据倾斜样例常见数据倾斜场景 Group By聚合倾斜在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

您也可以通过 unicode 编码在纯 SQL 文本中指定一些特殊字符，例如 'csv.field-delimiter' = '\u0001' 代表 0x01 字符。 csv.disable-quote-character 否 false Boolean 是否禁止对引用的值使用引号 (默认是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

列。AFTER origin_col新增列将会被加入到原始列origin_col之后，可以缺省。FIRST只能再嵌套列添加新的子列时使用，禁止top-level列使用FIRST，AFTER没有限制。示例 alter table h0 add columns(ext0 string);

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
数据湖探索简介 - 数据湖探索 DLI

用户不需要管理任何服务器，即开即用。 DLI支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。

帮助中心 > 数据湖探索 DLI > 产品介绍
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

步骤5：运行作业：DLI上创建和运行Flink OpenSource作业。步骤6：发送数据和查询结果：RDS Postgres的表上插入数据，在DWS上查看运行结果。步骤1：创建队列登录DLI管理控制台，在左侧导航栏单击“资源管理 > 队列管理”，可进入队列管理页面。在队列管理界面，单击界面右上角的“购买队列”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发

总条数： 582

上一页
1
...
5
6
7
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理Spark作业 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

数据赋权（用户）（废弃） - 数据湖探索 DLI

在DLI控制台配置数据库权限 - 数据湖探索 DLI

在default队列执行DLI SQL失败，提示超时异常怎么办？ - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

怎样判断当前DLI队列中的作业是否有积压？ - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线