搜索_华为云

管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

作业管理页面。Spark作业管理页面显示所有的Spark作业，作业数量较多时，系统分页显示，您可以查看任何状态下的作业。表1 作业管理参数参数参数说明作业ID 所提交Spark作业的ID，由系统默认生成。名称所提交Spark作业的名称。队列所提交Spark作业所在的队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI作业开发流程 - 数据湖探索 DLI

适合需要自定义函数、UDF（用户定义函数）或特定库集成的复杂数据处理场景。可以利用Flink的生态系统，实现高级流处理逻辑和状态管理。详细操作请参考创建Flink Jar作业。适用于实时数据监控、实时推荐系统等需要快速响应的场景。 Flink Jar作业适用于需要自定义流处理逻辑、复杂的状态管理或特定库集成的数据分析场景。

帮助中心 > 数据湖探索 DLI > 用户指南
开启或关闭数据多版本 - 数据湖探索 DLI

DLI提供多版本功能，用于数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
流生态作业开发指引 - 数据湖探索 DLI

流生态作业开发指引流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
权限管理概述 - 数据湖探索 DLI

资源进行指定的管理操作。了解DLI SQL常用操作与系统策略的授权关系，请参考常用操作与系统权限关系。表1 DLI系统权限系统角色/策略名称描述类别依赖关系 DLI FullAccess 数据湖探索所有权限。系统策略该角色有依赖，需要在同项目中勾选依赖的角色：创建跨源连接：VPC

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

）和丰富的API，快速与其他数据系统的集成。 Flink Jar作业：允许用户提交编译为Jar包的Flink作业，提供了更大的灵活性和自定义能力。适合需要自定义函数、UDF（用户定义函数）或特定库集成的复杂数据处理场景。可以利用Flink的生态系统，实现高级流处理逻辑和状态管理。

帮助中心 > 数据湖探索 DLI > 产品介绍
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

环境准备在进行Spark 作业访问DLI元数据开发前，请准备以下开发环境。表1 Spark Jar作业开发环境准备项说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

[28/Feb/2019:13:17:10 +0000] "GET /?p=1 HTTP/2.0" 200 5316 "https://domain.com/?p=1" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

catch”异常捕获，否则可能会造成包冲突，导致函数功能异常。环境准备在进行UDAF开发前，请准备以下开发环境。表1 UDAF开发环境准备项说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本（访问Java官网）。安装和配置IntelliJ IDEA

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

OpenSource SQL作业创建Flink作业。选择Flink版本：1.15。仅Flink 1.15及以上版本支持AOM监控。在作业运行后约30s后，系统上报作业的监控指标至AOM Prometheus实例。步骤4：在AOM仪表盘中查看监控指标 DLI支持的Prometheus监控指标请参

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

catch”异常捕获，否则可能会造成包冲突，导致函数功能异常。环境准备在进行UDTF开发前，请准备以下开发环境。表1 UDTF开发环境准备项说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建函数 - 数据湖探索 DLI
创建函数 - 数据湖探索 DLI

[USING resource,...] resource: : JAR file_uri 注意事项如果在数据库中存在同名的函数，系统将会报错。只支持Hive语法创建函数。请注意避免该场景：如果创建的自定义函数F1指定类C1，程序包名JAR1，创建自定义函数F2也指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 自定义函数
SQL作业访问报错：File not Found - 数据湖探索 DLI

SQL作业访问报错：File not Found 问题现象执行SQL作业访问报错：File not Found。可能原因可能由于文件路径错误或文件不存在导致系统无法找指定文件路径或文件。文件被占用。解决措施检查文件路径、文件名。检查文件的路径是否正确，包括目录名称和文件名。文件被占用文

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
创建SQL作业模板 - 数据湖探索 DLI

将正在使用的SQL语句保存为模板。保存模板后，不需编写SQL语句，可通过模板直接执行SQL操作。 SQL模板包括样例模板和自定义模板。当前系统默认的样例模板包括22条标准的TPC-H查询语句，可以满足用户大部分的TPC-H需求场景测试，TPC-H样例说明请参考DLI预置的SQL模板中TPC-H样例数据说明。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
如何获取项目ID？ - 数据湖探索 DLI

如何获取项目ID？项目ID是系统所在区域的ID。用户在调用API接口进行云资源管理（如创建集群）时，需要提供项目ID。查看项目ID步骤如下：注册并登录华为云管理控制台。将鼠标移动到右上角用户名上，在下拉列表中单击“我的凭证”。在“我的凭证”页面的项目列表中查看项目ID。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

发。环境准备在进行Spark Jar作业开发前，请准备以下开发环境。表1 Spark Jar作业开发环境准备项说明操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

管理SQL作业在SQL作业列表页面查看作业的基本信息 DLI SQL作业管理页面显示所有SQL作业，作业数量较多时，系统分页显示，可根据需要跳转至指定页面。您可以查看任何状态下的作业。作业列表默认按创建时间降序排列。表1 作业管理参数参数参数说明队列作业所属队列的名称。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

# Detailed Table Information

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
Hudi Clean操作说明 - 数据湖探索 DLI

commits.retained=10 // 默认值为10，根据业务场景指定 SparkDataSource（option里设置如下参数，写数据时触发） hoodie.clean.automatic=true hoodie.cleaner.commits.retained=10 //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

dn_6009_6010: null value in column "ctr" violates not-null constraint Detail: Failing row contains (400070309, 9.00, 25, null, 2020-09-22, 2020-09-23 04:30:01

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类

总条数： 539

上一页
1
...
9
10
11
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理Spark作业 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

创建函数 - 数据湖探索 DLI

SQL作业访问报错：File not Found - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

如何获取项目ID？ - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

通过DLI跨源写DWS表，非空字段出现空值异常怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线