搜索_华为云

修改全局变量 - 数据湖探索 DLI

修改全局变量功能介绍该API用于修改全局变量。调试您可以在API Explorer中调试该接口。 URI URI格式 PUT /v1.0/{project_id}/variables/{var_name} 参数说明表1 URI参数说明参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
SHOW TABLE - 数据湖探索 DLI
SHOW TABLE - 数据湖探索 DLI

SHOW TABLE 命令功能 SHOW TABLES命令用于显示所有在当前database中的table，或所有指定database的table。命令格式 SHOW TABLES [IN db_name]; 参数描述表1 SHOW TABLES参数描述参数描述 IN db_name

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置，避免因误操作丢失数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
删除全局变量 - 数据湖探索 DLI

删除全局变量功能介绍该API用于删除全局变量。只有创建全局变量的用户才可以删除对应的变量。调试您可以在API Explorer中调试该接口。 URI URI格式 DELETE /v1.0/{project_id}/variables/{var_name} 参数说明表1

帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

CLUSTERING 命令功能对Hudi表进行clustering操作，具体作用可以参考Hudi Clustering操作说明章节。命令格式执行clustering： call run_clustering(table=>'[table]', path=>'[path]',

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
查询所有弹性资源池 - 数据湖探索 DLI

查询所有弹性资源池功能介绍查询所有弹性资源池。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v3/{project_id}/elastic-resource-pools 参数说明表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Spark作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
配置多版本过期数据回收站 - 数据湖探索 DLI

配置多版本过期数据回收站功能描述在DLI数据多版本功能开启后，过期的备份数据后续在执行insert overwrite或者truncate语句时会被系统直接清理。OBS并行文件系统可以通过配置回收站加速删除操作过期的备份数据。通过在表属性添加配置“dli.multi.version

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
更新模板 - 数据湖探索 DLI
更新模板 - 数据湖探索 DLI

更新模板功能介绍该API用于对DLI服务中已有的模板进行更新。调试您可以在API Explorer中调试该接口。 URI URI格式 PUT /v1.0/{project_id}/streaming/job-templates/{template_id} 参数说明表1 URI参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业模板相关API
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

窗口 GROUP WINDOW 语法说明 Group Window定义在GROUP BY里，每个分组只输出一条记录，包括以下几种：分组函数在流处理表中的 SQL 查询中，分组窗口函数的 time_attr 参数必须引用一个合法的时间属性，且该属性需要指定行的处理时间或事件时间。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
创建并提交Spark作业 - 数据湖探索 DLI

创建并提交Spark作业场景描述本章节指导用户通过API创建并提交Spark作业。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Spark作业所需的资源包。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DLI计算引擎版本生命周期 - 数据湖探索 DLI

DLI计算引擎版本生命周期版本号说明 DLI计算引擎版本号：格式为计算引擎名称 x.y.z，其中计算引擎分为Flink和Spark，版本号具体含义如图1所示。图1 DLI计算引擎版本号版本支持情况 Flink计算引擎推荐版本：Flink 1.15。 Spark计算引擎推荐版本：

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
查询所有全局变量 - 数据湖探索 DLI

查询所有全局变量功能介绍该API用于查询当前project下所有全局变量的信息。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/variables 参数说明表1 URI参数说明参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ DLI Flink是天然的云原生基础架构。在内核引擎上DLI Flink进行了多处核心功能的优化，并且提供了企业级的一站式开发平台，自带开发和运维功能，免除自建集群运维的麻烦；在connector方面除了支持开源connecto

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
常见场景的委托权限策略 - 数据湖探索 DLI

常见场景的委托权限策略本节操作提供了DLI常见场景的委托权限策略，用于用户自定义权限时配置委托的权限策略。委托策略中的“Resource”根据需要具体情况进行替换。数据清理委托权限配置适用场景：数据清理委托，表生命周期清理数据及lakehouse表数据清理使用。该委托需新建

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Hudi数据表Compaction规范 - 数据湖探索 DLI

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

cume_dist cume_dist函数用于求累计分布，相当于求分区中大于等于或小于等于当前行的数据在分区中的占比。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数

总条数： 802

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

修改全局变量 - 数据湖探索 DLI

SHOW TABLE - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

删除全局变量 - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

查询所有弹性资源池 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

更新模板 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DLI计算引擎版本生命周期 - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

常见场景的委托权限策略 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

cume - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线