搜索_华为云

自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击数据管理>“程序包管理”，然后点击创建，并使用OBS中的jar包创建相应的程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

apache/superset 启动Superset容器，并将容器的8088端口映射到宿主机的8088端口。访问Superset：在浏览器中访问http://IP:8088 (IP为superset部署的机器)，使用在安装Superset时设置的用户名和密码登录Superset。在Super

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询批处理作业详情 - 数据湖探索 DLI

Long 批处理作业的创建时间。是单位为“毫秒”的时间戳。 update_time 否 Long 批处理作业的更新时间。是单位为“毫秒”的时间戳。 feature 否 String 作业特性。表示用户作业使用的Spark镜像类型。 basic：表示使用DLI提供的基础Spark镜像。

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

表就地转换为 Delta 表。此命令会列出目录中的所有文件，创建 Delta Lake 事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构。转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
CREATE TABLE AS SELECT - 数据湖探索 DLI

CREATE TABLE AS SELECT 命令功能 CREATE TABLE As SELECT命令通过指定带有表属性的字段列表来创建Hudi Table。在使用由DLI提供的元数据服务时仅可创建外表，即需要通过LOCATION指定表路径。命令格式 CREATE TABLE [ IF NOT

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
查询增强型跨源授权信息 - 数据湖探索 DLI

Array of Object 跨源连接各个授权项目的信息。具体参数请参考表3。表3 privileges参数参数名称是否必选参数类型说明 object 否 String 授权时object的信息。 applicant_project_id 否 String 授权的项目ID。 privileges

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

lastModified 最后一次修改的时间戳 partitionColumns 分区列 numFiles 表的最新版本中的文件个数 sizeInBytes 表的最新快照的大小（以字节为单位） properties 为此表设置的所有属性 minReaderVersion 可以读取该表的最低Reader版本

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子 quota 名称配额（名称配额是对当前目录树中的文件和目录名称数量的硬性限制） space_quota 空间配额（空间配额是对当前目录树中的文件所使用的字节数量的硬性限制）注意事项使用由DLI提供的元数据服务时，不支持本命令。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

11版本停止服务（EOS）后，不再提供该软件版本的任何技术服务支持。建议您在执行作业时选择新版本的Flink引擎，推荐使用DLI Flink 1.15版本。正在使用Flink 1.10、Flink1.11版本的作业也请您尽快切换至新版本的Flink引擎，否则作业执行过程中出现的错误，不再提供该版本的任何技术服务支持。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
SQL作业运行慢如何定位 - 数据湖探索 DLI

参考图10可以看到数据倾斜时，单个任务的shuffle数据远大于其他Task的数据，导致该任务耗时时间变长。图10 数据倾斜示例图数据倾斜原因和解决： Shuffle的数据倾斜基本是由于join中的key值数量不均衡导致。对join连接条件进行group by 和count，统计每个连接条件的key值的数量。示例如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Confluent Avro Format - 数据湖探索 DLI

ent avro的形式写入作为sink的topic中。根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
查询批处理作业列表 - 数据湖探索 DLI

起始批处理作业的索引号，默认从0开始。 size 否 Integer 查询批处理作业的数量。 state 否 String 根据作业状态查询批作业。 owner 否 String 提交作业的用户。请求消息无请求参数。响应消息表3 响应参数说明参数名称是否必选参数类型说明 from

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询作业监控信息（废弃） - 数据湖探索 DLI

表5 jobs参数说明参数名称是否必选参数类型说明 job_id 否 Long 作业ID。 metrics 否 Object 作业的所有输入输出监控信息。具体请参考表6。表6 metrics参数说明参数名称是否必选参数类型说明 sources 否 Array of Objects

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > Flink作业相关API（废弃）
Upsert Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

处理时间属性。在批计算模式，窗口表函数的时间属性字段必须是 TIMESTAMP 或 TIMESTAMP_LTZ 的类型。 TUMBLE 的返回值包括原始表的所有列和附加的三个用于指定窗口的列，分别是：“window_start”，“window_end”，“window_time”。函数运行后，原有的时间属性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
Confluent Avro Format - 数据湖探索 DLI

注册或抓取schema的Confluent Schema Registry的URL。示例 1. 从kafka中作为source的topic中读取json数据，并以confluent avro的形式写入作为sink的topic中根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
常用操作与系统权限关系 - 数据湖探索 DLI

SHOW_USERS 显示所有角色和用户的绑定关系 √ × √ √ GRANT_PRIVILEGE 数据库的赋权 √ × √ √ REVOKE_PRIVILEGE 数据库权限的回收 √ × √ √ SHOW_PRIVILEGES 查看其他用户具备的数据库权限 √ × √ √ DISPLAY_ALL_TABLES

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
队列赋权（废弃） - 数据湖探索 DLI

该API用于与其他用户共享指定的队列，可以给用户赋使用指定的队列的权限或者收回使用权限。用户所属的用户组需要在所属区域内具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
开启或关闭数据多版本 - 数据湖探索 DLI

开启或关闭数据多版本功能描述 DLI提供多版本功能，用于数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他多版本SQL语法请参考多版本备份恢复数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
Spark SQL语法概览 - 数据湖探索 DLI

Spark SQL语法概览本章节介绍了目前DLI所提供的Spark SQL语法列表。参数说明，示例等详细信息请参考具体的语法说明。表1 批作业SQL语法语法分类操作链接数据库相关语法创建数据库删除数据库查看指定数据库查看所有数据库创建OBS表相关语法使用DataSource语法创建OBS表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考

总条数： 530

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自定义函数 - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

查询增强型跨源授权信息 - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

查询作业监控信息（废弃） - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

常用操作与系统权限关系 - 数据湖探索 DLI

队列赋权（废弃） - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线