搜索_华为云

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Function，用户定义聚合函数）可对多行数据产生作用，通常与groupBy联合使用；等同于SQL中常用的SUM()，AVG()，也是聚合函数。约束限制在DLI Console上执行UDAF相关操作时，需要使用自建的SQL队列。跨账号使用UDAF时，除了创建UDAF函数的用户，其他用户

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Table-Generating Functions）自定义表值函数，UDTF用于解决一进多出业务场景，即其输入与输出是一对多的关系，读入一行数据，输出多个值。约束限制在DLI Console上执行UDTF相关操作时，需要使用自建的SQL队列。不同的IAM用户使用UDTF时，除了创建UDTF函数的用户

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI自定义策略 - 数据湖探索 DLI

号*，无需罗列全部授权项。资源类型可以参考表4中的资源类型。操作：操作以IAM服务中已经注册的action为准。 Condition 限制条件：使策略生效的特定条件，包括条件键和运算符。条件键表示策略语句的 Condition 元素中的键值，分为全局级条件键和服务级条件键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
库表管理标签管理 - 数据湖探索 DLI

预定义标签：在标签管理服务（简称TMS）中创建的预定义标签，属于全局标签。有关预定义标签的更多信息，请参见《标签管理服务用户指南》。本节操作介绍如何为数据库和数据表添加标签、修改标签和删除标签。数据库标签管理在DLI管理控制台的左侧导航栏中，单击“数据管理> 库表管理”。在对应数据库的操作列，选择“更多>

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理数据库资源
提交SQL作业（推荐） - 数据湖探索 DLI

默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.autoBroadcastJoinThreshold 209715200 配置执行连接时显示所有工作节点的表的最大

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

Maven工程的pom.xml文件配置请参考JAVA样例代码（Flink 1.12）中“pom文件配置”说明。确保本地编译环境可以正常访问公网。约束与限制需要在DLI控制台下“全局配置 > 服务授权”开启Tenant Adminstrator（全局服务）。写入数据到OBS的桶必须为主账号下所创建的OBS桶。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

区域和项目：保持默认值即可。名称：填写具体的队列名称。新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。队列名称不区分大小写，系统会自动转换为小写。类型：队列类型选择“通用队列”。“按需计费”时需要勾选“专属资源模式”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
ClickHouse结果表 - 数据湖探索 DLI

际情况设置ClickHouse集群所在安全组规则中的端口。建立增强型跨源连接，请参考《数据湖探索用户指南》中的“增强型跨源连接”章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建MRS的ClickHouse集群，集群版本选择MRS 3.1

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建DLI表关联HBase - 数据湖探索 DLI

接。管理控制台操作请参考增强型跨源连接。请确保在DLI队列host文件中添加MRS集群master节点的“/etc/hosts”信息。如何添加IP域名映射，请参见《数据湖探索用户指南》中增强型跨源连接章节。该语法不支持安全集群。语法格式单个RowKey 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
从Kafka读取数据写入到RDS - 数据湖探索 DLI

区域和项目：保持默认值即可。名称：填写具体的队列名称。新建的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。长度限制：1~128个字符。队列名称不区分大小写，系统会自动转换为小写。类型：队列类型选择“通用队列”。“按需计费”时需要勾选“专属资源模式”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
创建DLI表关联HBase - 数据湖探索 DLI

接。管理控制台操作请参考增强型跨源连接。请确保在DLI队列host文件中添加MRS集群master节点的“/etc/hosts”信息。如何添加IP域名映射，请参见《数据湖探索用户指南》中增强型跨源连接章节。该语法不支持安全集群。语法格式单个RowKey 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 跨源连接HBase表
ClickHouse结果表 - 数据湖探索 DLI

际情况设置ClickHouse集群所在安全组规则中的端口。建立增强型跨源连接，请参考《数据湖探索用户指南》中的“增强型跨源连接”章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建MRS的ClickHouse集群，集群版本选择MRS 3.1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建DLI自定义委托权限 - 数据湖探索 DLI

访问LakeFormation元数据。访问LakeFormation Catalog元数据的权限操作流程图1 自定义委托操作流程约束与限制自定义委托名称不可与系统默认委托重复，即不可以是dli_admin_agency、dli_management_agency、dli_data_clean_agency。

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

/分区时创建的默认路径。该语句不会对表或分区原有数据产生影响，也不会修改原有的表或分区目录，但是新增的数据，都会保存到新指定的目录下。限制 ALTER TABLE table_name ADD | DROP col_name命令仅对于ORC/PARQUET存储格式的非分区表可用。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建并提交SQL作业 - 数据湖探索 DLI

默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.autoBroadcastJoinThreshold 209715200 配置执行连接时显示所有工作节点的表的最大

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
userDefined结果表 - 数据湖探索 DLI

nk OpenSource SQL作业编辑页的UDF Jar参数上传。具体Flink OpenSource SQL作业创建指导可以参考https://support.huaweicloud.com/usermanual-dli/dli_01_0498.html。语法格式 create

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
查询所有队列 - 数据湖探索 DLI

队列的资源ID。 enterprise_project_id 否 String 企业项目ID。0”表示default，即默认的企业项目。关于如何设置企业项目请参考《企业管理用户指南》。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 cidr_in_vpc 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

obs_jar_paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。例如："https://bucketname.obs.cn-north-1.myhuaweicloud.com/jarname.jar" group_name：资源包所属分组名称。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK

总条数： 510

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

DLI自定义策略 - 数据湖探索 DLI

库表管理标签管理 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线