搜索_华为云

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用DataSource语法创建OBS表功能描述本节介绍使用DataSource语法创建OBS表。 DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
使用Hive语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表功能描述使用Hive语法创建OBS表。DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。推荐使用OBS并行文件系统进行存储。并行文件系统是一种高性能文件系统，提供毫

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
普通队列弹性扩缩容 - 数据湖探索 DLI

普通队列弹性扩缩容前提条件新创建的按需计费队列需要运行作业后才可进行弹性扩缩容。本节操作仅适用于普通队列，不适用于弹性资源池队列。约束与限制 16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。目前只支持计费模式为“按需/CU时”和“按需/专属资源模式”的队列进行弹性扩缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
设置Flink作业优先级 - 数据湖探索 DLI

设置Flink作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关完整样例代码和依赖包说明请参考：Python SDK概述。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
设置Spark作业优先级 - 数据湖探索 DLI

设置Spark作业优先级操作场景在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

聚合函数聚合函数将所有的行作为输入，并返回单个聚合值作为结果。表1 聚合函数函数描述 COUNT([ ALL ] expression | DISTINCT expression1 [, expression2]*) 默认情况下或使用关键字 ALL，返回不为 NULL 的表达式的输入行数。使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
count - 数据湖探索 DLI
count - 数据湖探索 DLI

count count函数用于返回记录条数。命令格式 count([distinct|all] <colname>) 参数说明表1 参数说明参数是否必选说明 distinct或all 否表示在计数时是否去除重复记录，默认为all，即计算全部记录。如果指定distinct，则只计算唯一值数量。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
更新程序包时提示权限不足怎么办？ - 数据湖探索 DLI

更新程序包时提示权限不足怎么办？问题现象在程序包管理下，对已经存在的程序包进行更新操作时，提示如下报错信息： "error_code"*DLI.0003","error_msg":"Permission denied for resource ‘resources. xxx'

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
添加分区（只支持OBS表） - 数据湖探索 DLI

添加分区（只支持OBS表）功能描述创建OBS分区表成功后，OBS表实际还没有生成分区信息。生成分区信息主要有以下两种场景：给OBS分区表插入对应的分区数据，数据插入成功后OBS表才会生成分区元数据信息，后续则可以根据对应分区列进行查询等操作。手工拷贝分区目录和数据到OBS

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
数学运算函数 - 数据湖探索 DLI

数学运算函数关系运算符所有数据类型都可用关系运算符进行比较，并返回一个BOOLEAN类型的值。关系运算符均为双目操作符，被比较的两个数据类型必须是相同的数据类型或者是可以进行隐式转换的类型。 Flink SQL提供的关系运算符，请参见表1。表1 关系运算符运算符返回类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
监控安全风险 - 数据湖探索 DLI

监控安全风险云监控服务为用户的云上资源提供了立体化监控平台。通过云监控您可以全面了解云上的资源使用情况、业务的运行状况，并及时收到异常告警做出反应，保证业务顺畅运行。 DLI服务提供基于云监控服务CES的资源监控能力 DLI已对接云监控服务，提供基于云监控服务的资源监控能力，帮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
数学运算函数 - 数据湖探索 DLI

数学运算函数关系运算符所有数据类型都可用关系运算符进行比较，并返回一个BOOLEAN类型的值。关系运算符均为双目操作符，被比较的两个数据类型必须是相同的数据类型或者是可以进行隐式转换的类型。 Flink SQL提供的关系运算符，请参见表1。表1 关系运算符运算符返回类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
Top-N - 数据湖探索 DLI
Top-N - 数据湖探索 DLI

Top-N 功能描述 Top-N 查询是根据列排序找到N个最大或最小的值。最大值集和最小值集都被视为是一种 Top-N 的查询。若在批处理或流处理的表中需要显示出满足条件的 N 个最底层记录或最顶层记录， Top-N 查询将会十分有用。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？在大数据分析的日常工作中，合理分配和管理计算资源，可以提供良好的作业执行环境。您可以根据作业的计算需求和数据规模分配资源、调整任务执行顺序，调度不同的弹性资源池或队列资源以适应不同的工作负载。待提交作业所需的CUs需小于等于弹性资源池的

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF 操作场景 DLI支持用户使用Hive UDAF（User Defined Aggregation Function，用户定义聚合函数）可对多行数据产生作用，通常与groupBy联合使用；等同于SQL中常用的SUM()，AVG()，也是聚合函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

队列相关约束限制当前使用SDK创建的作业不支持在default队列上运行。查询所有队列 DLI提供查询队列列表接口，您可以使用该接口并选择相应的队列来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 def list_all_queues(dli_client):

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
split - 数据湖探索 DLI
split - 数据湖探索 DLI

split_cursor split_cursor表值函数可以将一行转多行，一列转为多列，仅支持在JOIN LATERAL TABLE中使用。表1 split_cursor表值函数表函数返回值类型描述 split_cursor(value, delimiter) cursor

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数 > 表值函数

总条数： 905

上一页
1
...
7
8
9
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DataSource语法创建OBS表 - 数据湖探索 DLI

使用Hive语法创建OBS表 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

count - 数据湖探索 DLI

更新程序包时提示权限不足怎么办？ - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

监控安全风险 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

Top-N - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

split - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线