搜索_华为云

Hudi数据表Compaction规范 - 数据湖探索 DLI

新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

String USER_BUCKET_NAME为用户的桶名，需要进行替换为用户的使用的OBS桶名。参数的值为用户定义在CSMS通用凭证中的键key，其Key对应的value为用户的AK（Access Key Id），需要具备访问OBS对应桶的权限。 flink.hadoop.fs.obs

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
DLI弹性资源池与队列简介 - 数据湖探索 DLI

弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。支持的队列类型：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

范围内的窗口、FOLLOWING 所描述的区间并未支持。 ORDER BY 必须指定于单个的时间属性。可以在一个 SELECT 子句中定义多个 OVER 窗口聚合。然而，对于流式查询，由于目前的限制，所有聚合的 OVER 窗口必须是相同的。 OVER 窗口需要数据是有序的。因为表没有固定的排序，所以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
逻辑运算符 - 数据湖探索 DLI
逻辑运算符 - 数据湖探索 DLI

逻辑运算符常用的逻辑操作符有AND、OR和NOT，它们的运算结果有三个值，分别为TRUE、FALSE和NULL，其中NULL代表未知。优先级顺序为：NOT>AND>OR。运算规则请参见表1，表中的A和B代表逻辑表达式。表1 逻辑运算符运算符返回类型描述 A AND B

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 运算符
DIS结果表 - 数据湖探索 DLI
DIS结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据写入数据接入服务（DIS）中。适用于将数据过滤后导入DIS通道，进行后续处理的场景。数据接入服务（Data Ingestion Service，简称DIS）为处理或分析流数据的自定义应用程序构建数据流管道，主要解决云服务外的数据实时传输到云服务内的问题。数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
复杂数据类型 - 数据湖探索 DLI

一组有序字段，使用指定的值构造ARRAY数组。可以为任意类型，要求所有字段的数据类型必须相同。 array(<value>,<value>[, ...]) 具体使用示例详见：ARRAY示例。 MAP 一组无序的键/值对，使用给定的Key和Value对生成MAP。键的类型必须是原生数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

图1描述了按需计费的DLI资源各个阶段的状态。购买后，在计费周期内资源正常运行，此阶段为有效期；当您的账号因按需资源自动扣费导致欠费后，账号将变成欠费状态，资源将陆续进入宽限期和保留期。图1 按需计费的DLI资源生命周期欠费预警系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账

 帮助中心 > 数据湖探索 DLI > 计费说明
使用DataSource语法创建DLI表 - 数据湖探索 DLI

用于CTAS命令，将源表的select查询结果或某条数据插入到新创建的DLI表中。表2 OPTIONS参数描述参数是否必选描述默认值 multiLevelDirEnable 否是否迭代查询子目录中的数据。当配置为true时，查询该表时会迭代读取该表路径中所有文件，包含子目录中的文件。 false

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
Hudi锁配置说明 - 数据湖探索 DLI

LakeCatMetastoreBasedLockProvider 关闭Hudi锁，或者使用其他的锁实现类时，存在数据丢失/异常的风险。在任何情况下，DLI不对因关闭Hudi锁，或者使用与元数据服务不匹配的锁实现类，而直接或间接导致的任何形式的损失或损害承担责任，包括但不限于商业利润损失、业务中断、数据丢失或其他财务损失。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
提交SQL作业（废弃） - 数据湖探索 DLI

另外，用户可使用其他API来对作业进行查询和管理。具体操作有：查询作业状态查询作业详细信息查询作业结果-方式一（废弃）导出查询结果查询所有作业取消作业（废弃）该API当响应消息中“job_type”为“DCL”时，为同步操作。本章节介绍的API已过时，推荐使用提交SQL作业（推荐）介绍的API。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

API中除特殊说明外，通常为同步操作，即响应消息中的“is_success”为请求是否执行成功。若API为异步操作，可根据响应消息中的“job_id”，执行查询作业状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程语言的SDK供您使用，SDK的使用方法请参见华为云开发工具包（SDK）。

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Lambda 表达式 - 数据湖探索 DLI
Lambda 表达式 - 数据湖探索 DLI

大部分SQL表达式都可以在Lambda函数体内使用，除了以下场景：不支持子查询 x -> 2 + (SELECT 3) 不支持聚合函数 x -> max(y) 示例通过transform()函数获取数组元素的平方： SELECT numbers, transform(numbers

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

myhuaweicloud.com/jarname.jar" group_name：资源包所属分组名称。查询所有资源包 DLI提供查询资源列表接口，您可以使用该接口并选择相应的资源来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 def

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
资产识别与管理 - 数据湖探索 DLI

可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置统一的标签将很容易帮助您对不同的应用进行使用量分析和成本核算。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
pyspark样例代码 - 数据湖探索 DLI

交作业，页面显示“批处理作业提交成功”说明Spark作业提交成功，可以在Spark作业管理页面查看提交的作业的状态和日志。创建Spark作业时选择的“所属队列”为创建跨源连接时所绑定的队列。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

及计算资源的费用变化。如果原队列使用的是非弹性资源池的类型的计算资源，那么使用弹性资源池资源新建队列后计算资源的费用将发生变化，具体情况以计算资源的价格详情为准。示例1：使用SQL队列，将Spark版本从Spark 2.4.x升级至Spark 3.3.1对数据表的版本有影响吗？

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

用于展示表或分区的详细信息。可以使用规则运算表达式来同时匹配多个表，但不可用于匹配分区。展示的信息将包括表的基本信息和相关的文件系统信息，其中文件系统信息包括总文件数、总文件大小、最大文件长度、最小文件长度、最后访问时间以及最后更新时间。如果指定了分区，将给出指定分区的文件系统信息，而不是分区所在表的文件系统信息。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

RDS实例的用户名。第二行凭据值的键为MySQLPassword，值为RDS实例的密码。图1 设置凭据值按需完成其他参数的配置后，单击“确定”保存凭据。了解更多请参考创建通用凭据。在DLI作业中使用DEW中创建的凭据以Flink作业为例介绍使用DEW凭据的方法。参考Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

return 表删除后，将不可恢复，请谨慎操作。完整样例代码和依赖包说明请参考：Python SDK概述。查询所有表 DLI提供查询表的接口。您可以使用该接口查询数据库下的所有表。示例代码如下： 1 2 3 4 5 6 7 8 9 def list_all_tbls(dli_client

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关

总条数： 925

上一页
1
...
39
40
41
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Compaction规范 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

逻辑运算符 - 数据湖探索 DLI

DIS结果表 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

Hudi锁配置说明 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

Lambda 表达式 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线