搜索_华为云

cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回DOUBLE类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表salary，并添加数据，命令示例如下：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Hudi数据表Compaction规范 - 数据湖探索 DLI

新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
OFFSET - 数据湖探索 DLI
OFFSET - 数据湖探索 DLI

peach pear watermelon (3 rows) 否则，如果没有使用ORDER BY，被丢弃的行可能是任意的行。如果OFFSET指定的行数等于或超过了结果集的大小，则最终返回的结果为空。父主题： DQL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

参数是否必选参数类型说明 json 是 STRING 标准的JSON格式对象，格式为{Key:Value, Key:Value,...} path 是 STRING 表示在json中的path，以$开头。不同字符的含义如下： $表示根节点。 .表示子节点。 []表示[number]表示数组下标，从0开始。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

TE BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
获取作业模板 - 数据湖探索 DLI

模板所在分组名。 description String 模板描述信息。 language String 语言。 owner String 模板创建者。请求示例无响应示例 { "name": "test2", "body": { "auto_recovery":

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
窗口关联 - 数据湖探索 DLI
窗口关联 - 数据湖探索 DLI

同一窗口且符合 join 条件的元素 join 起来。窗口关联的语义和 DataStream window join 相同。在流式查询中，与其他连续表上的关联不同，窗口关联不产生中间结果，只在窗口结束产生一个最终的结果。另外，窗口关联会清除不需要的中间状态。通常，窗口关联和窗口表值函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

导致队列资源爆满，作业运行失败怎么办？问题现象运行的SQL语句中存在join表，但是join没有添加on条件，多表关联造成笛卡尔积查询，最终导致队列资源占满，该队列上的作业运行失败。例如，如下问题SQL语句，存在三个表的left join，并且没有指定on条件，造成笛卡尔积查询。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.1.1版本所做的变更说明。更多Spark 3.1.1版本说明请参考Spark Release Notes。 Spark 3.1.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
数学函数和运算符 - 数据湖探索 DLI

返回x的以2为底的对数 select log2(4);-- 2.0 log10(x) → double 返回x的以10为底的对数 select log10(1000);-- 3.0 log(b, x) → double 返回x的以b为底的对数 select log(3,81); -- 4.0 mod(n

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

Hbase表导入数据，executor报错：RegionTooBusyException 问题现象客户通过DLI跨源表向CloudTable Hbase导入数据，原始数据：HBASE表，一个列簇，一个rowkey运行一个亿的模拟数据，数据量为9.76GB。导入1000W条数据后作业失败。原因分析查看driver错误日志。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

concurrently updated 问题现象客户对DWS执行并发insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated。原因分析客户作业存在并发操作，同时对一张表执行两个insert

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
查询指定地址连通性测试详情 - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 queue_name 是 String 队列名称。 task_id 是 String 任务ID。该参数为创建指定地址连通性测试请求接口获取。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选参数类型说明 is_success

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

SSS' version_code 1.3.1中查询结果中的版本号所需权限 SQL权限表2 RESTORE所需权限列表权限描述表的UPDATE权限细粒度权限：dli:table:update。由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
查询作业执行进度信息 - 数据湖探索 DLI

rogress表示整个作业的运行进度，因为没有子作业在运行，sub_job_id不展示。如果有子作业在运行中，则展示该子作业的运行进度，progress的计算方法为：子作业已经完成的task数除以子作业总的task数。此时progress表示子作业的运行进度，sub_job_id展示。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Hudi表索引设计规范 - 数据湖探索 DLI

基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题，还是可以继续采用Flink状态索引，按照规范去优化对应的配置参数即可。建议基于Flink的流式写入的表，在数据量超

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
字符串函数概览 - 数据湖探索 DLI

次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定字符串replace_string后，返回结果字符适用于Spark3.3.1：用于将source字符串中第occurrence次匹配pattern的子串，以及之后匹配pattern的子串，全都替换成指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

窗口偏移 Offset 可选参数，可以用来改变窗口的分配。可以是正或者负的区间。默认情况下窗口的偏移是 0。不同的偏移值可以决定记录分配的窗口。例如：在 10 分钟大小的滚动窗口下，时间戳为 2021-06-30 00:00:04 的数据会被分配到哪个窗口呢？当 offset 为

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
DELETE - 数据湖探索 DLI
DELETE - 数据湖探索 DLI

Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 boolExpression 删除项的过滤条件所需权限 SQL权限表2 DELETE所需权限列表权限描述表的DELETE权限

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
UPDATE - 数据湖探索 DLI
UPDATE - 数据湖探索 DLI

table_name Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 column 待更新的目标列。 EXPRESSION 需在目标表中更新的源表列值的表达式。 boolExpression

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明

总条数： 1086

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

cume - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

OFFSET - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

获取作业模板 - 数据湖探索 DLI

窗口关联 - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

Spark 3.1.1版本说明 - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

查询指定地址连通性测试详情 - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

字符串函数概览 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

DELETE - 数据湖探索 DLI

UPDATE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线