搜索_华为云

概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述数据类型是数据的一个基本属性，用于区分不同类型的数据。不同的数据类型所占的存储空间不同，能够进行的操作也不相同。数据库中的数据存储在表中。表中的每一列都定义了数据类型，用户存储数据时，须遵从这些数据类型的属性，否则可能会出错。 DLI当前只支持原生数据类型。父主题：数据类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

Ogg Format 功能描述 Oracle GoldenGate (a.k.a ogg) 是一个实现异构 IT 环境间数据实时数据集成和复制的综合软件包。该产品集支持高可用性解决方案、实时数据集成、事务更改数据捕获、运营和分析企业系统之间的数据复制、转换和验证。Ogg 为变更日志提供了统一的格式结构，并支持使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
max - 数据湖探索 DLI
max - 数据湖探索 DLI

指定表名。必须对表有读权限。返回值说明返回STRING类型的值。返回最大的一级分区的值。如果只是用alter table的方式新加了一个分区，但是此分区中并无任何数据，则此分区不会做为返回值。示例代码例如 table1 是分区表，该表对应的分区为20120801和201

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
rank - 数据湖探索 DLI
rank - 数据湖探索 DLI

参数说明参数是否必选说明 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。 orderby_clause 否指定数据在一个窗口内如何排序。返回值说明返回INT类型的值。 a为NULL，则返回NULL。示例代码为便于理解函数的

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

topic。表类型支持源表和结果表。作为source，upsert-kafka 连接器生产changelog流，其中每条数据记录代表一个更新或删除事件。数据记录中的value被解释为同一key的最后一个value的UPDATE，如果有这个key（如果不存在相应的key，则该更新被视为INSERT）。用表来类比，changelog

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建DLI表关联DWS - 数据湖探索 DLI

'upperBound'='100', 'numPartitions'='2' 表示在DLI中会起2个并发task，一个task执行id>=0 and id < 50，另一个task执行id >=50 and id < 100。 fetchsize 读取数据时，每一批次获取数据的记录数

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
trim - 数据湖探索 DLI
trim - 数据湖探索 DLI

trim函数用于从str的左右两端去除字符：如果未指定trimChars，则默认去除空格字符。如果指定了trimChars，则以trimChars中包含的字符作为一个集合，从str的左右两端去除尽可能长的所有字符都在集合trimChars中的子串。相似函数： ltrim，ltrim函数用于从str的左端去除字符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对k

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？队列空闲状态是指在DLI 作业管理中，该队列下均无SQL 作业运行，或者 Flink 作业运行、Spark 作业运行。即一个自然小时内无作业运行，该自然小时为空闲状态。不会进行计费。通常按需计费的队列，在空闲1h后计算资源会被释放，再次使用时，需要重新分配计算资源，可能会耗费5~10min时间。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

本节操作介绍DBT连接DLI的操作步骤。操作前准备环境要求确保您的系统环境满足以下要求。操作系统：Windows 或 Linux DBT是一个基于Python的工具，请确保已安装了Python。 Python 版本：Python 3.8 或更高版本，推荐使用 Python 3.8

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

--命名和未命名的字段，都可以通过位置索引来访问，位置索引从1开始，且必须是一个常量 select col1[1] from row_tb; -- 1 IPADDRESS IP地址，可以表征IPv4或者IPv6地址。但在系统内，该类型是一个统一的IPv6地址。对于IPv4的支持，是通过将IPv4映射到IPv6的取值范围（RFC

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
keyvalue - 数据湖探索 DLI
keyvalue - 数据湖探索 DLI

split1或split2值为NULL时，返回NULL。 str或key值为NULL或没有匹配的key时，返回NULL。如果有多个Key-Value匹配，返回第一个匹配上的key对应的Value。示例代码返回2。 select keyvalue('a:1;b:2', 'b'); 返回2。 select

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Hudi Clustering操作说明 - 数据湖探索 DLI

操作，如insert/upsert/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
WITH...AS - 数据湖探索 DLI
WITH...AS - 数据湖探索 DLI

select_statement：完整的SELECT语句。 sql_containing_cte_name：包含了刚刚定义的公共表达式的SQL语句注意事项定义了一个CTE后必须马上使用，否则这个CTE定义将失效。可以通过一次WITH定义多个CTE，中间用逗号连接，后定义的CTE可以引用已经定义的CTE。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

topic中插入如下测试数据。关联上一个分区create_time='create_time_1'数据： {"product_id": "product_id_13", "user_name": "name13"} 查看print结果表数据。可观察到hive维表中的前一个分区create_ti

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Spark3.3.x不再支持使用“0$”指定第一个参数说明： format_string(strfmt, obj, ...) 和 printf(strfmt, obj, ...) 中的 strfmt 将不再支持使用“0$”指定第一个参数，第一个参数应始终由“1$”引用当使用参数索引来指示参数在参数列表中的位置。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
导出数据（废弃） - 数据湖探索 DLI

路径必须指定到文件夹级别。OBS路径中不支持逗号，且其中的桶名不能以正则格式“.[0-9]+(.*)”结尾，即，若桶名包含“.”，则最后一个“.”不可以数字开头（例如：**.12abc 或 **.12）。支持跨账号导出数据，即，如果B账户对A账户授权后，A账户拥有B账户OBS

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

为了便于理解删除分区语句的使用方法，本节示例为您提供源数据，基于源数据提供删除分区的操作示例。使用DataSource语法创建一个OBS表分区表。创建了一个名为student的OBS分区表，表中有学生学号（id），学生姓名（name），学生院系编号（facultyNo）和学生班级

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

Hbase源表功能描述创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表

总条数： 495

上一页
1
...
7
8
9
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

概述 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

max - 数据湖探索 DLI

rank - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

trim - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

keyvalue - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

WITH...AS - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

导出数据（废弃） - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线