搜索_华为云

概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述数据类型是数据的一个基本属性，用于区分不同类型的数据。不同的数据类型所占的存储空间不同，能够进行的操作也不相同。数据库中的数据存储在表中。表中的每一列都定义了数据类型，用户存储数据时，须遵从这些数据类型的属性，否则可能会出错。 DLI当前只支持原生数据类型。父主题：数据类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

Flink 支持将 Ogg JSON 消息解析为 INSERT/UPDATE/DELETE 消息到 Flink SQL 系统中。在很多情况下，利用这个特性非常有用，例如将增量数据从数据库同步到其他系统日志审计数据库的实时物化视图关联维度数据库的变更历史，等等 Flink 还支持将

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
decode1 - 数据湖探索 DLI
decode1 - 数据湖探索 DLI

如果匹配，返回result。如果没有匹配，返回default。如果没有指定default，返回NULL。如果search选项有重复且匹配时，会返回第一个值。示例代码为便于理解函数的使用方法，本文为您提供源数据，基于源数据提供函数相关示例。创建表salary，并添加数据，命令示例如下： CREATE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
ltrim - 数据湖探索 DLI
ltrim - 数据湖探索 DLI

ltrim函数用于从str的左端去除字符：如果未指定trimChars，则默认去除空格字符。如果指定了trimChars，则以trimChars中包含的字符作为一个集合，从str的左端去除尽可能长的所有字符都在集合trimChars中的子串。相似函数： rtrim，rtrim函数用于从str的右端去除字符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

年制定的标准，用于决策支持系统方面的测试基准）发展而来的。TPC-H用3NF实现了一个数据仓库，共包含8个基本关系，其数据量可以设定从1G~3T不等。TPC-H 基准测试包括 22 个查询(Q1~Q22)，其主要评价指标是各个查询的响应时间，即从提交查询到结果返回所需时间。TPC-H 基准测试的度量单位是每小时执行的查询数(

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
max - 数据湖探索 DLI
max - 数据湖探索 DLI

指定表名。必须对表有读权限。返回值说明返回STRING类型的值。返回最大的一级分区的值。如果只是用alter table的方式新加了一个分区，但是此分区中并无任何数据，则此分区不会做为返回值。示例代码例如 table1 是分区表，该表对应的分区为20120801和201

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表功能描述 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。DLI将Flink作业的输出数据以upsert的模式输出到Kafka中。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
WITH...AS - 数据湖探索 DLI
WITH...AS - 数据湖探索 DLI

select_statement：完整的SELECT语句。 sql_containing_cte_name：包含了刚刚定义的公共表达式的SQL语句注意事项定义了一个CTE后必须马上使用，否则这个CTE定义将失效。可以通过一次WITH定义多个CTE，中间用逗号连接，后定义的CTE可以引用已经定义的CTE。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Spark3.3.x不再支持使用“0$”指定第一个参数说明： format_string(strfmt, obj, ...) 和 printf(strfmt, obj, ...) 中的 strfmt 将不再支持使用“0$”指定第一个参数，第一个参数应始终由“1$”引用当使用参数索引来指示参数在参数列表中的位置。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据问题现象使用Flink作业输出流写入数据到了OBS中，通过该OBS文件路径创建的DLI表进行数据查询时，无法查询到数据。例如，使用如下Flink结果表将数据写入到OBS的“obs://obs-sink/car_infos”路径下。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
trim - 数据湖探索 DLI
trim - 数据湖探索 DLI

trim函数用于从str的左右两端去除字符：如果未指定trimChars，则默认去除空格字符。如果指定了trimChars，则以trimChars中包含的字符作为一个集合，从str的左右两端去除尽可能长的所有字符都在集合trimChars中的子串。相似函数： ltrim，ltrim函数用于从str的左端去除字符。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Hudi Clustering操作说明 - 数据湖探索 DLI

文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
弹性资源池CU设置 - 数据湖探索 DLI

源池再添加一个队列并且该队列最小CU为256CU时，因为受到CU最大设置的控制，该队列不能添加到该弹性资源池。注意事项在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

描述 URI-scheme 表示用于传输请求的协议，当前所有API均采用HTTPS协议。 Endpoint 指定承载REST服务端点的服务器域名或IP。不同服务不同区域的Endpoint不同，您可以从地区和终端节点中查询所有服务的终端节点。例如IAM服务在“华北-北京四”区域的Endpoint为“iam

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

--命名和未命名的字段，都可以通过位置索引来访问，位置索引从1开始，且必须是一个常量 select col1[1] from row_tb; -- 1 IPADDRESS IP地址，可以表征IPv4或者IPv6地址。但在系统内，该类型是一个统一的IPv6地址。对于IPv4的支持，是通过将IPv4映射到IPv6的取值范围（RFC

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量（例如Spark初始化完成后，Flink消费Kafka时过滤掉2小时之前的数据），如果无法对k

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？队列空闲状态是指在DLI 作业管理中，该队列下均无SQL 作业运行，或者 Flink 作业运行、Spark 作业运行。即一个自然小时内无作业运行，该自然小时为空闲状态。不会进行计费。通常按需计费的队列，在空闲1h后计算资源会被释放，再次使用时，需要重新分配计算资源，可能会耗费5~10min时间。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
测试地址连通性 - 数据湖探索 DLI

在“测试地址连通性”页面填写需要测试的地址。支持域名和IP，可指定端口。数据源地址支持以下输入格式：IPv4地址、IPv4+端口号、域名、域名+端口号。 · IPv4地址：192.168.x.x · IPv4+端口号：192.168.x.x:8080 · 域名：domain-xxxxxx.com · 域名+端口号：domain-xxxxxx

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

"obs://dli-test-001/test.csv"); test.csv文件内容如下： Jordon,88,"aa bb" 因为最后一个字段的aa和bb之间存在回车换行。创建OBS外表后，查询test06表数据内容显示如下： name id classno Jordon 88

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类

总条数： 569

上一页
1
...
8
9
10
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

概述 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

decode1 - 数据湖探索 DLI

ltrim - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

max - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

WITH...AS - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

trim - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

弹性资源池CU设置 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

测试地址连通性 - 数据湖探索 DLI

创建OBS外表，由于OBS文件中的某字段存在换行符导致表字段数据错误怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线