搜索_华为云

Json函数和运算符 - 数据湖探索 DLI

在从JSON转换为ROW时，支持JSON数组和JSON对象。 JSON数组可以具有混合元素类型，JSON Map可以有混合值类型。这使得在某些情况下无法将其转换为SQL数组和Map。为了解决该问题，HetuEngine支持对数组和Map进行部分转换： SELECT CAST(JSON'[[1

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

----|--------------z 1 | {a=1, b=HetuEngine} --字段是支持命名的，默认情况下，Row的字段是未命名的 select row(1,2e0),CAST(ROW(1, 2e0) AS ROW(x BIGINT, y DOUBLE));

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
开启Flink作业动态扩缩容 - 数据湖探索 DLI

SQL作业和Flink Jar作业。登录DLI管理控制台。单击“作业管理 > Flink作业”。选择要开启动态扩缩容的作业，单击操作列下的编辑。 Flink Opensource SQL作业单击“自定义配置”，配置动态扩缩容参数。 Flink Jar作业单击“优化参数”框，配置动态扩缩容参数。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建并提交Spark作业 - 数据湖探索 DLI

查询参数说明详情，请参见创建表（废弃）。请求示例描述：查询项目ID为48cc2c48765f481480c7db940d6409d1下gatk组中的名为luxor-router-1.1.1.jar的资源包。示例URL：GET https://{endpoint}/v2.0

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

示跨源已经绑定成功，否则表示未成功。登录RDS MySQL，并使用下述命令在flink库下创建orders表，并插入数据。创建数据库的操作可以参考创建RDS数据库。在flink数据库库下创建orders表： CREATE TABLE `flink`.`orders` ( `order_id`

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
ClickHouse结果表 - 数据湖探索 DLI

flink ON CLUSTER default_cluster; 使用以下命令在default_cluster集群节点上和flink数据库下创建表名为order的ReplicatedMergeTree表。 CREATE TABLE flink.order ON CLUSTER d

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

println(messageInfo.getMsg()); } 查询所有批处理作业 DLI提供查询批处理作业的接口。您可以使用该接口查询当前工程下的所有批处理作业信息。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 private

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
创建弹性资源池 - 数据湖探索 DLI

u 标准版：最小值为64CUs 基础版：最小值为16CUs，最大值为64CUs min_cu 是 Integer 最小CU大于等于该资源池下所有队列最小CU之和，最小值为64。标准版：最小值为64CUs 基础版：最小值为16CUs，最大值为64CUs charging_mode

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

(1 row) -- 查询web schema下的page_views表扩展信息 show table extended from web like 'page*';

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

如果为false，则表示输出数据到taskmanager的out中。 sink.parallelism 否无 Integer 为Print结果表定义并行度。默认情况下，并行度由框架决定，与上游并行度一致。示例参考创建Flink OpenSource作业，创建flink opensource sql作业

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
数据湖探索简介 - 数据湖探索 DLI

具体内容请参见《数据湖探索开发指南》。存算分离用户将数据存储到OBS后，DLI可以直接和OBS对接进行数据分析。存算分离的架构下，使得存储资源和计算资源可以分开申请和计费，降低了成本并提高了资源利用率。存算分离场景下，DLI支持OBS在创建桶时数据冗余策略选择单AZ或者多AZ存储，两种存储策略区别如下：选择

 帮助中心 > 数据湖探索 DLI > 产品介绍
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

TIMESTAMP_LTZ(3)。在流模式下为每条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。 LOCALTIME TIME 返回本地时区的当前 SQL 时间，返回类型为 TIME(0)。在流模式下为每条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Postgres CDC源表 - 数据湖探索 DLI

在PostgreSQL中创建数据库flink，并创建名为test的schema。在PostgreSQL中flink数据库的test schema下创建表名为cdc_order的表，SQL语句参考如下： create table test.cdc_order( order_id VARCHAR

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Hudi表模型设计规范 - 数据湖探索 DLI

流式计算为低时延的实时计算，需要高性能的流式读写能力，在Hudi表中存在的MOR和COW两种模型中，MOR表的流式读写性能相对较好，因此在流式计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读高低批量写高低批量读

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

支持将 Debezium JSON解析为 INSERT / UPDATE / DELETE 消息到 Flink SQL 系统中。在很多情况下，利用这个特性非常的有用，例如将增量数据从数据库同步到其他系统日志审计数据库的实时物化视图关联维度数据库的变更历史，等等。参数说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。同步数据库数据的客户端，都会有一个唯一ID，即Server ID。同一个数据库下，建议每个MySQL CDC作业配置不同的Server ID。主要原因如下： MySQL SERVER会根据该ID来维护网络连接以及Bin

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

正在使用Spark SQL对数据执行查询操作，那么推荐将文本数据文件转换为Parquet数据文件，转换需要时间，但查询性能的提升在某些情况下可能达到约30倍或更高。节省存储空间 Parquet还支持灵活的压缩选项，因此可以显著减少磁盘上的存储。存储的节省可高达约75%。资源和成本规划

 帮助中心 > 数据湖探索 DLI > 最佳实践
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

置，即每月1日0点重置免费资源。 DLI的套餐包中仅存储套餐包按自然周期重置，即每小时重置，其他套餐包按订购周期重置。适用场景通常情况下，建议您针对不同的业务创建项目：开发项目：在此项目下，大多是工程师开发调试时使用，作业随机性大，数据量小。针对这种情况，建议您使用按CU时

 帮助中心 > 数据湖探索 DLI > 计费说明
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

本文将介绍按需计费的DLI数据扫描量计费的计费规则。适用场景 DLI服务预置了名为default的队列供用户体验。用户在不确定所需队列容量或没有可创建队列空间的情况下，可以使用该队列执行作业。队列资源按需分配，按扫描量计费，适用于测试项目场景，资源消耗不高，按需计费成本更低，无需任何预付款。约束限制仅

 帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 423

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Json函数和运算符 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

Print - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线