搜索_华为云

Hudi数据表Compaction规范 - 数据湖探索 DLI

方案，即完成了入库又完成Compaction。但是Compaction操作是非常消耗内存和IO的，它会给流式入库作业带来以下影响：增加端到端时延：Compaction会放大写入时延，因为Compaction比入库更耗时。作业不稳定：Compaction会给入库作业带来更多的不稳定性，Compaction

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

DEFAULT CHARACTER SET = utf8mb4; 步骤3：创建DWS数据库和表连接已创建的DWS集群。请参考使用gsql命令行客户端连接DWS集群。执行以下命令连接DWS集群的默认数据库“gaussdb”： gsql -d gaussdb -h DWS集群连接地址 -U

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

源表：源表是Flink作业的数据输入表，例如Kafka等实时流数据输入。维表：数据源表的辅助表，用于丰富和扩展源表的数据。在Flink作业中，因为数据采集端采集到的数据往往比较有限，在做数据分析之前，就要先将所需的维度信息补全，而维表就是代表存储数据维度信息的数据源。常见的用户维表有 MySQL，Redis等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
ClickHouse结果表 - 数据湖探索 DLI

ouse和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。使用ClickHouse客户端连接到ClickHouse服务端，并使用以下命令查询集群标识符cluster等其他环境参数信息。 select cluster,shard_num,replica_num

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

形式，导致schema不匹配，作业执行失败。原因分析 DLI跨源表执行insert操作时，会将DWS源表删除重建，客户没有对应更新DLI端跨源表建表语句，导致更新的DWS源表被替换。处理步骤新建DLI跨源表，并添加建表配置项 truncate = true（只清空表数据，不删除表）。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

时间函数 Flink OpenSource SQL所支持的时间函数如表1所示。函数说明表1 时间函数函数返回值描述 DATE string DATE 将日期字符串以"yyyy-MM-dd"的形式解析为SQL日期。 TIME string TIME 将时间字符串以"HH:mm:ss[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

时间函数 Flink OpenSource SQL所支持的时间函数如表1所示。函数说明表1 时间函数函数返回值描述 DATE string DATE 将日期字符串以"yyyy-MM-dd"的形式解析为SQL日期。 TIME string TIME 将时间字符串以"HH:mm:ss[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

c-xxx-dependencies.jar。 DBeaver客户端安装包： DBeaver官网提供了针对不同操作系统的客户端安装包，单击下载DBeaver访问DBeaver官网下载系统对应的DBeaver客户端安装包并完成安装。推荐使用24.0.3版本的DBeaver。连接信息：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

同步数据库数据的客户端，都会有一个唯一ID，即Server ID。同一个数据库下，建议每个MySQL CDC作业配置不同的Server ID。主要原因如下： MySQL SERVER会根据该ID来维护网络连接以及Binlog位点。因此如果有大量相同的Server ID的客户端一起连接MySQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

时间函数 Flink OpenSource SQL所支持的时间函数如表1所示。函数说明表1 时间函数函数返回值描述 DATE string DATE 以“yyyy-MM-dd”的形式返回从字符串解析的 SQL 日期。 DATE_ADD STRING 指定日期增加目标天数后的日期，数据类型为STRING。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
队列相关API（推荐） - 数据湖探索 DLI

队列相关API（推荐）创建队列删除队列查询所有队列查询队列详情重启/扩容/缩容队列创建指定地址连通性测试请求查询指定地址连通性测试详情

 帮助中心 > 数据湖探索 DLI > API参考
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

cdc_order REPLICA IDENTITY FULL; 步骤3：创建DWS数据库和表连接已创建的DWS集群。请参考使用gsql命令行客户端连接DWS集群。执行以下命令连接DWS集群的默认数据库“gaussdb”： gsql -d gaussdb -h DWS集群连接地址 -U

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
复杂数据类型 - 数据湖探索 DLI

复杂数据类型 Spark SQL支持复杂数据类型，如表1所示。表1 复杂数据类型数据类型描述使用格式 ARRAY 一组有序字段，使用指定的值构造ARRAY数组。可以为任意类型，要求所有字段的数据类型必须相同。 array(<value>,<value>[, ...]) 具体使用示例详见：ARRAY示例。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
从Kafka读取数据写入到RDS - 数据湖探索 DLI

启动作业，确认作业参数信息，单击“立即启动”开始执行作业。等待作业运行状态变为“运行中”。步骤6：发送数据和查询结果使用Kafka客户端向步骤2：创建Kafka的Topic中的Topic发送数据，模拟实时数据流。 Kafka生产和发送数据的方法请参考：DMS - 连接实例生产消费信息。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

实例”，获取kafka角色实例的IP地址，为后续步骤做准备。参考安装MRS客户端下载并安装Kafka客户端。例如，当前Kafka客户端安装在MRS主机节点的“/opt/kafkaclient”目录上。以root用户进入客户端安装目录下。例如：cd /opt/kafkaclient 执行以下命令配置环境变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

Raw Format 功能描述 Raw format 允许读写原始（基于字节）值作为单个列。注意: 这种格式将 null 值编码成 byte[] 类型的 null。这样在 upsert-kafka 中使用时可能会有限制，因为 upsert-kafka 将 null 值视为墓碑

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池操作场景如果其他弹性资源池想要通过已创建的增强型跨源连接来连接数据源，可以在增强型跨源连接页面绑定弹性资源池。本节的操作指导介绍增强型跨源连接绑定弹性资源池的操作指导。约束限制增强型跨源仅支持包年包月队列和按需专属的弹性资源池/队列。绑定跨源的DLI队列网段和数据源网段不能重合。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
SQL作业使用咨询 - 数据湖探索 DLI

SQL作业使用咨询 DLI是否支持创建临时表？问题描述：临时表主要用于存储临时中间结果，当事务结束或者会话结束的时候，临时表的数据可以自动删除。例如MySQL中可以通过：“create temporary table ...” 语法来创建临时表，通过该表存储临时数据，结束事务或

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接操作场景使用DLI访问其他数据源的数据前，首先要通过建立增强型跨源连接打通DLI和数据源之间的网络，DLI才能够访问、导入、查询、分析其他数据源的数据。例如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和对应数据源VPC之间的网络，才能实现数据互通。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）

总条数： 223

上一页
1
2
3
4
5
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Compaction规范 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

队列相关API（推荐） - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线