搜索_华为云

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
修改表 - 数据湖探索 DLI
修改表 - 数据湖探索 DLI

修改表添加列修改列注释开启或关闭数据多版本父主题：表相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
创建Bucket索引表调优 - 数据湖探索 DLI

创建Bucket索引表调优创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
修改普通队列的网段 - 数据湖探索 DLI

修改普通队列的网段使用增强型跨源时，如果DLI队列的网段和用户数据源的网段发生冲突，您可以通过修改网段操作更改包年包月队列的网段。如果待修改网段的队列中有正在提交或正在运行的作业，或者该队列已经绑定了增强型跨源，将不支持修改网段操作。本节操作仅适用于普通队列，不适用于弹性资源池队列。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

GEOMETRYCOLLECTION STRING MySQL中的空间数据类型将转换为具有固定Json格式的字符串。示例该示例是利用MySQL-CDC实时读取RDS MySQL中的数据及其元数据，并写入到Print结果表中。本示例使用RDS MySQL数据库引擎版本为MySQL 5.7.33。参考增

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

nt_agency的委托信息。步骤1：创建RDS MySQL实例本样例中，假设作业名称为“JobSample”，采用RDS服务作为数据源，创建RDS MySQL实例。具体操作请参见购买RDS for MySQL实例。登录RDS管理控制台。在管理控制台左上角选择区域和项目。

帮助中心 > 数据湖探索 DLI > 快速入门
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。当指定Hudi的索引类型为Global索引类型时，Hud

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

使用跨源认证则无需在作业中配置置账号和密码。示例该示例是利用MySQL-CDC实时读取RDS MySQL中的数据，并写入到Print结果表中，其具体步骤如下（本示例使用RDS MySQL数据库引擎版本为MySQL 5.7.32）。参考增强型跨源连接，根据MySQL所在的虚拟私有云和子网创建相应的增强型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
SparkSQL建表参数规范 - 数据湖探索 DLI

ive Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。建表示例 create table data_partition(id int, comb

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

BY）、多表的关联（JOIN）等。本示例通过创建MySQL CDC源表来监控MySQL的数据变化，并将变化的数据信息插入到DWS数据库中。前提条件已创建RDS MySQL实例。本示例创建的RDS MySQL数据库版本选择为：8.0。具体步骤可参考购买RDS for MySQL实例。已创建DWS实例。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

分区数：1。副本数：1。其他参数保持默认即可。步骤2：准备数据输出通道采用RDS作为数据输出通道，创建RDS MySQL实例。具体操作请参见购买RDS for MySQL实例。登录RDS管理控制台。在管理控制台左上角选择区域。单击“购买数据库实例”配置相关参数。主

 帮助中心 > 数据湖探索 DLI > 快速入门
创建DLI表关联RDS - 数据湖探索 DLI

datasource.com:3306 如果想要访问RDS的postgre集群，需要将连接地址中的协议头修改为"jdbc:postgresql"，并在连接地址最后加上"/数据库名"。例如：jdbc:postgresql://to-rds-1174405119-oLRHAGE7.datasource

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
查看SQL执行计划 - 数据湖探索 DLI

SQL执行计划是数据库查询的逻辑流程图，它展示了数据库管理系统如何执行一个特定的SQL查询。执行计划详细列出了执行查询所需的各个步骤，例如表扫描、索引查找、连接操作（如内连接、外连接）、排序和聚合等。执行计划可以帮助分析查询的性能，识别可能的性能瓶颈，通过了解查询的执行逻辑，并根据这些信

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取、转换、加载，使用SQL或程序就可以对云上CloudTable、RDS、DWS、CSS、OBS、ECS自建数据库以及线下数据库的异构数据进行探索。产品介绍图说DLI 立即使用成长地图由浅入深，带您玩转DLI

帮助中心 > 数据湖探索 DLI > 成长地图
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
数组函数和运算符 - 数据湖探索 DLI

true element_at(array(E), index) 描述：返回给定索引处数组的元素。如果index> 0，则此函数提供与SQL标准下标运算符（[]）相同的功能，但在访问大于数组长度的索引时该函数返回NULL，且下标运算符在这种情况下将失败。如果index <0，则

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到 Kafka 中。 Debezium

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

元数据使用示例如下： CREATE TABLE KafkaTable ( origin_database STRING METADATA FROM 'value.database' VIRTUAL, origin_table STRING METADATA FROM 'value

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 636

上一页
1
2
3
4
5
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表索引设计规范 - 数据湖探索 DLI

修改表 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

修改普通队列的网段 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

查看SQL执行计划 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线