搜索_华为云

Hudi数据表Compaction规范 - 数据湖探索 DLI

arquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计规范以及实

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
添加分区（只支持OBS表） - 数据湖探索 DLI

主要有以下两种场景：给OBS分区表插入对应的分区数据，数据插入成功后OBS表才会生成分区元数据信息，后续则可以根据对应分区列进行查询等操作。手工拷贝分区目录和数据到OBS分区表路径下，执行本章节介绍的分区添加命令生成分区元数据信息，后续即可根据对应分区列进行查询等操作。本章节重点介绍使用ALTER

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

INSERT/UPDATE/DELETE 消息到 Flink SQL 系统中。在许多情况下，这对于利用此功能很有用。例如：将数据库中的增量数据同步到其他系统审计日志数据库的实时物化视图临时连接更改数据库表的历史等等。 Flink 还支持将 Flink SQL 中的 INSERT/UPDATE/DELETE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述数据类型是数据的一个基本属性，用于区分不同类型的数据。不同的数据类型所占的存储空间不同，能够进行的操作也不相同。数据库中的数据存储在表中。表中的每一列都定义了数据类型，用户存储数据时，须遵从这些数据类型的属性，否则可能会出错。 DLI当前只支持原生数据类型。父主题：数据类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
预览SQL作业查询结果 - 数据湖探索 DLI

目前仅支持查看“QUERY”类型作业的执行结果。 row_count 否 Integer 作业结果总条数。 input_size 否 long 作业执行过程中扫描的数据量。 schema 否 Array of Map 作业结果列名称和类型。 rows 否 Array of Objects 作业结果集。请求示例

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
资产识别与管理 - 数据湖探索 DLI

签将很容易帮助您对不同的应用进行使用量分析和成本核算。对DLI来说，标签用于标识购买的队列和创建数据库，对购买的DLI队列和数据库进行分类。为队列或数据库添加标签时，该队列或数据库上所有请求产生的计费话单里都会带上这些标签，您可以针对话单报表做分类筛选，进行更详细的成本分析。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时Flink读取的时间和RDS数据库的时间会相差13小时。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
数据类型 - 数据湖探索 DLI
数据类型 - 数据湖探索 DLI

数据类型概述原生数据类型复杂数据类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据操作场景 DLI Flink作业支持使用其他服务作为数据源和数据输出通道进行数据实时计算操作。本例采用Kafka服务作为数据源通道，以RDS作为数据输出通道，介绍创建并提交Flink OpenSource SQL作业进行实时计算的操作步骤。

帮助中心 > 数据湖探索 DLI > 快速入门
Spark SQL常用配置项说明 - 数据湖探索 DLI

该参数设置为true：当子查询中数据不重复的情况下，执行关联子查询，不需要对子查询的结果去重。当子查询中数据重复的情况下，执行关联子查询，会提示异常，必须对子查询的结果做去重处理，比如max(),min()。该参数设置为false：不管子查询中数据重复与否，执行关联子查询时，都需要对子查询的结果去重，比如max()

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
数据类型 - 数据湖探索 DLI
数据类型 - 数据湖探索 DLI

数据类型数据类型介绍布尔类型整数类型固定精度型浮点型字符类型时间和日期类型复杂类型父主题： HetuEngine SQL语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
分配权限 - 数据湖探索 DLI
分配权限 - 数据湖探索 DLI

LECT 示例给用户user_name1授予数据库db1的删除数据库权限。 1 GRANT DROP_DATABASE ON databases.db1 TO USER user_name1; 给用户user_name1授予数据库db1的表tb1的SELECT权限。 1 GRANT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

DLI Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

消费 // 取值有： LATEST,从最新的数据开始消费，此策略会忽略通道中已有数据 // EARLIEST,从最初的数据开始消费，此策略会获取通道中所有的有效数据 String offsetPolicy;

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
数据类型介绍 - 数据湖探索 DLI

数据类型介绍目前使用Hetu引擎建表时支持的数据类型有：tinyint，smallint，bigint，int，boolean，real，decimal，double，varchar，string，binary，varbinary，timestamp，date，char，arr

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
迁移数据场景概述 - 数据湖探索 DLI

迁移数据场景概述为了将分散在不同系统中的数据迁移到DLI，确保数据可以在DLI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
开启或关闭数据多版本 - 数据湖探索 DLI

开启或关闭数据多版本功能描述 DLI提供多版本功能，用于数据的备份与恢复。开启多版本功能后，在进行删除或修改表数据时（insert overwrite或者truncate操作），系统会自动备份历史数据并保留一定时间，后续您可以对保留周期内的数据进行快速恢复，避免因误操作丢失数据。其他

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

IMPORT：导入数据到DLI的作业。 EXPORT：从DLI导出数据的作业。 DCL：包括传统DCL，以及队列权限相关的操作。 DDL：与传统DDL操作一致，即创建和删除数据库，创建和删除表的作业。 QUERY：执行SQL查询数据的作业。 INSERT：执行SQL插入数据的作业。 UPDATE：更新数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 1507

上一页
1
...
5
6
7
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表Compaction规范 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

预览SQL作业查询结果 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

数据类型 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

数据类型 - 数据湖探索 DLI

分配权限 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

数据类型介绍 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线