搜索_华为云

CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

CONVERT TO DELTA 命令功能 CONVERT TO DELTA 命令将现有的 Parquet 表就地转换为 Delta 表。此命令会列出目录中的所有文件，创建 Delta Lake 事务日志来跟踪这些文件，并通过读取所有 Parquet 文件的页脚来自动推断数据架构

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
查看Flink作业详情 - 数据湖探索 DLI

查看Flink作业详情创建作业后，您可以在DLI管理控制台查看Flink作业的基本信息、作业详情、任务列表、执行计划等信息。本节操作介绍怎样查看Flink作业相关信息。表1 查看Flink作业相关信息类型说明操作指导 Flink作业基本信息包括Flink作业的ID、作业类型

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
添加增强型跨源连接的路由信息 - 数据湖探索 DLI

添加增强型跨源连接的路由信息操作场景路由即路由规则，在路由中通过配置目的地址、下一跳类型、下一跳地址等信息，来决定网络流量的走向。路由分为系统路由和自定义路由。增强型跨源连接创建后，子网会自动关联系统默认路由。除了系统默认路由，您可以根据需要添加自定义路由规则，将指向目的地址的流量转发到指定的下一跳地址

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
获取项目ID - 数据湖探索 DLI
获取项目ID - 数据湖探索 DLI

获取项目ID 操作场景在调用接口的时候，部分URL中需要填入项目ID，所以需要获取到项目ID。有如下两种获取方式：调用API获取项目ID 从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目信息API获取。获取项目ID的接口为“GET https

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
SDK的获取与安装 - 数据湖探索 DLI

SDK的获取与安装 Java SDK安装方式您可以通过以下两种方式安装Java SDK。导入Maven依赖，适用于使用Maven管理的Java项目。具体操作请参考方法一：通过Maven安装DLI SDK依赖。在集成开发环境中导入JAR文件，适用于使用Eclipse作为集成开发环境的项目

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

使用Spark作业访问DLI元数据操作场景 DLI支持用户编写代码创建Spark作业来创建数据库、创建DLI表或OBS表和插入表数据等操作。本示例完整的演示通过编写java代码、使用Spark作业创建数据库、创建表和插入表数据的详细操作，帮助您在DLI上进行作业开发。该功能公测阶段

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

ClickHouse 功能描述 DLI支持将Flink作业数据输出到ClickHouse数据库中，表类型仅支持结果表。 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
SHALLOW CLONE - 数据湖探索 DLI
SHALLOW CLONE - 数据湖探索 DLI

SHALLOW CLONE 命令功能 SHALLOW CLONE 命令在特定版本创建现有Delta表的浅拷贝。被克隆的信息包括：schema、分区信息、数据文件路径等。对克隆表所做的任何更改都只会影响克隆本身，而不会影响源表，只要它们不触及源数据。注意克隆表可能仍会指向源表的数据文件

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI常用跨源分析开发方式跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
管理Flink作业模板 - 数据湖探索 DLI

管理Flink作业模板 Flink模板包括样例模板和自定义模板。用户可以在已有的样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。也可以根据自己的习惯和方法自定义作业模板，方便后续可以直接调用或修改。 Flink模板管理主要包括如下功能： Flink SQL样例模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建表时指定表的生命周期 - 数据湖探索 DLI

创建表时指定表的生命周期功能描述 DLI提供了表生命周期管理功能，在创建表时指定表的生命周期。DLI会根据每张表的最后修改时间和表的生命周期来判断是否要回收此表。通过设置表的生命周期，可以帮助您更好的管理数目众多的表，自动清理长期不再使用的数据表，简化数据表的回收流程。同时支持数据恢复设置

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
CREATE TABLE AS SELECT - 数据湖探索 DLI

CREATE TABLE AS SELECT 命令功能 CREATE TABLE As SELECT命令通过指定带有表属性的字段列表来创建Hudi Table。命令格式 CREATE[ OR REPLACE] TABLE [ IF NOT EXISTS] [database_name

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南概述 DLI提供了使用自定义Jar运行Flink作业并将数据写入到OBS的能力。本章节JAVA样例代码演示将kafka数据处理后写入到OBS，具体参数配置请根据实际环境修改。环境准备已安装和配置IntelliJ IDEA等开发工具以及安装

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI通过Kafka结果表将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

API概览本章节介绍了目前DLI所提供的API列表。表1 DLI API列表类型说明权限相关API 包括队列赋权、查看队列的使用者、数据赋权、查看数据库的使用者、查看表的使用者、查看表的用户权限和查看赋权对象使用者权限信息。全局变量相关API 包括创建全局变量、删除全局变量

 帮助中心 > 数据湖探索 DLI > API参考
查询所有全局变量 - 数据湖探索 DLI

查询所有全局变量功能介绍该API用于查询当前project下所有全局变量的信息。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/variables 参数说明表1 URI参数说明参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
查询SQL作业日志 - 数据湖探索 DLI

查询SQL作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并获取SQL作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
配置多版本过期数据回收站 - 数据湖探索 DLI

配置多版本过期数据回收站功能描述在DLI数据多版本功能开启后，过期的备份数据后续在执行insert overwrite或者truncate语句时会被系统直接清理。OBS并行文件系统可以通过配置回收站加速删除操作过期的备份数据。通过在表属性添加配置“dli.multi.version.trash.dir

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据

总条数： 737

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CLEANARCHIVE - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

添加增强型跨源连接的路由信息 - 数据湖探索 DLI

获取项目ID - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

SHALLOW CLONE - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

创建表时指定表的生命周期 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

查询所有全局变量 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线